• 首页 > 云计算频道 > 大模型

    OpenAI canvas一夜封神,超强AI编码研究神器,ChatGPT再次颠覆人机交互

    2024年10月08日 10:40:27   来源:新智元公众号

      ChatGPT横空出世以来,首次迎来界面史诗级升级!全新canvas界面,开启了人类与AI协作研究、编码的新时代,更代表着终极AGI人机交互形态。

      时隔两年,ChatGPT终迎来界面全新升级!

      这一次,OpenAI官宣推出canvas。它不再是简单的对话框,而是能与ChatGPT「并肩作战」的全新界面。

      不论是写作,还是编码,都可以开启全新的合作方式。

      canvas基于GPT-4o构建,目前仍在测试阶段,可在所有模型中手动选择。

      而且所有Plus用户不用等待,直接可用。未来,OpenAI还计划向所有免费用户全面推出。

      canvas不仅可以让你与ChatGPT一起做研究,还能写代码、邮件等等,最重要的是还能帮你一起脑洞。

      有趣的是,canvas还可以添加emoji。奥特曼在线发起投票,看看有多少人喜欢这个功能。

      另外,canvas面板中,还多了一个快捷菜单,让协作更加轻易便捷了。

      审查代码、修改bug、添加评论、log等等,一键完成。

      在Canvas界面助力下,GPT-4o编码性能飞跃18%!

      这是要纷纷取代了GitHub C o p ilot、Cursor编码神器了。网友们惊叹道,OpenAI绝杀了Cursor。

      还有人说,canvas的推出,是OpenAI对最大劲敌Anthorpic的Claude artifacts最大的回击。

      在经历如此巨大人事变动同时,OpenAI近日多次发布更新,是向外界、投资者给出了我们依旧有实力的反馈。

      话不多说,看看历经两年,ChatGPT究竟带了怎样划时代的巨变。

      肝代码研究,原来这么轻松

      canvas项目负责人Karina Nguyen表示,我对终极AGI界面的愿景,是一张空白的画布。

      随着时间的推移,它会根据人类偏好,自我改进。

      而且,它会创造与人类互动的新方式,重新定义人类与AI,以及整个互联网的联系。

      canvas便是,这样一种终极AGI界面的完美「代言人」。

      那么,它究竟如何帮人类研究、写代码、创作呢?

      接下来,让我们一睹为快。

      做研究

      当你需要完成一项艺术史研究报告,在canvas便可以完成研究。

      首先,将你的需求告诉ChatGPT,它便开始搜索一切所有相关的报道——Rembrandt的自画像技巧。

      随之,canvas在屏幕右侧开启了全新界面,一篇研究报告,正在速成。

      当你对其中生成的一句话,不太确定是否正确。只需要选中,然后即刻就能唤醒ChatGPT,随地取问。

      又或者,当你想要更改文中的小标题,不如让ChatGPT给点建议。

      最惊艳的是,右下角「铅笔」样子的图表,可以开启文献的阅读模式,可以一句一句地浏览。

      最后,你可以让ChatGPT为你添加参考文献、书目引用。

      写邮件

      你还可以让ChatGPT搜索一家最好的餐厅,它会帮你汇总所有在SF城市米其林餐厅。

      然后让它在为你写一封邮件,发给最好的朋友。

      写代码

      另外,你还可以在canvas界面中,完成代码的生成,还是可以编辑的那种。

      以往ChatGPT只是给出结果,并不能一同编辑。

      让ChatGPT用Rust写一API网络服务器,它便同以往一般,为你生成了代码。

      然后,要求对其中一段代码,添加登录注册路由。

      并且,你还可以自己改写其中的内容。

      在界面右下角,还有一个工具栏,可以进行代码审查、转换语言、修改bug、添加log、还有添加评论功能。

      比如,针对刚刚生成代码进行审查,以及修复bug,ChatGPT瞬间就完成了。

      发明新食谱

      更惊艳的是,在canvas模式下,还可以创造发明新的idea。

      比如,你想做一个不一样的苹果派,可以让ChatGPT搜索总结出,最通用的苹果派的食谱。

      假设你没有其中一种材料——Nutmeg(肉豆蔻),然后你们可以一同创作全新的做法。

      与ChatGPT并肩作战

      目前,ChatGPT已常被用于协助写作和编码方面的任务。

      尽管聊天界面易于使用并且适用于许多任务,但对于需要编辑和修订的项目,仍然有些不便。

      canvas的推出,正是要为这类工作提供新的界面,而且能让ChatGPT更好地理解用户提供的任务上下文。

      当ChatGPT检测到可能有帮助的场景时,canvas会自动打开,也可以直接在提示词中包含「使用canvas」的字样来处理现有项目。

      对于写作任务,快捷编辑栏中包含5种选项,从下至上依次为:

      - 建议编辑:ChatGPT为指定内容提供内联建议和反馈

      - 调整长度:将文字内容编辑得更短或更长

      - 更改阅读级别:调整文字的阅读难度,从幼儿园到研究生院

      - 最后润色:检查语法、清晰度和一致性

      - 添加表情符号:为强调或有颜色标记的内容添加相关emoji符号

      比如,可以高亮特定部分来引起ChatGPT的关注,并让模型在考虑整个项目的同时,提供内联反馈和建议。

      奥特曼还发起了在线投票,「添加emoji是不是OpenAI有史以来发布的最好功能?」

      对于编码任务,快捷键又和写作不同:

      快捷键从下至上依次为:

      - 检查代码:ChatGPT提供内联建议以改进代码

      - 添加日志(logs):插入print语句以帮助调试和理解代码

      - 添加注释:为代码添加注释

      - 修复bug:检测并重写有问题的代码以解决bug

      - 移植到一种语言:将您的代码转换为JavaScript、TypeScript、Python、Java、C++或PHP

      「点到哪里改哪里」,修改代码也将和修改文字一样直观简单。

      为什么要更新用户界面?

      OpenAI在博客中表示,如果要让人工智能变得更有用、更易用,就需要重新思考我们如何与它互动。而canvas,就是一种全新的方法,未来还将经历快速迭代。

      终极AGI界面canvas,GPT-4o也被优化了

      为了让模型更适应canvas模式,团队也对GPT-4o进行了必要的修法,添加了一些核心行为:

      - 触发canvas的打开,进行书写和编码

      - 生成多样化的内容类型

      - 进行有针对性的编辑

      - 重写文档

      - 提供内联形式的修改意见

      值得一提的是,对GPT-4o进行的这些训练采用了OpenAI的合成数据生成技术,包含了从o1模型中提取的输出。

      此外,团队还使用了20多项自动内部评估来衡量进展情况。

      首先,一个关键的挑战是定义何时触发canvas。模型既需要灵敏识别有检查、修改需求的任务,比如「写一篇关于咖啡豆历史的博客文章」,同时也要避免过度触发,比如「帮我做一份新的晚餐食谱」这种一般的任务就不太需要canvas。

      与带有提示指令的基线模型相比,调整后的GPT-4o的触发决策正确率分别达到了83%和94%

      第二个挑战涉及在canvas被触发后调整模型的编辑行为,特别是决定何时进行有针对性的编辑而不是重写整个内容。

      这就要训练模型,在用户明确选择文本时,更倾向于执行有针对性的编辑而非重写。随着模型不断完善,这种行为的能力也在不断发展。

      相比基线模型,带有canvas的GPT-4o在写作和编码任务上有18%的性能提升

      最后,训练模型以生成高质量的代码注释同样需要细致的迭代过程。

      这个评估任务与前两种情况不同。canvas是否触发以及是否进行了有针对性的编辑行为,很容易进行自动化评估,但以自动化方式衡量代码注释的质量,因此团队选择了人工评估。

      相比基线模型,集成canvas后的GPT-4o在注释准确性方面有30%的提升,质量提高了16%。

      这表明,与带有详细指令的零样本提示相比,合成数据的训练显著提高了模型的响应质量和行为。

      网友玩疯了

      canvas一经发布,已在全网掀起热议。

      Every初创公司创始人表示,很明显,OpenAI不仅仅是在构建聊天机器人,他们还试图为AI时代构建一种全新的操作系。

      一名开发者表示,canvas界面是游戏改变者。

      他刚刚通过canvas和ThreeJS一起创建了一个tesseract/Hypercube可视化工具,并称自己喜欢统一的UX聊天、在线评论和观看GPT-4o在代码上发挥其魔力,所有这些都在一个地方完成完成,永不过时。

      还有网友表示,canvas界面做的非常好,而且一切都是实时流畅的。

      不过,它让我们意识到一个重要的问题,我们还不确定与AI协作写作的最佳方式是什么。

      话虽如此,canvas让工作更加集成集成(cyborglike),而不是简单地轮流进行任务(centaurlike)。

      还有人纷纷悼念Cursor。

      核心贡献团队

      canvas背后核心团队也随之全部公布。

      研究主管是Karina Nguyen,还有3位核心研究人员Kai Chen, Michael Wu, Tarun Gogineni,12位核心工程/产品/设计师。

      值得一提的是,提供支持技术领导人当中,还有离职的CTO Mira Murati。

      在加入OpenAI之前,Karina Nguyen曾在Anthropic任职,专注研究模型对齐能力和诚实研究,以减少LLM的幻觉。

      值得一提的是,她曾领到了Claude Instant1.2训练,在API中制作了该模型。

      此前,作为一名设计工程师,Nguyen与Primer.ai、Dropbox、Square和《纽约时报》的团队在研发原型、新闻工具和产品功能方面进行了合作。

      Kai Chen

      Kai Chen在宾夕法尼亚大学获得了计算机科学本科学士学位。

      她于2023年初加入OpenAI,此前Kai Chen还联合创办了两家公司,一个是AI助手领域的Dispatch、还有一家自动化劳动任务项目的Port Tecjnologies。

      Michael Wu

      Michael Wu目前是OpenAI的应用研究员。

      此前,他曾以应用研究科学家身份,在Facebook工作了三年,任职期间训练了自然语言理解和深度学习模型。

      此外,他还在Primer AI担任机器学习工程师、Dropbox担任软件工程师,在Naver Corp担任机器学习实习生,在苹果公司担任机器学习实习生。

      2015年,Michael Wu在麻省理工学院获得了计算机科学和数学学士学位。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。