10 月 23 日消息:英伟达研究人员在机器人灵活性方面取得了重大飞跃,这要归功于 Eureka,这是一种人工智能代理,据称可以像人类一样熟练地教机器人复杂的技能,比如转笔技巧。
根据上周四发布的一份论文,这项新技术建立在近期对大型语言模型(例如 OpenAI 的 GPT-4)的进展之上。Eureka 利用生成式 AI,自主编写复杂的奖励算法,使机器人能够通过反复试验和强化学习来学习。论文中指出,这种方法已经比人工编写的程序更有效,提高了 50% 以上。
英伟达的官方博客中表示:「Eureka 还教会了四足机器、灵巧机械手、协作机械臂和其他机器人打开抽屉、使用剪刀、接住球以及近 30 项不同的任务。」
Eureka 是英伟达在引导 AI 语言模型方面的最新示范。最近,该公司开源了 SteerLM——一种通过训练 AI 助手获取人类反馈,使其更有帮助性的方法。
与 Eureka 类似,SteerLM 也利用了语言模型的进展,但将其重点放在了不同的挑战上——改善 AI 助手的对齐。SteerLM 通过让助手进行会话练习来进行训练,就像机器人通过实践学习一样。该系统通过乐于助人、幽默和质量等属性对助理的反应提供反馈。
例如,这就像一个机器人从标记为好或坏的视频中学习跳舞,而不是让人类审核成千上万个随机跳舞并选择哪些是好的或不好的(这是典型的 AI 聊天机器人的训练方式)。通过不断练习并获得反馈,助手学会提供适合用户需求的回应。这有助于使 AI 在实际应用中更有益。
共同之处在于创造性地将先进的神经网络应用于新的领域,不论是教机器人还是聊天机器人。英伟达在硬件和软件两方面都在突破界限。
对于 Eureka 来说,关键在于将 Isaac Gym 等模拟技术与语言模型的模式识别能力相结合。Eureka 有效地「学会学习」,在多次训练中优化自己的奖励算法。它甚至接受人类输入以调整奖励。
到目前为止,这种自我改进的方法已被证明具有高度的通用性,可以训练各种类型的机器人——四足、轮式、飞行和灵巧机械手。
英伟达的 Eureka 和 SteerLM 不仅打破了障碍,还向机器人和人工智能传授技巧和富有洞察力的交互艺术。通过每一次挥笔和机智的聊天,他们正在勾勒出一个未来,人工智能不仅会模仿,而且会与我们一起创新。
文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。
奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。
“以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。
华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。