小猿京东超级品牌日12月20日晚8开启 多款学练机价同11.11IDC:预计 2025 年中国智能手机市场出货量将达到 2.89 亿,同比增长 1.6%2024一带一路暨金砖国家技能发展与技术创新大赛之元宇宙3D数字内容设计创作赛项(中职组)全国总决赛在湖北崇阳职业技术学校圆满闭幕中国广电、亚信科技700MHz 5G专网案例获工信部“绽放杯”全国总决赛一等奖兰张高铁武威至张掖段开工建设:设计时速 250 公里,工期 3 年摄像头比京东贵40元 下单前多比价才最划算小鹏MONA汽车上市后累积交付4万台 哨兵模式 1 月春节前上线奥迪将关闭比利时布鲁塞尔工厂,因 Q8 e-tron 系列电动 SUV 表现不佳微软Surface Pro 12商用版二合一平板现身Geekbench跑分库,搭酷睿Ultra 7 266V处理器ROG CES 2025全球发布会定档北京时间1月7日华为Mate 70 系列的“智控键”功能 藏着华为AI的大野心宁德时代回应“为供应商提供资金援助”:情况属实,愿支持相关研发创新硅谷“福利文化”逐渐式微:谷歌等科技巨头缩减“标志性”奢华员工福利传音旗下人工智能项目荣获2024年“上海产学研合作优秀项目奖”一等奖不止超薄iPhone17 Air,消息称苹果正研发可折叠iPhone、MacBook消息称三星明年1月为Bixby接入大模型,加强Galaxy S25系列手机AI竞争力第二届人工智能生成内容国际会议暨大模型应用创新大会(AIGC 2024)Kimi发布视觉思考模型k1:试题拍照给出答题思考全过程放弃高通和三星,消息称谷歌 Pixel 10 系列手机首搭联发科T900调制解调器三大运营商均提供量子产品:中标湖北省电子政务项目
  • 首页 > 云计算频道 > 大模型

    Kimi发布视觉思考模型k1:试题拍照给出答题思考全过程

    2024年12月16日 17:11:59   来源:IT之家

      月之暗面 Kimi 今日发布视觉思考模型 k1。该模型基于强化学习技术打造,原生支持端到端图像理解和思维链技术,并将能力扩展到数学之外的更多基础科学领域。

      月之暗面官方表示,在数学、物理、化学等基础科学学科的基准能力测试中,初代 k1 模型的表现超过了 OpenAI o1、GPT-4o 以及 Claude 3.5 Sonnet。

      从月之暗面官方获悉,Kimi 新模型发布即上线。k1 视觉思考模型已陆续上线最新版「Kimi 智能助手」的 Android和 iPhone手机 App 以及网页版 kimi.com在最新版手机 App 或网页版 Kimi+ 页面找到「Kimi 视觉思考版」,即可拍照或传图体验。

      「Kimi 视觉思考版」会完整呈现推理思维链 CoT,让用户不只看到答题结果,也能完整看到模型思索答案的全过程

      从模型训练的角度看,k1 视觉思考模型的训练分为两个阶段,先通过预训练得到基础模型,再在基础模型上进行强化学习后训练k1 的基础模型重点优化了字符识别能力,在 OCRBench 上得到 903 分的(state-of-the-art)结果,在 MathVista-testmini、MMMU-val 和 DocVQA 基准测试集上分数分别为 69.1、66.7 和 96.9。

      月之暗面表示,k1 的强化学习后训练在数据质量和学习效率方面做了进一步优化,在强化学习的规模化(scaling)上取得了新的突破。

      此外,科学的模型能力基准测试方案是大模型行业面临的重要挑战之一。由于市面上缺乏针对基础科学学科的图形测试集,Kimi 模型研发团队自主构建了一个标准化的测试集 Science Vista,涵盖不同难度的数理化图片题目,且从分布上与实际用户需求较为匹配。该测试集将开放给全行业,用户可申请在许可范围内使用

      在内部测试中,月之暗面也发现了一些 k1 视觉思考模型存在的局限性,例如在分布外(out-of-distribution)的泛化、在更复杂问题上的成功率、在更多噪声场景的准确率、多轮问答效果等方面,有很大提升空间。在一些场景和泛化能力上,k1 模型与 OpenAI 的 o1 系列模型相比仍有差距

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。