被印度追缴 5.2 亿美元税款,三星申诉称税务部门决定仓促且不公铁路五一假期运输旅客发送量突破 1.12 亿人次,同比增长 10.5%单向全程 5 公里,贵州首条无人驾驶公交线开通国家电网智慧车联网平台“五一”假期前四天充电量破亿,高速充电量增长 28%首次突破 2.7 万辆次,港珠澳大桥单日车流量创新高消息称三星 One UI 8 有望三个月内上线,下个月推出测试版国产大型水陆两栖飞机 AG600 开展功能和可靠性合格审定试飞志愿传递真情,劳动铸就未来——廊坊一中五一劳动节志愿服务活动软通动力“突破无界”新品发布会:三大产品矩阵开启全栈智能新篇章谁说电池不耐用!现代电车跑58万公里后电池健康达87.7%Meta 公布 2025 财年第 1 财季财报:营收 423.14 亿美元亚马逊 2025Q1 营收 1556.67 亿美元兆易创新 2024 年营收增长 27.69%,2025 年 Q1 营收同比提升 17.32%爱彼迎:一季度总收入约23亿美元,将拓展住宿以外的新领域铁路迎来返程客流高峰,5 月 4 日预计发送旅客 2040 万人次Statista:微软必应市场份额升至 12.2%,谷歌降至 79.10%新型智能动车组上线郑开城际铁路,车窗支持智能显示功能受关税冲击,跨境电商平台 Temu 停止从中国向美国发货五一假期入手Apple产品建议首选京东 iPhone 16双补优惠1200元起安吉尔亚洲一号店正式揭幕:沉浸式场景体验,打造净水消费新范式
  • 首页 > 云计算频道 > 大模型

    阶跃星辰发布全新多模态推理模型——Step-R1-V-Mini

    2025年04月09日 10:52:12   来源:Citnews中文科技资讯

      阶跃星辰科技团队宣布正式推出全新的多模态推理模型 Step-R1-V-Mini。这一模型的发布标志着在多模态协同推理领域的新突破,为AI技术的进一步发展注入了新的活力。Step-R1-V-Mini支持图文输入和文字输出,具备良好的指令遵循能力和通用性,能够高精度感知图像并完成复杂的推理任务。

      Step-R1-V-Mini的训练方法在技术上进行了创新,采用了多模态联合强化学习,基于PPO(Proximal Policy Optimization)强化学习策略,在图像空间引入了verifiable reward机制。这一机制有效解决了图片空间推理链路复杂、容易产生混淆的相关和因果推理错误的问题。与DPO(Direct Preference Optimization)等方法相比,Step-R1-V-Mini在处理图像空间的复杂链路时更具泛化性和鲁棒性。

      在视觉推理领域的表现上,Step-R1-V-Mini取得了显著的成绩。在多个公开榜单中,Step-R1-V-Mini均表现亮眼,特别是在MathVision视觉推理榜单上位列国内第一。这表明该模型在视觉推理、数学逻辑和代码等方面具有优异的表现。

      Step-R1-V-Mini的实际应用案例也展示了其强大的功能。例如,在“看图识地点”案例中,输入网友拍摄的温布利球场图片,Step-R1-V-Mini能够迅速识别图中元素,结合不同元素如颜色、物体(体育场、曼城队徽)等进行综合判断,准确推断出地点为温布利体育场,并给出了可能的对战双方。在“看图识菜谱”案例中,输入一张美食图,Step-R1-V-Mini能够精准识别菜品和蘸料,并详细列出具体用量,如“鲜虾300g、大葱白2根”等。在“物体数量计算”案例中,输入一张含有不同形状、颜色和位置的物体摆放图,Step-R1-V-Mini能够逐一识别,根据物体的颜色、形状和位置进行推理计算,最终得出剩下的物体数量。

      Step-R1-V-Mini的发布为多模态推理领域带来了新的希望。该模型已正式上线阶跃AI网页端,并在阶跃星辰开放平台提供API接口,供开发者和研究人员体验和使用。阶跃星辰表示,Step-R1-V-Mini是他们在多模态推理方向的阶段性成果,未来将继续在推理模型方向进行探索,以推动AI技术的进一步发展。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。