来京东入手小米、一加等大牌手机 无人机、黄金吊坠等超值权益任你选任天堂Switch 2底座仅支持新款主机,带来4K游戏体验元脑InManage平台升级 实现数据中心能耗双系统精准调控格力电器2024年营收下滑7.26% 净利润逆势增长10.91%男子网购机票遭代销平台“隐形加价”,起诉后获 3 倍赔偿别克E5新款即将上市,续航可达620公里ColorOS系统升级:一加12、Ace 5及平板Pro功能大提升微星RTX 5070 12GB“龙爵”显卡上线 延续经典三风扇设计南非MTN遭遇网络安全事件电商取消“仅退款”,快手能否突出重围?Canalys:Q1中国智能手机市场同比增长5%2025Q1家电市场总结:国补稳增长下的量价博弈智谱与生数科技达成战略合作 专注大模型联合创新LemonAI 推出实时音视频 AI 数字人模型 Slice Live孕产妇专用营养品牌美好蕴育推出乳母营养包 科学补充产后综合营养Ema推新型语言模型EmaFusion:成本和准确性方面击败了 O3、GeminiCanalys:Q1中国智能手机市场同比增长5%,小米时隔十年重夺第一迎战AMD RX 9060 XT!曝RTX 5060在5月19日上市:2499元起你买吗B站喜马纷纷入局,年轻人需要“能看”的视频播客吗?微软发布全新Agent操作系统UFO² 深度整合Windows与智能自动化 来京东入手小米、一加等大牌手机 无人机、黄金吊坠等超值权益任你选任天堂Switch 2底座仅支持新款主机,带来4K游戏体验元脑InManage平台升级 实现数据中心能耗双系统精准调控格力电器2024年营收下滑7.26% 净利润逆势增长10.91%男子网购机票遭代销平台“隐形加价”,起诉后获 3 倍赔偿别克E5新款即将上市,续航可达620公里ColorOS系统升级:一加12、Ace 5及平板Pro功能大提升微星RTX 5070 12GB“龙爵”显卡上线 延续经典三风扇设计南非MTN遭遇网络安全事件电商取消“仅退款”,快手能否突出重围?Canalys:Q1中国智能手机市场同比增长5%2025Q1家电市场总结:国补稳增长下的量价博弈智谱与生数科技达成战略合作 专注大模型联合创新LemonAI 推出实时音视频 AI 数字人模型 Slice Live孕产妇专用营养品牌美好蕴育推出乳母营养包 科学补充产后综合营养Ema推新型语言模型EmaFusion:成本和准确性方面击败了 O3、GeminiCanalys:Q1中国智能手机市场同比增长5%,小米时隔十年重夺第一迎战AMD RX 9060 XT!曝RTX 5060在5月19日上市:2499元起你买吗B站喜马纷纷入局,年轻人需要“能看”的视频播客吗?微软发布全新Agent操作系统UFO² 深度整合Windows与智能自动化
  • 首页 > 云计算频道 > 大模型

    Reka AI 发布全新开源模型 Reka Flash 3:21 亿参数的通用推理模型

    2025年03月12日 11:05:33   来源:AIbase基地

      在当前快速发展的人工智能领域,开发者和组织面临着多种实际挑战,例如高计算需求、延迟问题以及缺乏真正灵活的开源模型等。这些问题常常限制了进展,许多现有的解决方案需要昂贵的云基础设施,或者过大,无法在设备上应用,因此迫切需要高效且灵活的模型来填补这一空白。

      为此,Reka AI 推出了 Reka Flash3,这是一款从零开始构建的推理模型,拥有21亿个参数。该模型旨在支持一般对话、编码辅助、指令跟随,甚至函数调用,成为各种应用的实用基础。其训练过程结合了公开获取的数据集和合成数据集,并通过精心的指令调优及 REINFORCE Leave One-Out(RLOO)方法进行强化学习。这种周密的训练方法旨在在能力与效率之间取得平衡,使 Reka Flash3在众多同类模型中脱颖而出。

      在技术层面上,Reka Flash3具备多项特性,使其既灵活又资源高效。一个显著特点是其可以处理最多32k 个令牌的上下文长度,方便处理较长的文档和复杂任务,而不会造成过大压力。此外,该模型还引入了 “预算强制” 机制,通过特定的 < reasoning > 标签,使用户能够限制模型的思维过程步骤,从而保证在不增加计算开销的情况下保持一致的表现。同时,Reka Flash3非常适合在设备上部署,完全精度大小为39GB(fp16),通过4位量化可以进一步压缩至11GB。这种灵活性使得在本地部署时更为流畅,相比更大且资源密集的模型更具优势。

      评估指标和性能数据进一步印证了该模型的实用性。例如,虽然 Reka Flash3在 MMLU-Pro 的得分为65.0,表现中等,但结合网络搜索等额外知识源,其竞争力依然不容小觑。此外,Reka Flash3的多语言能力在 WMT’23的 COMET 得分达到83.2,显示出其对非英语输入的合理支持,尽管其主要集中于英语。这些结果,加上其相对于 QwQ-32B 等同行的高效参数数量,突显了其在实际应用中的潜力。

      综上所述,Reka Flash3代表了一种更为可接近的人工智能解决方案。通过在性能和效率之间的巧妙平衡,该模型为一般聊天、编码和指令任务提供了一种稳健且灵活的选择。其紧凑的设计、增强的32k 令牌上下文窗口及创新的预算强制机制,使其成为适合设备部署和低延迟应用的实用选项。对于寻求既有能力又可管理模型的研究人员和开发者而言,Reka Flash3无疑提供了一个令人期待的基础。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。