三星在英国推广Galaxy手机防盗功能佳明推出无屏睡眠监测设备Index Sleep Monitor,续航达7天特斯拉提交“Tesla Robotaxi”商标申请,加速布局自动驾驶网约车服务OpenAI 用 Rust 重写 Codex CLI,提升性能与安全性微软安卓版Outlook深度整合Copilot AI助手,新增个性化主题功能Nothing Phone(3)配置曝光:黑白双色可选,最高16GB+512GB存储中金称多模态推理将提升智能驾驶能力Windows 11 25H2或于今年秋季发布,分阶段推送全新功能三星挖角台积电前高管,强化北美晶圆代工业务余承东点赞认可!华为毕昇打印机X1成京东618开门红双面打印品类销冠端午假期最后一天迎返程高峰,全国铁路预计发送旅客 1790 万人次爱奇艺大幅下调虚拟制作系统使用价格,最低 3.5 万元 / 天特斯拉五月“逆袭”,股价一个月暴涨超 22%波音CEO凯利・奥特伯格:财务上暂无力投资开发新飞机卢伟冰:小米未来的困难 / 挑战有两点,竞争从来不是,未来也不会是关键“数字藏经洞”数据库平台发布,敦煌文物在数字世界“重聚”亚马逊《黑袍纠察队》衍生剧《V 世代》第二季首曝预告发布,9 月 17 日开播小米潘九堂:真正优秀企业都不怕甚至欢迎小米,淘汰的都是劣质企业京东外卖:日订单量已突破 2500 万单,近期将扩招至 15 万名全职骑手明悟知堂:探索国学宝藏,《北大国学课》有声书的知识盛宴
  • 首页 > 云计算频道 > 大模型

    阿里通义千问发布Qwen2.5-Turbo开源AI模型:支持100万tokens上下文,处理时间缩短至68秒

    2024年11月19日 16:23:32   来源:IT之家

      阿里通义千问昨日(11 月 18 日)发布博文,宣布在经过数月的优化和打磨后,针对社区中对更长上下文长度(Context Length)的要求,推出了 Qwen2.5-Turbo 开源 AI 模型。

      Qwen2.5-Turbo 将上下文长度从 12.8 万个扩展至 100 万个 tokens,这一改进相当于约 100 万英语单词或 150 万汉字,可以容纳 10 部完整小说、150 小时的演讲稿或 30000 行代码。

      上下文长度(Context Length)是指在自然语言处理(NLP)中的大型语言模型(LLM)在一次处理过程中能够考虑和生成的文本的最大长度。

      该模型在 1M-token 的 Passkey 检索任务中实现了 100% 准确率,RULER 长文本评估得分为 93.1,超越了 GPT-4 和 GLM4-9B-1M。

    1.jpg

      团队通过整合稀疏注意力机制(sparse attention mechanisms),将处理 100 万 tokens 到输出第一个 tokens 的时间,从 4.9 分钟缩短至 68 秒,速度提升达 4.3 倍,这一进步显著提高了模型的响应效率,使其在处理长文本时更加迅速。

    2.jpg

      Qwen2.5-Turbo 的处理成本保持在每百万个 tokens 0.3 元,能够处理 3.6 倍于 GPT-4o-mini 的 token 数量。这让 Qwen2.5-Turbo 在经济性上具备了更强的竞争力,成为高效、经济的长上下文处理解决方案。

      尽管 Qwen2.5-Turbo 在多个基准测试中表现优异,团队仍然意识到在真实场景中的长序列任务表现可能不够稳定,且大型模型的推理成本需要进一步优化。

    3.jpg

      团队承诺将继续优化人类偏好、提高推理效率,并探索更强大的长上下文模型。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。