• 首页 > 云计算频道 > 大模型

    腾讯云AI代码助手正式搭载DeepSeek-V3-0324顶级模型

    2025年03月28日 10:45:04   来源:Citnews中文科技资讯

      腾讯云AI代码助手最新宣布,正式搭载DeepSeek-V3-0324顶级模型。

      无需配置,下载/更新AI代码助手插件即可用,官方号称开发效率能直接提升100倍。

      DeepSeek-V3-0324是DeepSeek-V3系列的小版本迭代,模型参数从初代V3的6710亿小幅增至6850亿,依然采用混合专家(MoE)架构,每个token激活约370亿参数,在推理、编程、数学、中文处理等多个领域达到行业领先水平。

      甚至最近讨论火热的7米甘蔗过2米门”AI测试题也能自主发现隐藏解法,给出合理答案。

      腾讯总结了DeepSeek-V3-0324的五大强项:

      创新的训练策略

      -采用无辅助损失的负载均衡,避免传统方法的性能损失

      -多token预测训练提升推理速度,FP8混合精度训练显著降低计算成本

      -在超大规模模型上验证FP8训练的有效性,提高训练效率

      优化的MoE架构

      -动态调整偏差项,防止路由崩溃,性能提升15%以上

      -节点受限路由机制减少跨节点通信流量至1/3,结合FP8调度与RDMA优化,训练效率提升40%

      -支持128K超长上下文,可处理50页PDF或完整代码库,多轮对话记忆更强

      综合能力大幅提升

      -关键指标突破性进步,在各项权威基准测试中相较于初代V3,在关键指标上展现了突破性进步。

      MMLU-Pro:75.981.2( 5.3)-多领域知识理解能力

      GPQA:59.168.4( 9.3)-专业问答能力

      AIME:39.659.4( 19.8)-数学竞赛解题能力,进步最为显著

      LiveCodeBench:39.249.2( 10.0)-代码生成与调试能力

      -数学推理能力突出,AIME竞赛正确率提升近20%,超越Grok3

      -中文处理优势,中长篇写作逻辑更严密,联网搜索报告更精准

      顶尖的编程生成能力,代码生成质量达到行业顶尖水平

      -单一提示词中,可精准生成800行无错误网页代码(含动态交互,视觉美观)

      -代码可运行率92%,支持20 编程语言,前端开发效率提升80%

      -在kcores-llm-arena评测超越Claude 3 Sonnet普通版

      高效的推理与开发者体验

      -推理任务显著提升,借鉴DeepSeek R1模型训练技术,上线每秒20 token生成速度(M3 Ultra设备),响应比前代快40%

      -智能补全、代码纠错、API兼容性检测等功能大幅提升开发效率

      -支持复杂逻辑问题(如7米甘蔗过2米门),自主发现隐藏解法

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。