• 首页 > 云计算频道 > 大模型

    智谱深度推理模型 GLM-Zero 预览版上线 擅长数理、代码等问题

    2024年12月31日 14:54:49   来源:AIbase基地

      在北京智谱华章科技有限公司的年度收官之际,公司发布了其首个基于扩展强化学习技术训练的推理模型——GLM-Zero的初代版本GLM-Zero-Preview。这款模型专注于提升人工智能的推理能力,尤其在数理逻辑、代码编写以及需要深度推理的复杂问题处理方面表现出色。与基座模型相比,GLM-Zero-Preview在保持通用任务能力的同时,专家任务能力得到了显著提升,其在AIME2024、MATH500和LiveCodeBench评测中的表现与OpenAI o1-preview相当。

      用户现在可以在智谱清言平台的“Zero推理模型”智能体中免费体验GLM-Zero-Preview,该平台支持文字和图片上传,模型将输出完整的推理过程。同时,开发者也可以通过智谱开放平台的API调用此模型。

      尽管GLM-Zero-Preview与OpenAI的o3模型还存在一定差距,但智谱华章科技有限公司计划持续优化迭代强化学习技术,并即将推出正式版GLM-Zero,将深度思考的能力从数理逻辑扩展到更多通用技术领域。

      在模型表现方面,GLM-Zero-Preview展现了强化学习在增强模型深度推理能力方面的重要性。随着训练量的增加,模型在深度推理等方面的效果稳步提升。模型在推理阶段的scaling law也得到了验证,即随着模型可以思考的token数变多以及更多的计算量,模型给出的结果质量也稳步提升。GLM-Zero-Preview能够实现推理过程中自主决策、问题拆解和尝试多种方式解决问题,这与人类的思考决策过程类似。

      在实测案例中,GLM-Zero-Preview在逻辑推理方面表现出识别逻辑漏洞和模拟多种假设的能力。在数学方面,该模型具有强大的归纳与演绎能力,能够快速处理复杂的数学运算,并在2025年考研数学一的测试中达到优秀研究生水平。在编程方面,GLM-Zero-Preview能够熟练使用多种编程语言,并帮助开发者快速编写代码。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。