RA战队勇夺上海Major晋级资格 ROG外设助力电竞征途国家安全部:警惕深度伪造技术带来的安全风险一键生成 AI 广告短视频:Tiktok 上线 Symphony Creative Studio 平台参数量仅 0.25B,成都人形机器人创新中心全国首发 R-DDIRM 高速推理模型我国新一代地基红外天文望远镜发布首批观测图像东芝将与日本筑波大学合作,利用基因信息展开睡眠研究日企“山业”推出磁吸式网线:可减少端口损坏,传输速度 10GbpsAI投毒第一案!GPT写的代码竟有后门 程序员被骗1.8万元苹果 iPhone 16 获 DxOMark 147 分超三星 Galaxy S24 Ultra:HDR 照片明亮有活力、肤色自然准确赵明回应荣耀 GT 系列独立,或将肩负再造荣耀目标微软公布 Zero Day Quest 白帽安全竞赛:提交指定类型漏洞奖金至高可翻倍、前 45 名可受邀线下活动印度将鼓励企业本土生产手机等产品零部件:总额 40-50 亿美元我国牵头的首个工业化建造自动标识与数据采集应用国际标准发布京东 11 月 27 日起下线京享值 6000 以上“运费双免”服务,PLUS 会员“免费退换货”不受影响美团刘硕:美团无人机运营规模位列全球第一梯队谷歌“隐瞒文化”曝光:在掌握所有事实之前,不要发表评论英伟达股价大涨,黄仁勋慈善基金会今年至少要再捐 1.2 亿美元消息称莱迪思半导体正考虑收购英特尔 Altera滴滴“12 年老将”张博卸任 CTO,未来将专注自动驾驶业务毕尔巴鄂对阵皇家社会:两支近邻球队将于西甲联赛 “巴斯克德比”中为捍卫荣耀而战
  • 首页 > 云计算频道 > 大模型

    新华社研究院发布《人工智能大模型体验报告2.0》,AI国家队讯飞星火夺魁

    2023年08月14日 16:01:41   来源:中文科技资讯

      伴随着AIGC技术的兴起,国内科技企业纷纷入局,掀起了不亚于当年团购行业“百团大战”的“百模大战”。根据天眼查数据显示,2023年上半年与大模型直接相关的融资事件超20起,国内已发布的各类大模型数量超过100个,呈现出百花齐放的行业现象。

      8月12日,新华社研究院中国企业发展研究中心重磅发布了《人工智能大模型体验报告2.0》,其中参测的8款大模型均为科技巨头或背靠权威院所的“正牌军”,比如星火认知大模型出自素有“AI国家队”之称的科大讯飞,智谱AI-ChatGLM由清华大学计算机系技术成果转化而来的公司打造。最终讯飞星火以总分1013分勇夺大模型横评第一,与Benchmark(人类)仅有一分之差。

      相比6月新华社研究院发布的“报告1.0”,值得关注的是,此次“报告2.0”加入了Benchmark(人类)这个新维度。这是因为AI算法模型的开发受到人类编程思维的影响,充分利用了人类的智慧与知识。根据报告显示,在语言、跨模态和多轮对话等基础能力方面,人类与AI的差距并不显著,包括讯飞星火在内的五款大模型都能准确理解和高效处理信息,并在多个对话回合中保持连续性和逻辑性。

      在智商和情商方面,大模型同样表现优异。尤其是讯飞星火表现出了“双商在线”的能力,通过对大量人类常识与知识的学习,能够更好地理解人类语言和行为,并展现出缜密的思维推理和强大分析决策力。同时讯飞星火在医疗等专业知识领域有深厚沉淀,这也是对比其他大模型所具有的优势。

      大模型既有搜索引擎的知识检索能力,又有信息归纳、整合和提炼等能力,被视为更高效的新一代生产力工具。此前讯飞星火V.15推出的星火助手中心,就依托语言理解能力实现高效指令开发。用户可以直接调用周报小助理、述职小能手、PPT大纲助手等功能,大幅提高自己的工作效率。在本次报告的工作效率提升评估中,课题组重点在工具提效和生成创新方面进行考量,结果讯飞星火以350分的“压倒性”优势胜出,大幅领先第二名15分,领先最末名42分。

      讯飞星火在生产力效能方面的领先,不只停留在分数层面,而是早已深入到实际场景。在真实的职场中,很多人利用星火助手“四两拨千斤”,将一些商业文案、活动策划以及广告创意类的工作放心地交给了星火助手帮忙,减少了许多不必要的加班。此前“娱乐资本论”对讯飞星火等大模型的万字横评中,就模拟小红书带货文案、淘宝文案、知乎问答等“接地气”的工作情景,对讯飞星火在工作中的实用性给出了极高评价。

      本月初,以严谨客观著称的老牌科技网站IT之家也组织了一次《国产大模型十大维度横向评测》,结果讯飞星火以终端支持、语言理解能力、代码编写能力、多轮对话能力以及AI助手功能五大能力满分、综合能力第一的好成绩,大幅领先同类竞品。尤其是终端支持能力,讯飞作为“五端全覆盖”的大模型,深入触达了更广阔的用户人群。

      千里之行, 始于足下;百尺竿头,更进一步!据悉,8月15日,科大讯飞将召开星火认知大模型2.0升级发布会,在持续提升通用能力的基础上,重磅发布代码没能力、多模态能力以及多款相关软硬件产品。届时讯飞星火将进一步巩固自身领跑地位,在大模型这条赛道行稳致远。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    [No. X058-2]
    分享到微信

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。