最新新闻：

第十四代英特尔@酷睿™ 处理器：性能飞跃，重塑计算新体验重新思考数据中心架构，推进AI的规模化落地 ROG×《燕云十六声》江湖争锋挑战赛热血启幕！创意执笔，赢取ROG枪神9 Plus联名神装 CADDX解锁第一视角的无限可能 THX推出空间音效进阶版沉浸式音频体验再升级 OWC推出ThunderBlade X12雷电5存储设备专为8K影视创作优化 Anthropic开源“思维追踪”工具，可视化大语言模型内部逻辑影像救市，AI拓疆，荣耀400迈出“李健”时代第一步混元游戏发布，腾讯想打造游戏云“头号BD”Q1财报解读：AI矛+生态盾，快手正在打破“流量困境”？历史新高Q1财报之后，雷军手里还有多少牌没出？出海增长的焦虑，被 TikTok 打破了仙工智能递交招股书，计划通过18C章程在港交所上市开源鸿蒙开发者大会2025 | 大屏生态分论坛：共建共享，共赢未来移为通信拟1亿元设立全资子公司跨端生态，成就腾讯应用宝PC端千万日活苹果最新研究：未来AirPods或可监测用户心率阿里巴巴开源自主搜索AI智能体 WebAgent 美国能源部将联手戴尔打造新一代超级计算机Doudna 奇瑞集团成立智能化中心整合资源加速战略布局

首页 > 云计算频道 > 大模型

中国信通院发起大模型幻觉测试，助力AI安全应用

2025年03月19日 17:10:51 来源：Citnews中文科技资讯

　　为应对大模型幻觉带来的潜在风险，中国信息通信研究院人工智能所基于AI Safety Benchmark测评工作，正式开展大模型幻觉测试。大模型幻觉指生成内容看似合理但与事实或用户输入不符的现象，尤其在医疗、金融等领域广泛应用时，其风险不容忽视。

　　本次测试聚焦大语言模型，涵盖事实性幻觉和忠实性幻觉两种类型，采用7000余条中文样本，涉及人文、社会、自然、应用及形式科学五大维度。测试形式包括信息抽取、知识推理和事实判别等题型，旨在全面评估模型表现。

　　文章内容仅供阅读，不构成投资建议，请谨慎对待。投资者据此操作，风险自担。

[No. ]
分享到微信

即时

第十四代英特尔@酷睿™ 处理器：性能飞跃，重塑计算

第十四代英特尔® 酷睿™ 处理器(代号Raptor Lake S Refresh)采用了先进的Intel 7制程工艺。

第十四代英特尔@酷睿™ 处理器：性能飞跃，重塑计算

“强悍小透明”真我Neo7 Turbo正式发布，国补到手1699.15

新闻

明火炊具市场：三季度健康属性贯穿全类目

奥维云网(AVC)推总数据显示，2024年1-9月明火炊具线上零售额94.2亿元，同比增加3.1%，其中抖音渠道表现优异，同比有14%的涨幅，传统电商略有下滑，同比降低2.3%。

企业IT

重庆创新公积金应用，“区块链+政务服务”显成效

“以前都要去窗口办，一套流程下来都要半个月了，现在方便多了!”打开“重庆公积金”微信小程序，按照提示流程提交相关材料，仅几秒钟，重庆市民曾某的账户就打进了21600元。

3C消费

华硕ProArt创艺27 Pro PA279CRV显示器，高能实力，创

华硕ProArt创艺27 Pro PA279CRV显示器，凭借其优秀的性能配置和精准的色彩呈现能力，为您的创作工作带来实质性的帮助，双十一期间低至2799元，性价比很高，简直是创作者们的首选。

研究

中国信通院罗松：深度解读《工业互联网标识解析体系

9月14日，2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。

专题

返回主页 ┊ 关于我们 ┊ 内容联系 ┊ 联系我们 ┊ 免责声明 ┊ 原创新闻 ┊ 门户版

Copyright www.citnews.com.cn 中文科技资讯 2009-2025 all rights reserved

关键词：CITNews|Citnews中文科技资讯|中文科技资讯网|科技资讯网|中国科技资讯|中国科技新闻网|中国科技资讯网|快科技|新科技|中文科技数码头条号|中文移动新媒体

京ICP备18037198号-1 京公网安备 11010502041587号