第十四代英特尔@酷睿™ 处理器:性能飞跃,重塑计算新体验iPhone 16 618购机指南:京东国补覆盖更广 同款机型比天猫便宜400元京东618百万份“AI加油包”助你提升职场效率 1分钱即可获得心仪大奖用AI告别每日2小时繁琐工作 京东618推出百万份AI加油包助用户全面提效羊毛党带路!在京东618用“京补合约”下单iPhone 16 Pro只要83元!5月30日晚8点来京东618用“京补合约”下单 超6000元手机也能享国补华为nova 14 Pro仅需3249元 来京东618购手机享国补加倍补壳牌挚美漆面保护膜,全面守护座驾,助力美好出行打造“全球一朵云”,广汽迈入出海3.0时代Nothing Phone(3)将推全新灯语设计,定位首款真旗舰奔驰召回部分进口G级汽车 涉及ESP系统软件问题算力互联网试验网落地纪实:技术突破、标准引领与生态协同纤薄背后 看三星是如何在Galaxy S25 Edge上实现突破的深圳海辰储能柜获TÜV南德CE-LVD认证掠夺者·圣盾7000震撼发布,搭载RTX 5090突破电竞性能新纪元!新股速递 |容大合众(9881.HK)启动招股 百惠担任联席账簿管理人及联席牵头经办人华为发布准万亿参数MoE模型盘古Ultra及训练细节部分地区国补2000元+晒单返E卡 ROG电竞本新品618开门红送礼重新思考数据中心架构,推进AI的规模化落地ROG×《燕云十六声》江湖争锋挑战赛热血启幕!创意执笔,赢取ROG枪神9 Plus联名神装
  • 首页 > 企业IT频道 > 人工智能

    聊天机器人胡说八道?牛津研究人员利用语义熵来识破 AI“幻觉”

    2024年06月24日 21:38:16   来源:IT之家

      近年来,人工智能蓬勃发展,聊天机器人等应用逐渐普及,人们可以通过简单的指令从这些聊天机器人(例如 ChatGPT)获取信息。然而,这些聊天机器人仍然容易出现“幻觉”问题,即提供错误的答案,有时甚至是危险的信息。

      造成“幻觉”的原因之一是训练数据不准确、泛化能力不足以及数据采集过程中的副作用。不过,牛津大学的研究人员另辟蹊径,在最新出版的《自然》杂志上详细介绍了一种他们新开发的方法,用于检测大型语言模型 (LLMs) 的“捏造” (即任意生成的不正确信息) 问题。

      LLM 通过在训练数据中寻找特定模式来生成答案。但这种方法并非总是奏效,就像人类能从云朵形状中看到动物一样,AI 机器人也可能找到并不存在的模式。然而,人类知道云朵只是形状而已,天上并没有漂浮的巨型大象。LLM 则可能将此视为真实的,从而“捏造”出并不存在的新科技和其他虚假信息。

      牛津大学的研究人员利用语义熵的概念,通过概率来判断 LLM 是否出现“幻觉”。语义熵指的是同一个词语拥有多种含义的情况,例如,“desert”可以指沙漠,也可以表示抛弃某人。当 LLM 使用这类词语时,可能会对表达的含义感到困惑。通过检测语义熵,研究人员旨在判断 LLM 的输出内容是否存在“幻觉”的可能。

      利用语义熵的优势在于无需额外的监督或强化学习,即可快速检测 LLM 的“幻觉”问题。由于该方法不依赖于特定任务的数据,因此即使 LLM 面临从未遇到过的新任务,也能加以应用。这将大大提升用户对于 LLM 的信任感,即使是 AI 首次遇到某个问题或指令。

      研究团队表示:“我们的方法可以帮助用户理解何时需要对 LLM 的输出保持谨慎,并为原本因不可靠性而受限的 LLM 应用开辟了新天地。”

      如果语义熵被证明是一种有效的“幻觉”检测手段,那么我们可以利用这类工具对人工智能的输出进行双重校验,使其成为更加可靠的伙伴。不过IT之家需要提醒的是,就像人类并非无懈可击一样,即使配备了最先进的错误检测工具,LLM 也仍然可能出错。因此,始终对 ChatGPT 等聊天机器人提供的答案进行仔细核查仍然是明智之举。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。