• 首页 > 云计算频道 > 大模型

    GPT-3.5在图灵测试中败给上世纪六十年代研发的AI

    2023年12月05日 09:02:08   来源:DoNews

      12月5日消息,来自加利福尼亚大学圣迭戈分校的 2 位研究人员在一篇题为「GPT-4 可以通过图灵测试吗」的研究中,对 GPT-4、GPT-3.5、人类和上世纪 60 年代麻省理工团队开发的史上第一个基于规则的聊天机器人进行了图灵测试。

      GPT-3.5 根据不同的提示,成功率最高只有 14%。ELIZA 在这次研究中取得了相对较好的成绩,成功率达到了 27%。GPT-4 取得了 41% 的成功率,仅次于人类得分(63%)。纽约大学心理学和神经科学教授 Gary Marcus 对此调侃道,通过图灵测试的梦想落空了。

      作者在认真研究了为什么测试者将 ELIZA 认定是人类的原因,再次印证了一个结论:长久以来,「图灵测试」成为了判断计算机是否具有「智能」的核心命题。

      但图灵测试并不应该是一个判断 AI 智能高低的测试。不能因为 ELIZA 比 ChatGPT 表现好,就认为这个 1966 年的基于规则的 AI 系统智能比 ChatGPT 强。

      因为测试者判断 ELIZA 是人类的最重要的原因居然是:我问他啥他都不想说,又没有表现得很热情或者很唠叨,我就没见过这么差的 AI,所以它一定是一个不耐烦的人类。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。