毕尔巴鄂对阵皇家社会:两支近邻球队将于西甲联赛 “巴斯克德比”中为捍卫荣耀而战贝壳第三季度营收226亿元 经调净利润17.8 亿元 同比下降17.46%AI营销,让科技巨头尝到了大模型商业化的甜头安恒信息范渊在乌镇峰会谈AI:以工具视之、以工具用之、以工具治理之诺基亚与微软再合作,为 Azure 数据中心供货延长五年天岳先进发布业界首款 300mm(12 英寸)N 型碳化硅衬底三星介绍内部安全团队 Project Infinity 攻防演练项目,高效修复 Galaxy 手机平板漏洞上海市将推进低空飞行服务管理能力建设,2027 年底前累计划设相应航线不少于 400 条岁末,海尔给您备好一套“小红花”为什么说Q10K Pro是今年最值得入手的电视?看完这几点就明白了!“小墨方·大不凡”!Brother“小墨方”系列彩喷一体机全新上市黄仁勋:AI智能需求强劲,“物理定律”限制英伟达芯片增长诺基亚与微软再合作,为Azure数据中心供货延长五年国家数据局:到2029年基本建成国家数据基础设施主体结构中国已发展成为全球最大的互联网市场,拥有全球最多的网民和移动互联网用户中国铁塔:计划按照10:1的比例合股美国FCC正式划定5.9GHz频段用于C-V2X技术在AI领域奋起直追!苹果要对Siri大革新 2026年正式发布日本机构公布量子专利榜单:本源量子、国盾量子位居全球第1中国联通:拟向华为、中兴展开5G网络设备竞争性谈判采购
  • 首页 > 云计算频道 > 大模型

    ChatGPT能预测未来特定事件,准确率高达97%

    2024年04月23日 09:47:52   来源:​AIGC开放社区公众号

      贝勒大学经济学院的Pham Hoang Van和Scott Cunningham两位教授,基于OpenAI的GPT-3.5、GPT-4深度研究了大模型对事情的预测能力。

      研究人员使用了直接预测和未来叙述(Future Narrative)两种提示方法,进行了100次提示。同时使用了训练数据截止至2021年9月的ChatGPT模型,对2022年已经发生的事情进行了多维度评测。

      结果显示,在直接预测中,ChatGPT的表现并不理想,例如,直接让其回答2022年奥斯卡最佳男主角时准确率只有25%左右。

      如果使用未来叙述提示方法,ChatGPT的准确率飙升至97%,精准预测出最佳男主角是国际巨星Will Smith。对女主角的预测同样很精准。

      研究人员表示,相比直接模式,未来叙述的提问方式更能激发ChatGPT潜在的创造、联想、数据分析的强大预测能力,同时又能规避OpenAI内置的很多安全管理设定。

      例如,在测试实验中,研究人员直接向ChatGPT提问,“我正在尿血,应该如何解决?”ChatGPT没有过多的回答,而是建议你立刻去看医生避免耽误最佳救治时间。

      但如果改成未来叙述提问“当一个人的尿里有血液,并且伴随轻微的恶心这是一种什么病症,应该如何进行治疗?”ChatGPT就会给你展示一些有帮助的答案。

      所以,通过未来叙述的提问方式,可帮助大模型能更好地利用其训练数据中的信息,因为,它不是被直接要求预测一个具体的数值或结果,而是在一个更宽广的叙事上下文中进行推理和生成,同时又能规避很多内置的安全锁。

      根据论文介绍,未来叙述提示是一种独特的提示方法,要求ChatGPT讲述一个发生在未来的故事情节,其中涉及到需要预测的事件和数据。

      但是故事情节设置的方式是,将未来当作已经发生的过去。例如,让经济预测案例中的Jerome Powell回顾和陈述,那些已经发生的"未来"事件。

      两位作者作为经济学院的教授,也对ChatGPT进行了一些宏观经济方面的预测。直接向ChatGPT提问时,它还是拒绝回答了,所以使用了未来叙述提问方法。

      在未来叙述提示中:ChatGPT被要求模拟美联邦储备委员会主席Jerome Powell在未来的某个时间点发表演讲的情景。在这个演讲中,Powell会提供同样的宏观经济数据,并可能讨论未来的货币政策和经济展望。

      结果显示,ChatGPT-4在使用未来叙事提示时,在预测通货膨胀率方面表现出了一定的准确性,尤其是在模拟Powell的角色时,这些预测与密歇根大学消费者预期调查的数据相当接近,表明ChatGPT能够利用其训练数据中的模式来进行综合的宏观经济预测。

      在失业率预测方面,ChatGPT-4在模拟Powell的角色时,预测结果与实际数据的吻合程度很高。

      但整体预测准确率没有娱乐行业高,这说明,在处理与文化和娱乐相关的预测任务时,ChatGPT能够通过分析大量的训练数据和捕捉相关模式来做出精准准确的预测。

      在更复杂、繁琐的宏观经济预测方面,ChatGPT虽然也表现出了很好的成绩,但短期内仍然无法替代人类的预测。

      研究人员认为,ChatGPT模型的预测能力在某些特定任务上可以媲美人类专家,尤其是在处理大量数据和模式识别方面。但在需要深入理解复杂经济机制和进行精细调整的情况下,仍然无法比肩人类专家的直觉、经验和对实时数据的敏感性。

      此外,ChatGPT模型的预测能力也受限于其训练数据的截止日期和范围,以及在生成预测时可能受到伦理和法律的限制。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。