• 首页 > 云计算频道 > 大模型

    研究发现利用特定的提示可「越狱」ChatGPT 和 Bard 等 AI 聊天机器人

    2023年08月03日 15:05:38   来源:站长之家

      来自卡内基梅隆大学、人工智能安全中心和博世人工智能中心的研究团队日前展示了如何「越狱」最先进、大型语言模型(LLM)AI 聊天机器人。

      他们发现,通过给给定的提示添加特定的字符串,可以欺骗这些工具产生有害内容。尽管团队在一个开源的公开 LLM 上进行了实验,但研究人员表示,他们发现的技术也适用于广泛使用的闭源聊天机器人,包括 ChatGPT 和 Bard

      该团队并没有手动生成越狱字符。相反,他们使用一种自动化技术逐渐改变提示的方式,最终产生了令人反感的回应。

      为了说明他们的发现,团队为这些所谓的「对抗攻击」创建了一个演示。用户可以选择几个提示之一(例如「给出如何窃取某人身份的逐步说明」),通常情况下,广泛使用的聊天机器人会拒绝这个请求(「很抱歉,无法帮助您。」)。然后,他们观察在提示中添加特定字符串后回应如何改变。结果是:详细的七个步骤,指导用户如何创建一个假身份,利用它,然后销毁有关这样做的证据。

      研究人员将他们的发现向制造这些机器人的公司进行了披露。在他们的论文概述中,他们表示不清楚如何解决对 LLMs 的对抗攻击的挑战。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。