微软报告称 GPT-4 易受“越狱”提示词影响，生成不良内容

发布时间：2023-10-18 10:37:50来源：

10 月 18 日消息，微软旗下研究团队近日发表论文，详细研究了大型语言模型 (LLM) 的“可信度”和潜在毒性，特别关注 OpenAI 的 GPT-4 及其前代GPT-3.5。

研究团队，GPT-4 虽然在标准基准测试中比 GPT-3.5 更加可靠，但容易受到“越狱”提示（绕过模型安全措施）影响。GPT-4 可能会根据这些“越狱”提示，生成有害内容。

论文中强调 GPT-4 更容易受到恶意“越狱”系统或用户提示影响，会准确地遵循（误导性）指令，生成不良内容，微软强调这个潜在漏洞不会影响当前面向客户的服务。

IT之家在此附上微软官方论文地址，感兴趣的用户可以深入阅读。

（责编： admin）

免责声明：本文为转载，非本网原创内容，不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

小红书官网网页版登陆入口及流程黄金价格高企，债基能成为年轻人理借条和欠条的区别法律性质差异深圳五一游玩打卡全攻略（2025最新

电视剧北上21-22集剧情预告介绍电视剧《北上》19-20集剧情讲解成都国防军事职业学校怎么样是公给女朋友留言的口语怎么写

杨幂美甲事件引争议，再度翻车,她以色列反击伊朗黄金原油暴涨，创广东清远遭暴雨出现“绿色天空”遮客服辟谣在12306公众号求票成功，