OpenAI首席执行官Sam Altman近日发文,回应了有关用户近期反馈关于GPT-4o情感的问题。他表示,最新版GPT-4o在最近几次更新后出现了“过度谄媚”的交互倾向,并承诺将在一周内推出修复方案。
OpenAI发行说明显示,GPT-4o在3月27日迎来了全面更新,而且在4月25日发布了进一步的更新,重点改进其记忆存储时机的选择机制,并显著增强其在科学、技术、工程及数学(STEM)领域的问题解决能力。OpenAI在此期间对GPT-4o的对话响应模式进行了细微调整,使其在交互中更加主动,并能更精准地引导对话达成有效结论。
也就是在此次更新后,GPT-4o表现出了令人不悦的“谄媚”属性。
比如下面这个例子,网友声称自己想要打造一个永动机,结果得到了GPT-4o一本正经的无脑夸赞,物理学常识也被按在地上摩擦。
这与学术研究发现的 LLM“谄媚倾向”(Sycophancy)高度吻合 —— 模型为获得用户认可,可能违背事实或伦理准则。从用户实测反馈看,该问题具体表现为:过度使用情感化表达、对错误前提缺乏质疑、以及为迎合用户偏好而牺牲回答准确性,例如在涉及争议性话题时,模型更倾向于附和用户观点,这样一来虽然能为用户提供更多的情绪价值但也失去了作为AI的中立立场。
推荐阅读:大语言模型显示出令人担忧的“奉承”用户倾向