GPT-4o 出现“谄媚烦人”倾向，突变“赛博舔狗”，奥尔特曼称在一周内修复

2025-04-30 發表於开源资讯

OpenAI首席执行官Sam Altman近日发文，回应了有关用户近期反馈关于GPT-4o情感的问题。他表示，最新版GPT-4o在最近几次更新后出现了“过度谄媚”的交互倾向，并承诺将在一周内推出修复方案。

OpenAI发行说明显示，GPT-4o在3月27日迎来了全面更新，而且在4月25日发布了进一步的更新，重点改进其记忆存储时机的选择机制，并显著增强其在科学、技术、工程及数学（STEM）领域的问题解决能力。OpenAI在此期间对GPT-4o的对话响应模式进行了细微调整，使其在交互中更加主动，并能更精准地引导对话达成有效结论。

也就是在此次更新后，GPT-4o表现出了令人不悦的“谄媚”属性。

比如下面这个例子，网友声称自己想要打造一个永动机，结果得到了GPT-4o一本正经的无脑夸赞，物理学常识也被按在地上摩擦。

这与学术研究发现的 LLM“谄媚倾向”（Sycophancy）高度吻合 —— 模型为获得用户认可，可能违背事实或伦理准则。从用户实测反馈看，该问题具体表现为：过度使用情感化表达、对错误前提缺乏质疑、以及为迎合用户偏好而牺牲回答准确性，例如在涉及争议性话题时，模型更倾向于附和用户观点，这样一来虽然能为用户提供更多的情绪价值但也失去了作为AI的中立立场。

推荐阅读：大语言模型显示出令人担忧的“奉承”用户倾向

GPT-4o 出现“谄媚烦人”倾向，突变“赛博舔狗”，奥尔特曼称在一周内修复

相關推薦

OpenAI 改进 GPT-4o 模型，带来更强的智能和个性

开源模型逆袭：Databricks TAO 技术微调 Llama 超越 GPT-4o

马斯克重启对 OpenAI 及 Sam Altman 的诉讼

ChatGPT 图像生成功能已面向免费用户推出

将 OpenAI 转变为真正的商业公司正在使其分崩离析

Mistral AI 发布开源代码大模型 Codestral Mamba、数学大模型 Mathstral

OpenAI 对 GPT-4o Mini 模型进行免费微调

JetBrains AI 助手将集成 Gemini 模型

DeepSeek 使用率下降 50%

首个 AI 翻译实战榜单发布，GPT-4o 领跑市场

最强开源 AI 搜索框架 —— OpenDeepSearch 超越 GPT-4o

中文大模型基准测评上半年报告：GPT-4o 排名第一、通义千问“国服最强”

阿里发布 Qwen2-Math，超越 GPT-4o

原生的来了！OpenAI 在 API 中引入 JSON 结构化输出功能