GPT-4o 出现“谄媚烦人”倾向,突变“赛博舔狗”,奥尔特曼称在一周内修复


OpenAI首席执行官Sam Altman近日发文,回应了有关用户近期反馈关于GPT-4o情感的问题。他表示,最新版GPT-4o在最近几次更新后出现了“过度谄媚”的交互倾向,并承诺将在一周内推出修复方案。

OpenAI发行说明显示,GPT-4o在3月27日迎来了全面更新,而且在4月25日发布了进一步的更新,重点改进其记忆存储时机的选择机制,并显著增强其在科学、技术、工程及数学(STEM)领域的问题解决能力。OpenAI在此期间对GPT-4o的对话响应模式进行了细微调整,使其在交互中更加主动,并能更精准地引导对话达成有效结论。

也就是在此次更新后,GPT-4o表现出了令人不悦的“谄媚”属性。

比如下面这个例子,网友声称自己想要打造一个永动机,结果得到了GPT-4o一本正经的无脑夸赞,物理学常识也被按在地上摩擦。

这与学术研究发现的 LLM“谄媚倾向”(Sycophancy)高度吻合 —— 模型为获得用户认可,可能违背事实或伦理准则。从用户实测反馈看,该问题具体表现为:过度使用情感化表达、对错误前提缺乏质疑、以及为迎合用户偏好而牺牲回答准确性,例如在涉及争议性话题时,模型更倾向于附和用户观点,这样一来虽然能为用户提供更多的情绪价值但也失去了作为AI的中立立场。

推荐阅读:大语言模型显示出令人担忧的“奉承”用户倾向


相關推薦

2025-04-29

天更新了 GPT-4o!智力和个性都得到了提升。 — 萨姆·奥尔特曼 (@sama) 2025 年 4 月 25 日 今天,OpenAI CEO 奥特曼宣布对 GPT-4o 模型进行再次更新,重点提升了智能和个性。 优化 GPT-4o 保存记忆的时间长度并增强 STEM 的问题

2025-03-28

强化学习,TAO 不仅在降低企业成本方面表现出色,更是在一系列基准测试中取得了令人瞩目的成绩。 根据科技媒体 NeoWin 的报道,TAO 微调后的 Llama3.370B 模型在金融文档问答和 SQL 生成等任务中,展现出了优于传统标注微调方法

2024-08-07

业企业。” 相关阅读: 马斯克起诉 OpenAI 及其 CEO 奥特曼,要求公司恢复开源状态 OpenAI 回应被起诉:马斯克曾意图获得公司 “绝对控制权”

2025-04-01

提的是,由于该功能热度过高,OpenAI 首席执行官山姆・奥尔特曼此前在 X 平台上表示,GPU(图形处理单元)因大规模使用而“过热”,他称:“看到人们喜欢 ChatGPT 中的图像非常有趣,但我们的 GPU 正在‘熔化’。我们将在努力

2024-09-30

为的内容的能力。 团队将问题报告给高管,并着手进行修复。但部分员工对这一过程感到沮丧,认为如果公司在安全测试上多花些时间,他们本可以在问题到达用户之前就解决它。 OpenAI 的女发言人表示,团队检测到的高风险

2024-07-18

Mistral's la Plataforme 和 HuggingFace 进入 Mathstral。 Mistral 公司倾向于在开源系统上提供模型,它一直在与 OpenAI 和 Anthropic 等其他人工智能开发商展开激烈竞争。最近,该公司获得了 6.4 亿美元的 B 轮融资,估值接近 60 亿美元。该公

2024-07-26

在 Meta 推出开源 Llama 3.1 模型之后不久,OpenAI 宣布对其 GPT-4o Mini 模型提供免费微调,允许用户免费使用额外数据训练模型,以便在特定用例中获得更高的性能。 GPT-4o mini 微调适用于 OpenAI 的 Tier 4 和 5 使用层级的开发人员,这

2025-04-03

OpenDeepSearch 在 frames-benchmark 上超过了 GPT-4o 的 Search 功能,成为最强的开源 AI 搜索框架。 这个框架结合语义搜索,并提供了快速和深度搜索两种模式,允许多跳搜索(即不断检索以得到理想答案),并且专门为 AI Agent 优化。&n

2024-06-26

下成本效益至关重要的用例。 这些更新预计将在未来几周内推出。 详情可查看官方博客。

2024-07-11

测评结果。 从代表通用能力的一级总分来看,OpenAI的GPT-4o以81分高居榜首,Claude-3.5-Sonnet与通义千问开源模型Qwen2-72B-Instruct并列第二,得分均为77。 通义千问(Qwen2-72B)既是排名最高的中国大模型,也是全球最强的开源大模型,

2024-08-10

舰模型 Qwen2-Math-72B-Instruct在权威测评集MATH上的得分超越GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro、Llama-3.1-405B等,以84%的准确率处理了代数、几何、计数与概率、数论等多种数学问题。 项目团队在三个广泛使用的英语数学基准 GSM8K、M

2024-08-08

对复杂 JSON 模式进行评估时,具有结构化输出的新模型 gpt-4o-2024-08-06 得分为 100%。相比之下,gpt-4-0613 得分不到 40%。 这一功能包括两种形式: 函数调用:通过在函数定义中设置 strict: true可以使用工具的结构化输出。此功

2025-03-22

天凌晨,OpenAI 上线了全新语音模型 API,具体包括: gpt-4o-transcribe (语音转文本):单词错误率 (WER) 显著降低,在多个基准测试中优于现有 Whisper 模型 gpt-4o-mini-transcribe (语音转文本):gpt-4o-transcribe 的精简版本,速度更快、效

2023-02-06

本的内核预计将在两周后发布。 rc7 是一个相当轻松的一周,由于过去的圣诞节假期混在 6.2 版本的合并时间,使一些早期内核测试延迟了,因此 Torvalds 表示他将通过 -rc8 版本进行额外测试。 Linus 在 6.2-rc7 公告中评论: 我