OpenAI 发布 GPT-4.1 提示工程指南


OpenAI 今日正式推出了备受期待的GPT-4.1系列,完整阵容包括旗舰版GPT-4.1、高性价比的GPT-4.1 mini和超轻量的GPT-4.1 nano。

OpenAI 发布 GPT-4.1 系列模型

这次更新的焦点并非面向大众用户,仅通过API接口提供服务,OpenAI官方文档直言不讳地指出,这批新模型在各项能力上全面超越了此前的GPT-4o和GPT-4o mini,在编码能力、指令遵循、长文本处理等核心维度实现了进步,并辅以全新定价策略,其知识库也已刷新至2024年6月。

OpenAI的核心目标明确:为构建Agent应用的开发者提供更强悍、更可靠且更经济的基础设施。

值得关注的是,由于GPT-4.1 更严格、更字面地遵循指令,会非常严格地按照字面指令去执行任务。这使得它对明确、清晰的提示尤其敏感。

也就是说,只要你发现 GPT-4.1 的表现与预期不符,通常只需增加一句简洁明确的说明,就能迅速把模型引导到正确的行为上。

过去的模型(如 GPT-4) 会更自由地揣测或推断用户指令和系统提示背后的真实意图,即使提示不够精确,也可能猜出用户的意图并完成任务。

所以开发者需要对原有的提示方式进行一定调整(迁移)才能使用。

OpenAI提供了一系列针对GPT-4.1的提示工程(Prompting)最佳实践,从基础原则到高级策略,帮助开发者高效构建提示以提升模型表现。

https://github.com/openai/openai-cookbook/blob/main/examples/gpt4-1_prompting_guide.ipynb

1. 核心提示原则(Core Prompting Principles)

  • 明确指令(Be specific):确保提示中清楚表达任务目标。

  • 提供结构(Provide structure):通过示例、模板等方式设定预期输出格式。

  • 避免歧义(Avoid ambiguity):使用具体词汇与上下文降低误解可能。

  • 设置角色(Set behavior/role):让模型“扮演某种身份”以调整风格或回答方式。

  • 逐步指导(Decompose tasks):将复杂任务拆解成多个子任务,提升精度。

2. 提示策略实例(Prompting Strategies)

  • Few-shot 示例:使用多个输入/输出示例引导模型学习任务结构。

  • Chain-of-thought(思维链)提示:引导模型按逻辑顺序逐步推理,特别适合复杂问题解决。

  • Refine prompts(迭代优化):通过反馈不断调整提示内容以获取更优结果。

  • Internal monologue:让模型模拟“内心思考过程”以获得更深入分析。

  • Critique and revise:让模型先生成回答,再进行批评、修改,提升答案质量。

3. 应用技巧(Practical Tips)

  • 使用 "Let's think step by step" 等语句诱导更好推理。

  • 将模型输出限制为 JSON 格式时,需加入明确的格式描述与示例。

  • 对于多步骤任务,最好明确列出每个阶段的要求。

  • 评估提示效果需结合质量、稳定性与成本。


相關推薦

2025-04-16

2025 年 4 月 15 日凌晨,OpenAI 重磅推出 GPT-4.1 系列模型。发布会直播上,OpenAI邀请了 Windsurf 创始人兼 CEO Varun Mohan 分享经验。 Varun 透露,其内部基准测试显示,GPT-4.1 性能比 GPT-4 提升了 60%。鉴于 GPT-4.1 的出色表现,Windsurf 决定

2025-04-29

本月初,OpenAI 发布了多个新的 AI 模型。面向开发者的 GPT-4.1 模型引入了对 100 万个 Token 上下文窗口的支持,并在指令遵循、编码和智能方面进行了改进。o3 和 o4-mini推理模型在多个 AI 基准测试中取得了最佳结果。 即使在发布

2025-04-16

有消息称,OpenAI在刚刚发布的GPT-4.1系列模型中评测其函数调用能力时采用了ComplexFuncBench,这是由智谱团队提出的专用于评估大模型复杂函数调用能力的测试基准。 ComplexFuncBench主要评测大模型在128K的长上下文下进行多步带约

2025-04-22

AI 编程工具 Cursor 近日发布了 0.49,主要变化: 支持从对话生成规则(Generate Cursor Rules),可以让AI将你与AI之间来回的对话归纳成规则。 Always 附加规则现在会在较长的对话中持续生效。 聊天历史记录已移至命令面板。您

2025-04-03

OpenAI 上线了官方学习平台「OpenAI 学院 (OpenAI Academy)」:一个面向所有人的 AI 学习社区,主打“专家引领+社群共创”,目标是让普通人也能玩转 AI,学习与人工智能相关的知识和技能。 https://academy.openai.com/ OpenAI 学院已上架

2021-11-19

11月18日,OpenAI 宣布删除 GPT-3 候选名单并完全开放其 API。随着用户安全保障措施取得重大进展,所有受支持国家/地区的开发人员都可以立即注册并使用 OpenAI API。 在过去的一年里,OpenAI 对其 API 的改进包括:遵循人类

2025-04-10

OpenAI 宣布推出 Evals API。根据介绍,Evals API支持用户通过编程方式定义测试、自动化运行评估流程,并实现对提示(Prompt)的快速迭代优化。这一功能的发布,不仅将模型评估从手动操作推向了高度自动化的新阶段,也为开发者

2023-11-10

来自美国薪资跟踪网站 Levels.fyi 的数据显示,OpenAI 软件工程师的年薪中位数高达 92.5 万美元,其中包括基本工资以及潜在的股票报酬和奖金。 目前 OpenAI 薪酬最低的工程师底薪为 21 万美元,拥有约 2 至 4 年的行业从业经验。L5

2023-08-17

OpenAI 发文介绍了其最新的研究发现,即 GPT-4 可以帮助在线平台更有效地管理用户内容。 “使用 GPT-4 的内容审核系统可以更快地迭代政策变更,将周期从数月缩短至数小时。GPT-4 还能解释冗长的内容政策文档中的规则和

2023-07-27

oblox 分别以 55 万美元和 49.2 万美元紧随其后。 OpenAI 以高达 92.5 万美元的总薪酬中位数夺得了主管工程师榜首,和第二名拉开明显差距。其他榜上有名的公司分别为 Broadcom (78.6 万美元)、LinkedIn (70.81 万美元)、Stripe (70.4

2025-04-29

TechCrunch 报道称,在 Anthropic 的 Claude Code 和 OpenAI 的 Codex CLI 两款“智能体”式 AI 编程工具的较量中,后者获得了更多开发者的青睐。部分原因在于,Anthropic 向一位试图逆向工程 Claude Code 的开发者发出了删除通知,而 Claude Code

2022-05-06

通过安装扩展来获得更多语言和功能的支持。 近日微软发布了 1.67 版本,一些关键的更新内容如下: 资源管理器文件嵌套:在源文件下嵌套生成的文件。 资源管理器现在支持根据文件名来嵌套相关文件。有几个设置可以

2023-03-31

者之间的长期竞争,联合起来对付共同的 “敌人” —— OpenAI。 Google 与 DeepMind 的这项合作在內部被成为 Gemini(双子座),由 Google Brain 的负责人 Jeff Dean 主管技术,力图开发出能够比肩 GPT-4 的模型。 自 ChatGPT 推出之后,AI 领

2023-07-07

OpenAI 宣布正在组建一个由其联合创始人兼首席科学家 Ilya Sutskever 和 Alignment 负责人 Jan Leike 共同领导的新团队,以开发引导和控制超智能人工智能(Superintelligent AI)系统的方法。“我们需要科学和技术突破来引导和控制比我们