GPT-5 通关宝可梦,创下 9517 步新纪录


在一场精彩绝伦的宝可梦对决中,AI 新星 GPT-5以9517步的佳绩成功通关经典游戏《宝可梦水晶》,击败了游戏中的终极对手赤爷(Red)。

根据推特博主 Clad3815的统计,GPT-5的通关步数远远低于其前任 o3的27040步,后者几乎是 GPT-5的三倍。这意味着 GPT-5只需短短202小时就能完成这一挑战,而 o3则需要近一个月的时间。

游戏中,玩家需要从小镇出发,收集徽章,挑战道馆馆主,最终与赤爷对决。GPT-5如同小智一般,沿着主线一路推进,收集全部16枚徽章时,仅用了9205步,而 o3则耗费了22334步。更为惊人的是,从收集完徽章到击败赤爷的阶段,GPT-5仅需312步,而 o3却花费了将近5000步,效率提高了十几倍。

在四天王和冠军的挑战中,GPT-5同样展现了超高效率,仅用7329步,o3则用了超过18000步。在通关《宝可梦水晶》之前,GPT-5 还成功挑战了《宝可梦红》,同样取得了压倒性胜利。

OpenAI 的联合创始人 Greg Brockman 对此次表现也表示赞赏。那么,究竟是什么让 GPT-5 如此高效呢?Clad3815 总结了几个关键因素:

  • 幻觉少,速度快:GPT-5在游戏过程中出现的 “幻觉” 现象明显减少,极大提高了它的速度。
  • 空间推理强:GPT-5在复杂区域中几乎不迷路,能够有效规划行动序列,节省了大量时间。
  • 目标规划优越:在执行目标和任务规划方面,GPT-5展现出了卓越的能力。

有趣的是,宝可梦这款经典游戏被认为是 AI 能力的一个 “新基准”,为大型语言模型的决策能力、上下文理解和界面控制能力提供了测试平台。然而,挑战这款游戏的成本不菲,一位网友估计 GPT-5在通关《宝可梦红》时,花费了大约3500美元(约2万5人民币)的 API 额度。


相關推薦

2025-04-15

水平,受害者人数达 2,063 人,较上年同期增长 102% —— 创下单季度历史新高。 报告还记录了活跃威胁组织的数量,第一季度共发现 70 个,同比增长 55.5%。 2025 年第一季度,Akira 勒索软件的受害者共有 213 名,活动量同比增

2023-10-11

的官方 ChatGPT 应用程序安装数量和收入持续增长,9 月份创下了两项新纪录:全球 iOS 和 Android 应用程序的下载量达到 1560 万次,其中 Google Play 的下载量为 900 万,App Store 的下载量为 660 万。以及总收入接近 460 万美元,净收入 3

2025-06-14

布了一份强劲的财报,财报发布后的反弹推动甲骨文股价创下200美元的收盘纪录。周三下午发布的财报显示,甲骨文上个月结束的财季利润(调整后每股收益1.70美元)和销售额(营收159亿美元)均高于华尔街预期,随后甲骨文

2023-02-25

一共捐赠了 23 万美元。 延伸阅读:Google 漏洞悬赏金额创下新记录,Chrome 修复速度行业领先

2023-11-23

降。SQL 和 Java 分别排在第 4 和第 5 位。 Rust 是今年唯一创下受欢迎程度新纪录的常用语言。报告认为 Rust 会首先超越 Go,因为每六个 Go 用户中就有一个在考虑采用 Rust。与 Scala 一样,Rust 也是程序员最不愿意迁移的语言。 Obj

2023-01-15

HTTP Server。 根据介绍,ASF 联合创始人 Brian Behlendorf 曾在纪录片“Trillions and Trillions Served”中阐述了他选择“Apache”这个名字背后的理念,是出于对 “Apache” 部落原住民(印第安人)发自内心的尊重和欣赏,他们以战争中高超

2025-08-09

少。总人口数约为1.2065亿,相比去年减少了约90.8万人,创下自1968年有统计数据以来的最大降幅。 数据显示,从2024年初到2025年初,日本的出生人数创下历史新低,而死亡人数则达到新高,进一步加剧了人口萎缩的趋势。马斯克

2021-12-03

跨越了 1.0% 的大关,并在 10 月拿下了 1.13% 的市场份额,创下多年新高。作为一个百分比,这当然很小,但随着 Steam 不断增长的用户群,它的绝对数字是一个可观的数字。 Steam 在创下新高记录和冬季游戏特卖活动的情况下,

2025-08-08

发布一项重大消息。根据 OpenAI 的明显暗示,期待已久的 GPT-5 大模型即将亮相。 OpenAI 在 X 上称,将在美国太平洋时间周四 10 点 (北京时间周五 1 点) 举行一场直播活动。该公司在预告中把直播一词 livestream 中的 s 换成了 5,想

2025-04-08

在几周内发布,在多个方面大幅改进了预览版本的 o3; GPT-5 将在几个月内发布。 而根据他此前说法,OpenAI 将直接发布内置了推理能力的 GPT-5,以后也不会再单独发布推理模型。 Altman 解释了这次调整的原因,是要把 GP

2025-08-09

网络信息,Cursor 针对其付费计划用户提供了一定额度的 GPT-5免费使用权限。 X 平台上,@rohanpaul_ai 在7月28日的帖子中提到,Cursor 正考虑与 OpenAI 深化合作,部分得益于 GPT-5在编码任务中的卓越表现。帖子指出,GPT-5在软件工程、

2024-09-21

时间,很多朋友在 deepin 23 上实现了《黑神话:悟空》的通关,那么除了通过 Steam 玩 Windows 游戏之外,还有其他可以使用的游戏平台吗? 回答,当然是可以哒! 游戏平台介绍 今天介绍的是 Heroic Games Launcher,这是我目前用的

2025-08-12

,随着 OpenAI 正式推出其新一代人工智能模型 GPT-5,该公司在中国申请相关商标的进展也引发了关注。据天眼查数据显示,OpenAI 公司及其运营子公司曾多次申请注册“OPENAI GPT-5”和“GPT-5”等商标,但目前这些申请均

2025-06-20

40 分钟深度专访。 OpenAI CEO Sam Altman 透露,备受瞩目的 GPT-5 预计将于今年夏天推出,不过具体发布日期尚未确定。 据报道,GPT-5 性能将远超 GPT-4,测试者表示其在多方面有显著进步。据悉,这款新模型将整合 OpenAI 的核心技