在一场精彩绝伦的宝可梦对决中,AI 新星 GPT-5以9517步的佳绩成功通关经典游戏《宝可梦水晶》,击败了游戏中的终极对手赤爷(Red)。
根据推特博主 Clad3815的统计,GPT-5的通关步数远远低于其前任 o3的27040步,后者几乎是 GPT-5的三倍。这意味着 GPT-5只需短短202小时就能完成这一挑战,而 o3则需要近一个月的时间。
游戏中,玩家需要从小镇出发,收集徽章,挑战道馆馆主,最终与赤爷对决。GPT-5如同小智一般,沿着主线一路推进,收集全部16枚徽章时,仅用了9205步,而 o3则耗费了22334步。更为惊人的是,从收集完徽章到击败赤爷的阶段,GPT-5仅需312步,而 o3却花费了将近5000步,效率提高了十几倍。
在四天王和冠军的挑战中,GPT-5同样展现了超高效率,仅用7329步,o3则用了超过18000步。在通关《宝可梦水晶》之前,GPT-5 还成功挑战了《宝可梦红》,同样取得了压倒性胜利。
OpenAI 的联合创始人 Greg Brockman 对此次表现也表示赞赏。那么,究竟是什么让 GPT-5 如此高效呢?Clad3815 总结了几个关键因素:
- 幻觉少,速度快:GPT-5在游戏过程中出现的 “幻觉” 现象明显减少,极大提高了它的速度。
- 空间推理强:GPT-5在复杂区域中几乎不迷路,能够有效规划行动序列,节省了大量时间。
- 目标规划优越:在执行目标和任务规划方面,GPT-5展现出了卓越的能力。
有趣的是,宝可梦这款经典游戏被认为是 AI 能力的一个 “新基准”,为大型语言模型的决策能力、上下文理解和界面控制能力提供了测试平台。然而,挑战这款游戏的成本不菲,一位网友估计 GPT-5在通关《宝可梦红》时,花费了大约3500美元(约2万5人民币)的 API 额度。