OpenAI 组建新团队,以控制超智能 AI


OpenAI 宣布正在组建一个由其联合创始人兼首席科学家 Ilya Sutskever 和 Alignment 负责人 Jan Leike 共同领导的新团队,以开发引导和控制超智能人工智能(Superintelligent AI)系统的方法。“我们需要科学和技术突破来引导和控制比我们聪明得多的 AI 系统。”

该团队由 OpenAI 之前的 Alignment 部门的研究人员和工程师,以及来自公司其他团队的研究人员组成;他们有权使用公司迄今为止已获得的 20% 的计算资源,目标是在未来四年内解决控制超智能 AI 的核心技术挑战

Sutskever 和 Leike 认为,超智能将可能在十年内实现。这将是人类发明的最具影响力的技术,可以帮助解决许多重要的问题。但与此同时,其巨大的力量也可能非常危险,并可能导致人类丧失主权甚至灭绝。

“我们如何确保比人类更聪明的 AI 系统遵循人类的意图?目前,我们还没有一个解决方案来引导或控制潜在的超智能 AI,并防止其失控。我们当前调整人工智能的技术,例如根据人类反馈进行强化学习,均依赖于人类监督人工智能的能力。但人类无法可靠地监督比我们聪明得多的 AI 系统。”

他们计划构建一个大致达到人类水平的“automated alignment researcher”。然后使用大量计算来扩展工作,并迭代地调整超级智能。为此,首先要做的是:1) 开发可扩展的训练方法,2) 验证生成的模型,3) 对整个对齐管道进行压力测试:

  • 研究人员计划利用 AI 系统来协助评估其它 AI 系统(可扩展的监督),同时还希望了解和控制他们的模型是如何将监督推广到人类研究员无法监督的任务上。
  • 为了验证系统的一致性,研究人员自动搜索了有问题的行为,以及存在问题的内部结构。
  • 最后计划可以通过故意训练未对准的模型来测试整个流程,确认其技术可以检测到最严重的未对齐类型(对抗性测试)。

Sutskever 和 Leike 表示,随着研究的深入,预估其将来的研究重点也可能出现发生变化,甚至还可能会有新的研究领域出现。

目前,这一 Superalignment 团队还在招募机器学习研究人员和工程师。Sutskever 和 Leike 认为,Superintelligence alignment 从根本上来说是一个机器学习问题,因此优秀的机器学习专家对于解决这个问题至关重要。他们计划广泛分享团队的研究成果,并将促进非 OpenAI 模型的一致性和安全性视为其工作的重要组成部分。

“这个新团队的工作是对 OpenAI 现有工作的补充,旨在提高ChatGPT 等当前模型的安全性,以及理解和减轻人工智能带来的其他风险,例如滥用、经济破坏、虚假信息、偏见和歧视、成瘾和过度依赖等问题。虽然这个新团队将专注于将超智能 AI 系统与人类意图结合起来的机器学习挑战,但我们正在积极与跨学科专家合作解决相关的社会技术问题,以确保我们的技术解决方案考虑到更广泛的人类和社会问题。


相關推薦

2025-06-08

主题或问题,例如「野兽派建筑简史」或「人们对最新 OpenAI 模型的看法」,即可获得为每位用户量身定制、深入研究的个性化音频体验; 智能互动:用户可随时提出问题或反馈,内容会实时调整,并根据用户反馈优化后续

2025-04-02

Nova Act 是亚马逊试图利用自己的通用人工智能代理技术与OpenAI 的 Operator 和 Anthropic 的 Computer Use 竞争的尝试。几家领先的科技公司认为,能够为用户导航网络的人工智能代理将使当今的人工智能聊天机器人更加有用。 亚马逊可

2023-12-07

算发展面临的挑战。“在多方支持下,国家超算广州中心组建一流人才团队,开发了一系列面向领域的超算应用平台,支持各行各业取得了显著的应用实效,有力拓展了国产超算应用生态。”

2023-05-30

Ubuntu 新组建了一个 High Performance Computing (HPC) 团队。根据发布在 Ubuntu Discourse 上的一些描述信息可知,Ubuntu HPC 团队旨在为 Ubuntu 生态系统提供最优质的 HPC 基础设施、应用程序和用户体验。 “HPC 是支撑几个主要行业和关

2025-06-06

风险投资公司 SignalFire 的最新研究显示,OpenAI 的工程师跳槽至 Anthropic 的比例高达8:1,而来自谷歌 DeepMind 部门的人才流失情况更为显著,比例达到11:1。这一趋势表明,Anthropic 不仅在技术上实力雄厚,更因其对 AI 安全的重视,

2025-04-02

节。 据报道,时任OpenAl首席科学家苏茨克沃秘密发送给OpenAI董事两封针对阿尔特曼和OpenAI总裁布罗克曼的PDF。其中列举了数十条涉嫌撒谎或失当行为的例子,最终导致了阿尔特曼被罢免。 PDF中针对阿尔特曼的指控,苏茨克沃

2024-10-15

刻变革。它在模型解读、减少流程错误、寻找优化效率、控制成本等方面,将改变传统的采购业务流程,重塑采购岗位的角色与职责,培育数字化采购力量。” 万联证券在此前发布的研究报告中也提到,自“十三五”、“十四

2025-05-22

按照“一署、两试点、六平台、N个场景”的建设思路,组建人工智能(机器人)署,建成机器人剧场和示范街区两个试点,打造六大公共创新赋能平台,打造N个标杆应用场景。 数据显示,目前,龙岗全区已集聚人工智能与

2025-06-12

定义集体对齐,结果越好。 我们(整个行业,而不仅是OpenAI)正在为世界构建一个大脑。它将高度个性化、人人皆可轻松使用;限制我们的将是好点子的匮乏。长久以来,科技创业圈常嘲笑“点子大王”——那些只有想法却需

2025-04-26

更强大的模型和主动工作流程的引入,AI 辅助编程在各个团队中的应用势头强劲。主动工作流程是指能够规划和执行多步骤任务的 AI 系统。他表示:“我们正在公司各个部门推广这些更深层次的工作流程,” 并特别提到客户服务

2023-10-27

谷歌、微软、OpenAI 和 Anthropic 发布联合声明,任命美国智库学会高管 Chris Meserole 为前沿模型论坛 (Frontier Model Forum) 首任执行董事。并宣布设立 1000 万美元的 AI 安全基金,“以推动正在进行的工具开发研究,帮助社会能够有效地

2025-05-23

OpenAI 昨晚官宣了一则新消息:OpenAI CEO Sam Altman 与苹果前首席设计官 Jony Ive 深度合作,共同打造名为「io」的全新公司。 OpenAI表示,此次交易将支付50亿美元,因为其已持有该公司23%的股份。此次收购也是OpenAI迄今为止规模最

2025-04-01

成为全球增长最快的 AI 工具,每月新增网站访问量超过 OpenAI 的 ChatGPT。该数据基于对 171 个类别的 10,500 多种 AI 工具的追踪。 报告补充称,DeepSeek 在 2025 年 2 月新增访问量达 5.247 亿次,超过 ChatGPT 的 5 亿次。DeepSeek 目前是全

2023-03-01

性能、可扩展和安全的数据基础设施。同时,该项目正式组建开源社区,并将基于国际开源社区的规则进行经营。 跬智信息(Kyligence)由首个来自中国的 Apache 顶级开源项目 Apache Kylin 核心团队成立,是领先的大数据分析和指标