《自然》网站:中国 AI 模型“又一个 DeepSeek 时刻”


英国《自然》杂志网站16日发表文章说,中国人工智能(AI)模型Kimi K2发布后引发轰动,世界迎来“又一个DeepSeek时刻”。中国在6个月内推出第二款令人印象深刻的模型,表明这一成功并非偶然。文章摘要如下:

继今年1月DeepSeek-R1震惊世界之后,全球研究人员对中国推出的第二个强大的AI模型越来越感到兴奋。北京月之暗面科技有限公司于7月11日推出了Kimi K2。

Kimi K2在编程方面的表现尤其出色,在LiveCodeBench(一个专门用于评估大型语言模型编码能力的数据集)等测试中取得了高分。此外,Kimi K2似乎还颇具写作天赋,在一些专业测试中名列前茅。

目前,包括硅谷的开源社区等在内的AI开发者都在热议Kimi K2。官方数据显示,其总参数规模达到了万亿级别(1T),不过由于采用混合专家架构,每次任务仅动态激活320亿参数,只需调用模型中相关模块,从而有助于控制所需算力。

与DeepSeek系列模型类似,Kimi K2采用开源协议发布,允许研究人员免费下载并进行本地部署与二次开发。同时,该模型支持通过应用程序接口调用,其定价显著低于“克劳德4”等主流闭源模型。

美国艾伦人工智能研究所机器学习研究员纳坦·兰伯特说:“今年早些时候发布的DeepSeek-R1更像是AI发展轨迹中的前传,而非昙花一现。Kimi K2是全球最佳的全新开源模型。”(新华社)

相关阅读:

  • 月之暗面发布并开源 Kimi K2:擅长代码与 Agentic 任务

相關推薦

2025-05-21

软发布了名为“NLWeb”的开源项目,旨在简化创建网站的自然语言对话界面,使任何网站都能轻松转变为 AI 驱动的应用程序。 NLWeb 定位为 “智能体 Web 时代的 HTML”,支持自定义模型与数据交互,旨在帮助开发者轻松将网站转

2023-10-13

用场景中得到了应用,包括文本生成、机器翻译、问答、自然语言推理等。 AI Agent(LLM Agent) LLM Agent 是指基于 LLM 技术构建的智能代理,它可以用于各种任务,比如让机器与 ChatGPT 交互,一层一层挖掘信息,自动化完成任务

2025-03-20

测的事实判别题型。 总体涉及人文科学、社会科学、自然科学、应用科学和形式科学五种测试维度。

2025-03-29

如今已演进为具备复杂决策能力的智能体系统。通过融合自然语言处理(NLP)、计算机视觉(CV)等AI技术,RPA+AI解决方案正从结构化数据处理向非结构化场景延伸,覆盖金融风控、医疗影像分析、政务智能审批等多元化应用场

2025-05-27

的垂类Agent评测框架。评测结果和方法论可通过 xbench.org 网站实时查看。 论文地址:https://xbench.org/files/xbench_profession_v2.4.pdf

2024-09-21

下,为中国本土用户量身打造的AI Assistant深度融合了中文自然语言处理技术,实现了中文指令与系统的直接交互,显著降低了使用门槛并提高了使用者的工作效率。 此外,运用本土数据进行模型训练,能够在优化模型性能的同

2023-03-28

开始创建自己的模型,而是基于 EleutherAI 在 2021 年开源的自然语言处理模型 —— GPT-J。GPT-J 是一个基于 GPT-3,由 60 亿个参数组成的自然语言处理 AI 模型。该模型在一个 800GB 的开源文本数据集上进行训练,并且能够与类似规模

2023-11-06

个AI搜索引擎,一个对话式AI助手。「天工」拥有强大的自然语言处理和智能交互能力,能够实现个性化AI搜索、智能问答、聊天互动、文本生成、编写代码、语言翻译等多种应用场景,并且具有丰富的知识储备,涵盖科学、技术

2025-05-20

的竞争力不容忽视 问:你怎么看最近崛起的中国AI公司DeepSeek? 皮查伊:DeepSeek是一个“认知刷新”的时刻。任何认真关注AI论文的人都不会低估中国的能力。中国的研究输出非常多,人才也极为优秀。DeepSeek的发布让外界意

2023-07-08

向行业的大模型系列,包括“5+N+X”三层架构: L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型,提供满足行业场景中的多种技能需求。盘古3.0为客户提供100亿参数、380亿参数、710亿参数和1000亿参数的系列

2024-08-29

务。MaxKB的核心优势在于其高效的知识管理、知识检索和自然语言理解能力,能够将用户提出的问题与知识库中的相关信息进行匹配,生成准确的回答。MaxKB还能记录和查看每次对话内容,收集用户反馈,为回答的持续优化提供

2025-06-28

答,以及声呐图像、海洋观测图等海洋特色多模态数据的自然语言解读能力。其采用的领域知识增强“慢思考”推理机制,相较现有通用大模型能有效降低幻觉式错误。 此外,模型还适用于海洋机器人操控与水下具身智能等

2023-04-15

将聚焦最新的 AI 技术发展,包括深度学习、机器学习、自然语言处理等方向,以及这些技术如何推动行业变革和价值创造。 AI 创新方面将展示 AI 领域的创新理念、方法和实践,鼓励参会者在技术、商业模式、管理等多个层面

2025-04-24

扩展搜索、命令行执行、网站部署及API集成等功能,通过自然语言对话实现复杂任务的自动化处理。 主要功能: 浏览器自动化:通过内置浏览器控制模块,Suna可自主导航网页、点击元素、填写表单并提取数据,适用于任