英伟达发布 Cosmos-Reason1 系列物理 AI 模型


英伟达发布了 Cosmos-Reason1 系列模型,这是一组专注于物理常识理解和具身推理的 Physical AI 模型。

该系列模型基于 Qwen2.5-VL-7B-Instruct 进行后训练,结合了监督微调和强化学习方法,旨在理解空间、时间及基础物理学,并能作为规划模型为具身智能体(如机器人、自动驾驶汽车)的下一步行动进行推理。

Cosmos-Reason1-7B 模型能够接收文本提示和输入视频,通过长链式思维过程生成答案。模型支持商业用途,并已在 Hugging Face 上以 NVIDIA Open Model License 发布。

相关的代码、论文和评估数据集(Cosmos-Reason1-Benchmark)也已公开,数据集涵盖机器人、以自我为中心的人类演示和自动驾驶视频数据等领域。

https://huggingface.co/nvidia/Cosmos-Reason1-7B

https://github.com/nvidia-cosmos/cosmos-reason1


相關推薦

2025-08-13

据英伟达官方消息,英伟达在技术领域再推新进展。其推出的 NVIDIA Cosmos 平台,整合前沿生成式世界基础模型(WFM)、先进分词器、护栏以及高效数据处理和管理工作流,旨在加速物理 AI 开发。该平台的世界基础模型经 2000 万

2025-05-10

Cadence 公司推出了一款新型超级计算机,可支持一整套由英伟达 Blackwell 系统和英伟达 CUDA-X 软件库加速的工程设计和生命科学应用。 这款超级计算机名为 Millennium M2000 ,配备了英伟达 HGX B200 系统和英伟达 RTX PRO 6000 Blackwell 服

2025-06-06

英伟达发布了一款名为 Llama-3.1-Nemotron-Nano-VL-8B-V1 的视觉语言模型(VLM)。该模型拥有80亿参数,专注于文档智能,能够查询和总结来自物理世界或虚拟世界的图像和视频内容。该模型基于 Llama 3.1 构建。 据介绍,该模型的开发

2025-04-11

英伟达开源了 NVIDIA Llama Nemotron 中最大尺寸的推理模型 Llama-3.1-Nemotron-Ultra-253B-v1,可用于聊天机器人开发、AI Agent 工作流、检索增强生成(RAG)和代码生成等场景。 根据英伟达开放模型许可证及 Llama 3.1 社区许可协议,

2024-07-31

在美国丹佛举行的第51届SIGGRAPH图形大会上,英伟达创始人 CEO 黄仁勋和 Meta 创始人 CEO 马克·扎克伯格举行炉边谈话,讨论了讨论了开源 AI 和 AI 助手的未来。 黄仁勋称赞了Meta的开源大模型,他与扎克伯格都同意应坚持大模型

2025-08-27

TrendForce集邦咨询最新研究,英伟达近日新推出的Jetson Thor能够为机器人提供更强的算力支持,有望带动芯片市场扩容。在Agility Robotics(敏捷机器人)、Boston Dynamics(波士顿动力)、Amazon(亚马逊)等厂商陆续采用与建置生态圈的趋势下

2025-03-20

在今天凌晨的GTC2025主题演讲上,英伟达发布全球首个开源仿人形机器人基础模型 Isaac GR00T N1 和仿真框架。 NVIDIA 创始人兼 CEO 黄仁勋表示:“通用机器人的时代已经到来,借助 NVIDIA Isaac GR00T N1 以及新的数据生成和机器人学习框

2025-07-17

到非常高兴,这真是个非常、非常好的消息。” 二是,英伟达还将发布一款名为RTX Pro的新显卡。黄仁勋表示,“这款显卡非常重要,因为它是专为计算机图形、数字孪生和人工智能设计的。” 而对于为何“大热天穿皮夹克”

2025-03-20

NVIDIA 宣布与 Google DeepMind 和 Disney Research 合作,共同开发开源物理引擎 Newton,可让机器人学习如何以更高的精度处理复杂任务。 Newton 基于 NVIDIA Warp 框架构建,将针对机器人学习进行优化,并与 Google DeepMind MuJoCo 和 NVIDIA Isaac

2023-10-19

(的前两天),相约开源PHP办公室,我们一起聊 AI!>>> 英伟达发布了 Windows 版本的 TensorRT-LLM 库,称其将大模型在 RTX 上的运行速度提升 4 倍。 GeForce RTX 和 NVIDIA RTX GPU 配备了名为 Tensor Core 的专用 AI 处理器,正在为超过 1 亿

2025-04-08

模型因其高效推理能力和低成本训练受到全球关注,也对英伟达等芯片企业形成了前所未有的冲击。 英伟达公司年度开发者大会于3月17日至21日在美国加利福尼亚州圣何塞召开。公司首席执行官黄仁勋在主题演讲中说,随着AI行

2025-08-20

英伟达与佐治亚理工学院研究人员联合发布《Small Language Models are the Future of Agentic AI》论文,提出了一个极具颠覆性的观点:SLM(小型语言模型)才是智能代理(Agentic AI)的未来。 https://arxiv.org/pdf/2506.02153 论文核心观点总结

2025-04-17

4月16日,英伟达向美国证监会(SEC)提交一份正式文件。 文件显示,自4月9日起,美国政府已通知英伟达,公司“对华特供版”AI芯片产品H20 GPU(人工智能加速计算处理器)出口至中国及D:5国家(包括中国大陆及香港、澳门等

2025-04-09

英伟达宣布推出 KAI Scheduler 的开源版本,这是一种 Kubernetes-native GPU 调度解决方案,现已在 Apache 2.0 许可证下提供。 KAI Scheduler 最初在 Run:ai 平台中开发,现在可供社区使用,同时继续作为 NVIDIA Run:ai 平台的一部分