DeepSeek 透露下一代国产芯片即将发布


深度求索官方今日正式对外发布 DeepSeek-V3.1,官方提到 DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的参数精度。

在 DeepSeek 官方公众号文章页面,DeepSeek 进一步解释称:UE8M0 FP8 是针对即将发布的下一代国产芯片设计

FP 英文全称为 Floating Point,是 IEEE 定义的标准浮点数类型。UE8M0 FP8 在 AI 模型领域代表一种模型精度。

DeepSeek V3.1 的 Base 模型在 V3 的基础上重新做了外扩训练,一共增加训练了 840B tokens。Base 模型与后训练模型均已在 Huggingface 与魔搭开源。

Base 模型:

  • Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

  • 魔搭:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base

后训练模型:

  • Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-V3.1

  • 魔搭:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1


相關推薦

2025-08-26

页面,DeepSeek 进一步解释称:UE8M0 FP8 是针对即将发布的下一代国产芯片设计。 FP 英文全称为 Floating Point,是 IEEE 定义的标准浮点数类型。UE8M0 FP8 在 AI 模型领域代表一种模型精度。 人工智能领域的企业家与技术专家、清华大

2025-07-26

多模态推理模型。在国产芯片32K上下文推理效率最高可达DeepSeek R1的300%,在英伟达H800芯片将推理效率提升了70%以上。该模型将于7月31日向全球开源。 此外,阶跃星辰宣布与上海国有资本投资有限公司达成深度战略合作,并透

2025-05-17

小米集团创始人雷军发布微博透露,造芯十年,小米自主研发设计的手机SoC芯片名字叫“玄戒O1”,将在5月下旬发布。 和大家分享一条消息: 小米自主研发设计的手机SoC芯片,名字叫 玄戒O1,即将在5月下旬发布。 感谢大

2025-08-22

据报道,英特尔正在筹备下一代人工智能架构,Jaguar Shores 将成为该公司首款采用 18A 和 HBM4 的机架规模解决方案,目前相应的开发板已在网上曝光,展示了相当优雅的设计。 由于未能在市场上提供具有竞争力的解决方案,英

2025-06-14

的推理性能提升,为 AI 开发者提供了强大的技术支持。 下一代旗舰 AI 芯片 MI400 Instinct MI400系列是 AMD 下一代旗舰 AI 芯片,预计将搭载高达432GB 的 HBM4高速显存,内存带宽可达300GB/s。MI400在 FP4精度下的计算性能可达到40petaflops

2025-08-05

性能和稳定性,适配昇腾、英伟达、沐曦、海光,支持 DeepSeek、Qwen、GLM、Kimi 等模型。 Chitu(赤兔)是由清华系 AI Infra 明星创企——清程极智联合清华大学团队发布的开源项目。赤兔定位于「生产级大模型推理引擎」,充

2025-06-28

根据《The Information》的报道,DeepSeek 工程师在过去几个月一直致力于完善 R2 模型,但梁文锋对 R2 现在的性能还不满意,工程师团队仍在全力优化和打磨,发布时间待定。梁文峰要求模型达到更出色的结果才批准发布。 此外,

2025-07-30

美国得克萨斯州新建的巨型工厂将专门用于生产特斯拉的下一代 AI6 芯片(注:特斯拉汽车智驾芯片),并称“其战略重要性毋庸置疑”。 马斯克还称,三星目前正在生产 AI4 芯片。台积电将首先在中国台湾地区生产刚刚完成

2025-04-25

避免步其后尘。 目前,OpenAI面临来自包括中国AI实验室DeepSeek在内的开源策略竞争者的挑战。这些"开源"竞争者将模型提供给AI社区用于实验,在某些情况下还允许商业化使用,与OpenAI此前更为封闭的做法形成鲜明对照。 这种开

2025-06-28

我自己用的也是玄戒的手机,现在体验特别好”。 雷军透露,第二代玄戒芯片会考虑在车上应用。“第一代主要是验证技术,技术好到我无法相信”。 “我们这几款手机和平板备货都很少,我也看到一些说我们卖不动,瞎扯

2025-04-08

的问题。 AI推理时代即将到来? 今年年初,中国AI公司DeepSeek模型的横空出世在AI领域掀起巨浪,R1模型因其高效推理能力和低成本训练受到全球关注,也对英伟达等芯片企业形成了前所未有的冲击。 英伟达公司年度开发者大

2025-03-26

的鲲鹏和飞腾以及国外都有基于ARM架构的产品。 近日,DeepSeek的开源实践,推动了人工智能技术的普及和应用。在算力领域,开源同样带来了生态的繁荣。例如,鲲鹏联合超过6000家合作伙伴构建的“技术乐高”模式,就证明了

2025-05-20

超现有产品的AI助手。 03 人机交互的未来:语音、AR 与下一代硬件 问:你怎么看未来5到10年人类与计算的关系?我们还会用键盘输入、对着屏幕操作吗?还是说,交互将彻底改变? 皮查伊:过去几十年,都是人类在适应计

2025-08-09

将集中力量攻关AI5、AI6等后续核心芯片。" 据内部人士透露,此次战略调整涉及重大人事变动。Dojo项目负责人Peter Bannon将于近期离职,其团队成员将转岗至数据中心及计算集群相关岗位。该项目自2019年启动以来,被马斯克视