DeepSeek V3 模型更新,大幅提升编程能力


北京时间 3 月 24 日晚,DeepSeek 「突然」发布了模型更新。

但暂时还不是 DeepSeek V4 或 R2,而是 DeepSeek V3 模型的一次更新。

目前,其开源版本目前已经上架开源网站。其开源版本模型体积为 6850 亿参数。

https://huggingface.co/deepseek-ai/DeepSeek-V3-0324

深度求索微信官方公众号也确认,本次更新属于小版本升级,目前已经在官方网页、App 小程序等入口开放。

初代 V3 模型最为人所熟知的,可能还是「557.6万美金比肩Claude 3.5效果」的超级性价比。而更新后的模型由其新的 32KGPU 集群上改进的后训练提供支持。

截至目前,还没有任何关于新版 DeepSeek V3 的能力基准测试榜单出现,但有了 DeepSeek V3 发布即成为 Chatbot Arena 榜单前十中唯一一个开源模型的刷榜历史,还是在发布一小时后迅速吸引来全球用户对其测试体验。

根据目前最新的用户上手测试,新版 V3 模型前端编码能力的提升,是目前「感知最强」的部分。根据专业用户对新版 V3 的综合体验判断,V3-0324 的提升幅度大约相当于 Sonnet 3.5 到 Sonnet 3.6 的提升。

用户按照下面的提示词,同时对新版 V3 与 R1 下达任务,实际产出的效果已经出现巨大差异。

创建一个包含 CSS 和 JavaScript 的单个 HTML 文件,以生成一个动画天气卡片。卡片应通过不同的动画直观地表示以下天气条件:风:(例如,移动的云朵、摇曳的树木或风线)雨:(例如,落下的雨滴、形成的水坑)晴:(例如,闪耀的光线、明亮的背景)雪:(例如,落下的雪花、积雪)并排显示所有天气卡片。卡片应具有深色背景。在此单个文件中提供所有 HTML、CSS 和 JavaScript 代码。JavaScript 应包含一种在不同天气条件之间切换的方法(例如,一个函数或一组按钮),以演示每种天气的动画。

左侧是 DeepSeek 新版 V3 模型的生成结果,右侧为 R1 的生成结果。

除了编程能力,在其他用户的测试中,新版 V3 在多轮对话中体现出了更强的上下文理解能力。

从网友反馈的实测效果来看,V3-0324 有这些提升:

  • 编码能力已经接近 Claude3.7 了,比之前的老版本 v3 能力要强;
  • 提升幅度大约与 Sonnet 3.5 到 Sonnet 3.6 一样,甚至还要大一点;
  • 与 R1 相比,V3-0324 在生成前端代码方面有了明显改进;
  • 数学能力也有提升,能像推理模型一样能够解题。

当然,与往常一样,DeepSeek 也没有同时公开表示 R2 或者 V4 模型会在何时发布,但不少用户在体验过新版 V3 后,都觉得似乎 R2 的到来,也已经不远了。

还有一个让开源社区非常兴奋的改变。新版 V3 的开源许可与 R1 一样,也更新变成了 MIT 开源许可(MIT License),这意味着新版 V3 有着比初代 V3 更宽松的开源使用条件。


最后,奉上 DeepSeek V3 最新版的免费体验地址,由模力方舟提供:

https://ai.gitee.com/serverless-api/packages/1917?model=DeepSeek-V3&package=1917

模力方舟的 Serverless API 提供了视频生成、文本生成、视觉模型、图像生成与处理、文档处理/OCR、自动语音识别、语音合成、特征抽取、代码生成、风控识别十大类共 58 款各领域的顶尖开源模型的在线体验和 API 使用。通过购买模型资源包,即可通过极低的价格即可尽享众多主流模型。


相關推薦

2025-03-27

DeepSeek-V3 模型近日进行了更新,虽然大家都说更新后的 DeepSeek-V3-0324 强到没边——哪怕叫 DeepSeek V3.5 也不为过,但官方仍低调地称其是“小版本升级”。 下面是官方针对 DeepSeek-V3-0324 发布的更新说明。 DeepSeek V3 模型已完成

2025-03-26

上新!DeepSeek-V3重磅升级 昨夜,DeepSeek-V3迎来一波更新,升级至「DeepSeek-V3-0324」版本。 不仅将模型参数量由原版的671B提升至685B,编程、数学等推理思考能力大幅提升,性能表现可以与Claude 3.5/3.7 Sonnet相媲美。同时,模型的开

2025-04-03

队一直在等待国内有能力支持 AutoDev 的国产模型,直到 DeepSeek V3-0324出现。 AutoDev 开源已有两年时间,如今已经进化成集成度最好的 JetBrains IDE 上的第二代 AI 编程工具,支持主流的 Intellij IDEA、WebStrom、Clion 等 IDE,还有基于 Intel

2025-03-27

,方便管理三方应用接入、授权、日志 AI组件支持接入DeepSeek,支持DS推理 PC前端:角色管理支持配置角色人员、菜单资源支持配置移动端菜单、确认删除提示支持明确哪条数据等 devtools工具:创建模型时支持导入视图、

2025-04-10

地安全运行的同时,显著提升了 AI 助手环境感知能力与 deepseek 指令理解能力,极大地影响了任务执行效率和准确度。 一、强化本地运行安全保障 在数据安全备受重视的当下,Wisdom SSH 1.2.6 版本将所有分析过程设定在本地运

2025-04-18

库对接 支持 AI 模型 AI 大模型 支持 DeepSeek √ ChatGTP √ Qwq √ 智库 √ Ollama 本地搭建大模型 √ 等等。。 √ AIGC 应用平台介绍 JeecgBoot 平台的 AIGC 功能模块,是一套类

2023-07-27

GLM 技术团队宣布开源最新的代码模型 CodeGeeX2-6B。CodeGeeX2 是多语言代码生成模型 CodeGeeX 的第二代模型,基于 ChatGLM2 架构注入代码实现。 我们希望每一位程序员,都能在自己机器上跑上一个自己的编程助手。为实现这一目标

2025-03-27

低服务器资源占用,同时深度融合各种大模型如智谱AI 、DeepSeek 等,开放 linux 一键部署。 它可以提供标准的文本翻译API,一方面可以配合 translate.js 进行使用,另一方面如果你需要文本翻译,完全可以使用它,而不用再

2025-04-09

B     💰 Fin-R1(金融领域)      🧐 Deepseek-VL2 ✨ 新功能     新增 n_worker 校验机制,若超出可用 worker 数量,则拦截避免错误 🚧     Fin-R1 模型支持 GPTQ(int4, int8)和 FP8   SGLang 引

2025-04-08

的问题。 AI推理时代即将到来? 今年年初,中国AI公司DeepSeek模型的横空出世在AI领域掀起巨浪,R1模型因其高效推理能力和低成本训练受到全球关注,也对英伟达等芯片企业形成了前所未有的冲击。 英伟达公司年度开发者大

2025-03-25

耗,但克里希纳认为,新兴的技术(例如中国初创公司 DeepSeek 展示的方案)能够极大降低AI能耗,使之降到当前能耗的1%以下: 「DeepSeek 已经向我们展示,即使是小型模型也能发挥巨大作用。当然,问题在于我们是否仍需要

2025-04-22

同类模型小一个数量级的情况下,整体效果对标OpenAI o1和DeepSeek R1,再次证明了基于国产算力训练的全栈自主可控大模型具备登顶业界最高水平的实力和持续创新的潜力。 ✨融入了更多场景复杂类型数据,模型的泛化性也取得

2025-04-19

微软今天开源了一款“魔改版”的 DeepSeek-R1 模型「MAI-DS-R1」,其在保留原有推理性能的基础上进行了大幅度增强,尤其是在响应和屏蔽词方面有了显著改进: MAI-DS-R1 可以响应 99.3% 的敏感话题提示,比原版 R1 提升了2倍,这

2025-04-01

AI 基准测试指标上均已领先于 OpenAI、Anthropic、xAI 乃至 DeepSeek。