DeepSeek 即将联合 vLLM 开源推理引擎 (DeepSeek Inference Engine)


DeepSeek 在其 GitHub 仓库发布预告称,即将开源推理引擎 DeepSeek Inference Engine

考虑到代码分支和维护资源等问题,他们选择了直接和 vLLM 等现有开源项目合作的方式进行开源。

下面是官方公告:

几周前,在开源周期间,我们开源了几个库。社区的反应非常积极——激发了许多鼓舞人心的合作、富有成效的讨论和宝贵的错误修复。

受到这一鼓舞,我们决定再迈出一大步:将我们的内部推理引擎贡献给开源社区

我们对开源生态系统深表感激,没有它,我们向通用人工智能(AGI)的进步将不可能实现。我们的训练框架依赖于 PyTorch,我们的推理引擎建立在 vLLM 之上,这两者都在加速深度探索模型的训练和部署方面发挥了至关重要的作用。

随着对部署 DeepSeek-V3 和 DeepSeek-R1 等模型的需求不断增长,我们希望尽可能地为社区做出贡献。虽然我们最初考虑开源我们的完整内部推理引擎,但我们发现了一些挑战:

  • 代码库改动大:我们的引擎基于一年多前的 vLLM 早期分支。尽管结构相似,但我们已经为 DeepSeek 模型进行了大量定制,这使得它难以扩展到更广泛的应用场景。
  • 基础设施依赖:该引擎与我们的内部基础设施紧密耦合,包括集群管理工具,这使得在没有重大修改的情况下进行公开部署变得不切实际。
  • 维护资源有限:作为一个专注于开发更好模型的中小研究团队,我们缺乏维护大型开源项目的资源。

鉴于这些挑战,我们决定与现有的开源项目合作,作为更可持续的替代方案。

未来,我们将与现有的开源项目紧密合作,以:

  • 提取独立功能:模块化并贡献可重用的组件作为独立库。
  • 分享优化:直接贡献设计改进和实现细节。

详情查看:

https://github.com/deepseek-ai/open-infra-index/blob/main/OpenSourcing_DeepSeek_Inference_Engine/README.md


相關推薦

2025-04-09

Xorbits Inference(Xinference)是一个 性能强大且功能全面的 分布式 推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地 一键部署你自己的模型或内置的前沿开源

2025-03-25

Xorbits Inference(Xinference)是一个 性能强大且功能全面的 分布式 推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地 一键部署你自己的模型或内置的前沿开源

2024-07-10

🎉 Xinference v0.13.0 正式发布!Apple M系列专用后端 MLX 来临,Mac 上加速高达 40% 🚀。目前已支持 qwen2 和 gemma-2。阿里云镜像也如约而至,且容量大幅缩减,解决大家在国内拉取 docker 的痛点。详细更新内容如下: - 新增内置支持

2024-10-04

Xorbits Inference(Xinference)是一个 性能强大且功能全面的 分布式 推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地 一键部署你自己的模型或内置的前沿开源

2024-08-15

Xorbits Inference(Xinference)是一个 性能强大且功能全面的 分布式 推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地 一键部署你自己的模型或内置的前沿开源

2024-10-24

Xorbits Inference(Xinference)是一个 性能强大且功能全面的 分布式 推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地 一键部署你自己的模型或内置的前沿开源

2024-10-16

Xorbits Inference(Xinference)是一个 性能强大且功能全面的 分布式 推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地 一键部署你自己的模型或内置的前沿开源

2025-04-08

的问题。 AI推理时代即将到来? 今年年初,中国AI公司DeepSeek模型的横空出世在AI领域掀起巨浪,R1模型因其高效推理能力和低成本训练受到全球关注,也对英伟达等芯片企业形成了前所未有的冲击。 英伟达公司年度开发者大

2025-04-30

6)、AIME'24(85.7)、LiveCodeBench v5(70.7)等测试中,优于DeepSeek-R1、o1、Grok-3等模型,仅在AIME'25(81.5)略低于Gemini-2.5-Pro(86.7)。 Qwen3-30B-A3B:在ArenaHard(91.0)、AIME'24(80.4)等测试中,超越QwQ-32B(激活参数为其10倍)。 Qwen3

2024-08-07

Xorbits Inference(Xinference)是一个 性能强大且功能全面的 分布式 推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地 一键部署你自己的模型或内置的前沿开源

2025-04-25

避免步其后尘。 目前,OpenAI面临来自包括中国AI实验室DeepSeek在内的开源策略竞争者的挑战。这些"开源"竞争者将模型提供给AI社区用于实验,在某些情况下还允许商业化使用,与OpenAI此前更为封闭的做法形成鲜明对照。 这种开

2025-04-24

Xorbits Inference(Xinference)是一个 性能强大且功能全面的 分布式 推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地 一键部署你自己的模型或内置的前沿开源

2025-03-26

上新!DeepSeek-V3重磅升级 昨夜,DeepSeek-V3迎来一波更新,升级至「DeepSeek-V3-0324」版本。 不仅将模型参数量由原版的671B提升至685B,编程、数学等推理思考能力大幅提升,性能表现可以与Claude 3.5/3.7 Sonnet相媲美。同时,模型的开

2025-04-11

关注的是,英伟达新模型的性能逼近拥有 6710 亿参数的 DeepSeek R1,但只用了不到一半的参数量。 测试结果显示,GPQA(76 vs. 71.5)、IFEval 指令遵循(89.5 vs. 88.8)和 LiveCodeBench 编码任务(66.3 vs. 65.9)。并且,Llama-3.1-Nemotron-Ultra-25