Mistral AI 发布 Devstral2507 系列


Mistral AI 与 All Hands AI 合作,推出了针对开发者的大型语言模型 Devstral2507系列,包含两款新模型:Devstral Small1.1和 Devstral Medium2507。

这些模型旨在支持基于智能代理的代码推理、程序合成和结构化任务执行,适用于大型软件代码库的实际应用。这次发布在性能和成本上进行了优化,使其在开发工具和代码自动化系统中具有广泛的应用潜力。

Devstral Small1.1是一款开源模型,基于 Mistral-Small-3.1基础模型,拥有约240亿个参数。该模型支持128k 的上下文窗口,能够处理多文件代码输入和复杂的长提示,符合软件工程工作流程的特点。此版本特别针对结构化输出进行微调,包括 XML 和函数调用格式,使其与 OpenHands 等代理框架兼容,适合程序导航、多步骤编辑和代码搜索等任务。Devstral Small1.1的许可为 Apache2.0,支持研究和商业用途。

在性能测试方面,Devstral Small1.1在 SWE-Bench Verified 基准测试中获得53.6% 的成绩,证明其在为真实的 GitHub 问题生成正确补丁方面表现优异。虽然其性能不及大型商业模型,但在大小、推理成本和推理能力之间找到了一个平衡点,适合多种编码任务。

此外,该模型以多种格式发布,包括可以在高内存 GPU(如 RTX4090)或32GB RAM 以上的 Apple Silicon 机器上进行本地推理的量化版本。同时,Mistral 还通过其推理 API 提供模型,当前的收费标准与 Mistral-Small 系列模型相同。

Devstral Medium2507则仅通过 Mistral API 或企业部署协议提供,并不开放源代码。该模型在 SWE-Bench Verified 基准测试中得分为61.6%,在长上下文的推理能力上表现出色,能够超越一些商业模型,如 Gemini2.5Pro 和 GPT-4.1。此模型的 API 收费标准高于 Small 版本,但其强大的推理能力使其非常适合在大型代码库中执行任务。

Devstral Small 更适合本地开发、实验或集成到客户端开发工具中,而 Devstral Medium 则在结构化代码编辑任务中提供更高的准确性和一致性,适合需要高性能的生产服务。两款模型的设计都支持与代码代理框架的集成,使其能够简化测试生成、重构和错误修复的自动化工作流程。


相關推薦

2025-05-23

I(OpenDevin 的创建者)合作,推出了全新的开源语言模型 Devstral。这款拥有2400万参数的轻量级模型,专为代理 AI 软件开发而设计,其性能甚至在特定基准测试中超越了许多参数高达数十亿的竞争对手,包括一些闭源模型。 与传

2025-07-26

Mistral AI发布了Magistral Small 1.1(版本号 Magistral-Small-2507),这是一个拥有240亿参数的小型高效推理模型。 该模型在Mistral Small 3.1 (2503)的基础上,通过Magistral Medium的轨迹进行SFT和RL训练,增加了推理能力,并优化了格式和模型行

2025-07-17

Mistral AI 宣布推出其首个针对企业的音频模型系列 Voxtral。包含两种规模:适用于生产规模应用的 24B 版本,以及适用于本地和边缘部署的 3B 版本。两个版本均基于 Apache 2.0 许可证发布。 公告称,Voxtral 解决了开发者需要在低成

2025-06-12

Mistral 宣布推出其首个推理模型系列 Magistral,采用 step-by-step 的方式,以提高数学和物理等主题的一致性和可靠性。 Magistral 有两种版本:Magistral Small 和 Magistral Medium。Magistral Small 拥有 240 亿个参数,在 Apache 2.0 协议下开

2025-05-09

法国 AI 初创公司 Mistral 发布了新的 AI 模型 Mistral Medium 3,该模型注重效率,同时不影响性能。据介绍,在各项基准测试中,该模型性能达到或超过 Claude Sonnet 3.7 的 90%,而成本显著更低(每百万 token 输入 0.4 美元/输出 2 美元)

2023-09-30

法国人工智能初创公司 Mistral AI 宣布推出其首款大语言模型 Mistral 7B 是一个,号称是迄今为止同规模产品中最强大的语言模型;在 Apache-2.0 许可下开源,可完全免费使用,不受任何限制。 Mistral AI 是一个成立仅六个月的初创

2025-08-12

n团队宣布,Qwen3-30B-A3B-2507 和 Qwen3-235B-A22B-2507 系列模型现已支持高达100万token的超长上下文处理。 此次升级集成了两项关键技术:Dual Chunk Attention (DCA) 和 MInference。 DCA 是一种长度外推方法,能将长序列

2024-07-18

法国人工智能初创公司 Mistral 以其强大的开源人工智能模型而闻名。今天,该公司在其不断壮大的大型语言模型 (LLM) 家族中推出了两个新产品:一个是基于数学的模型,另一个是面向程序员和开发人员的代码生成模型,

2025-06-11

根据CNBC的报道,法国AI初创公司Mistral将推出其首个推理模型Magistral,加入与OpenAI、DeepSeek等全球领先企业的竞争。 Mistral首席执行官亚瑟・门施介绍道,Magistral不仅擅长数学和编码,还能够实现欧洲语言的逻辑推理,突破了美

2025-07-31

Qwen3-30B-A3B 模型迎来了新版本:Qwen3-30B-A3B-Instruct-2507。 这是一个非思考模式(non-thinking mode)的新模型,仅激活3B参数,就能取得可媲美 Gemini 2.5-Flash(non-thinking)、GPT-4o等顶尖闭源模型的超强性能。 Qwen3-30B-A3B-Instruct-2507&nb

2024-07-26

布最强开源大模型 Llama 3.1 后,法国 AI 初创公司 Mistral AI 也加入了竞争,今天发布了全新的旗舰开源模型 Mistral Large 2。 该模型拥有 1230 亿个参数,可在单个 H100 节点上以高吞吐量运行,在代码生成、数学、推理等方面

2025-03-20

Mistral AI 现已开源发布全新轻量级 AI 模型 Mistral Small 3.1。Mistral Small 3.1 能够处理文本和图像,参数仅为 240 亿。该模型提高了文本能力和多模态理解能力,并具备 128K 上下文窗口。 核心特性 轻量级部署:可在 单个 RTX 4090

2025-07-15

据彭博社报道,苹果将Mistral视为潜在的收购对象,以弥补其在生成式AI领域(如Siri)的不足 。 Mistral AI是欧洲估值最高的AI初创企业,目前估值约€5.8亿(约$6.2亿),已融资约€1.1亿(约$1.2亿),并正在洽谈新一轮高达$1亿的

2025-08-06

Mistral AI近日发布了一份详尽的环境影响评估报告,首次全面披露了其旗舰模型Mistral Large2在整个生命周期中的真实环境代价。 这份报告由Mistral AI携手企业ESG咨询公司Carbone4以及法国生态转型机构ADEME共同完成,采用了严格的科