Mistral AI 发布 Devstral2507 系列

2025-07-12 發表於开源资讯

Mistral AI 与 All Hands AI 合作，推出了针对开发者的大型语言模型 Devstral2507系列，包含两款新模型：Devstral Small1.1和 Devstral Medium2507。

这些模型旨在支持基于智能代理的代码推理、程序合成和结构化任务执行，适用于大型软件代码库的实际应用。这次发布在性能和成本上进行了优化，使其在开发工具和代码自动化系统中具有广泛的应用潜力。

Devstral Small1.1是一款开源模型，基于 Mistral-Small-3.1基础模型，拥有约240亿个参数。该模型支持128k 的上下文窗口，能够处理多文件代码输入和复杂的长提示，符合软件工程工作流程的特点。此版本特别针对结构化输出进行微调，包括 XML 和函数调用格式，使其与 OpenHands 等代理框架兼容，适合程序导航、多步骤编辑和代码搜索等任务。Devstral Small1.1的许可为 Apache2.0，支持研究和商业用途。

在性能测试方面，Devstral Small1.1在 SWE-Bench Verified 基准测试中获得53.6% 的成绩，证明其在为真实的 GitHub 问题生成正确补丁方面表现优异。虽然其性能不及大型商业模型，但在大小、推理成本和推理能力之间找到了一个平衡点，适合多种编码任务。

此外，该模型以多种格式发布，包括可以在高内存 GPU（如 RTX4090）或32GB RAM 以上的 Apple Silicon 机器上进行本地推理的量化版本。同时，Mistral 还通过其推理 API 提供模型，当前的收费标准与 Mistral-Small 系列模型相同。

Devstral Medium2507则仅通过 Mistral API 或企业部署协议提供，并不开放源代码。该模型在 SWE-Bench Verified 基准测试中得分为61.6%，在长上下文的推理能力上表现出色，能够超越一些商业模型，如 Gemini2.5Pro 和 GPT-4.1。此模型的 API 收费标准高于 Small 版本，但其强大的推理能力使其非常适合在大型代码库中执行任务。

Devstral Small 更适合本地开发、实验或集成到客户端开发工具中，而 Devstral Medium 则在结构化代码编辑任务中提供更高的准确性和一致性，适合需要高性能的生产服务。两款模型的设计都支持与代码代理框架的集成，使其能够简化测试生成、重构和错误修复的自动化工作流程。

Mistral AI 发布 Devstral2507 系列

相關推薦

Mistral 重返开源阵营：发布超高效代码 AI 模型 Devstral

Mistral 发布 Magistral Small 1.1，增强推理能力

Mistral AI 开源 AI 音频模型系列 Voxtral

Mistral 推出首个推理模型系列 Magistral

法国 AI 初创公司 Mistral AI 发布新模型 Mistral Medium 3

Mistral AI 发布 73 亿参数模型，“碾压” Llama 2 13B

阿里通义 Qwen3 开源系列模型支持 100 万 token 超长上下文

阿里通义发布 Qwen3-30B-A3B-Instruct-2507 模型

Mistral AI 发布开源代码大模型 Codestral Mamba、数学大模型 Mathstral

法国 AI 初创公司 Mistral 将发布推理模型 Magistral

Mistral AI 发布 1230 亿参数 Large 2 大模型 —— 狙击 Llama 3.1

光刻机巨头 ASML 领投 Mistral AI 17 亿欧元 C 轮融资

Mistral Small 3.1 开源发布：128K 上下文、多模态、轻量级

苹果考虑收购法国 AI 初创公司 Mistral AI