Together AI 和 Agentica 联手发布开源模型 DeepCoder-14B-Preview


知名大模型训练平台Together AI和智能体平台Agentica联合开源了新模型DeepCoder-14B-Preview。

DeepCoder在Deepseek-R1-Distilled-Qwen-14B基础之上,通过分布式强化学习(RL)进行了微调。该模型只有140亿参数,但在知名代码测试平台LiveCodeBench的测试分为60.6%,高于OpenAI的o1模型(59.5%),略低于o3-mini(60.9%)。在Codeforces、AIME2024上的评测数据同样非常出色,几乎与o1、o3-mini差不多。

值得一提的是,Together AI不仅开源了DeepCoder-14B模型权重,还把训练数据集、训练方法、训练日志和优化方法全部公开,帮助开发者更深度的了解这个模型所有开发流程。

  • 开源地址:https://huggingface.co/agentica-org/DeepCoder-14B-Preview
  • GItHub:https://github.com/agentica-project/rllm

相關推薦

2025-08-02

Black Forest Labs与AI初创公司Krea携手推出开源图像生成模型FLUX.1-Krea [dev],该模型专注于解决当前AI生成图像中普遍存在的"人工痕迹"问题。 FLUX.1-Krea [dev] 的核心设计理念是摆脱传统AI生成图像的"塑料感"和过度处理效果。许多现有

2023-06-10

TOGETHER 宣布其 RedPajama 7B 已完成所有训练,并在 Apache 2.0 许可下全部开源。 RedPajama 是一个开源可商用大模型项目,由 TOGETHER 联合蒙特利尔大学的 AAI CERC 实验室、EleutherAI 和 LAION 共同发起。目前包括一个基于 LLaMA 论文的 RedPajama

2025-08-15

香港大学 XLANG Lab 联合月之暗面、斯坦福大学等机构,正式开源了一个名为 OpenCUA 的完整框架,旨在帮助开发者低门槛地构建和扩展 CUA(Computer-Use Agent,计算机使用智能体)。 该框架包括: 无缝捕获人类计算机使用演示的

2024-10-31

定制 RISC-V 内核在 英伟达硬件中的普遍性。 高通与三星联手 高通加倍致力于 RISC-V,并利用此次峰会介绍了改进 RISC-V 指令集架构的新方法。该公司还参加了与英伟达和其他技术领导者的小组讨论,探讨了 AI 开发与安全计算之

2025-06-17

独角兽 Turing:1.11亿美元E轮融资,估值22亿美元[18] Together AI:3.05亿美元B轮融资,估值33亿美元[19] 2.3 商业模式创新 订阅制成为主流 大多数AI编程工具采用月度订阅模式,价格区间从免费到每月39美元不等。GitHub Copilot在20

2025-05-15

理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

2025-04-11

斯坦福大学、耶鲁大学、南加州大学等研究人员联合开源了用于定位代码问题的 AI Agent —— LocAgent。 开源地址:https://github.com/gersteinlab/LocAgent 论文地址:https://arxiv.org/pdf/2503.09089 在软件开发和维护领域,代码定位是开发

2025-08-28

Futurewei、LF AI & Data 和 LF Research 联手,调研了全球主权 AI 的发展状况。 本研究基于对 233 名受访者的调查及行业领袖的专家见解,揭示主权 AI(即在开发 AI 能力时最大限度减少对外部主体的依赖)已成为各国及组织机构的战

2025-05-01

理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。 MiMo推理能力的提升,由预训练和后训练阶段中数据和算法等多层面的创新联合驱动,包括: 预训练:核心是让模型见过更多推理模式 数据:着重挖掘富

2025-07-10

的优异成绩,领先于Qwen2.5-VL-72B-Instruct、InternVL3-78B、QVQ-72B-Preview等开源模型。

2023-08-05

华为开发者大会 2023 (HDC.Together) 今日开启。 大会上,华为正式发布 HarmonyOS 4(鸿蒙 4)操作系统。据悉,全新的 HarmonyOS 4 在隐私安全、AI 大模型能力和个性交互等方面有全新突破。 华为介绍称,HarmonyOS 4 的小艺是首个具备 AI

2025-07-24

具转变为主动的教育助手的尝试。这一动向与OpenAI的Study Together和Google的Guided Learning等项目相呼应,显示出头部AI公司正在激烈争夺教育市场。

2023-02-27

GNOME 和 KDE 两大桌面环境项目近日宣布了一项提案:他们通过向 Flathub 应用商店添加支付、捐赠和订阅功能,以促进 Linux 桌面社区的多样性和可持续性。 多年来,GNOME 和 KDE 一直在共同构建和发展 Flathub,将其作为供应商中立

2025-08-12

该插件支持各种提供商,包括 DeepSeek、智谱 AI、OpenAI、Together AI、Mistral、Anthropic、Grok、Google Gemini、Ollama、Stability AI,以及通过 API 自定义的提供商。 提问:可以离线使用 AI 模型吗? 可以,使用 LM Studio、Ollama 等提供商,您