快手开源"Auto Think"大模型,可根据问题自动调节思考深度


快手 Kwaipilot 团队宣布开源 KwaiCoder-AutoThink-preview 自动思考大模型,针对近期深度思考大模型存在的“过度思考”问题进行了深入研究。

团队不仅提出了一种全新的自动思考模型训练范式,还基于传统强化学习算法(GRPO),创新性地提出了带有过程监督的强化学习方法 Step-SRPO,以进一步提升模型在复杂任务中的表现。

该模型融合了”思考“和”非思考“能力,并具备根据问题难度自动切换思考形态的能力。通过进行这种思考形态训练,模型在多个“思考”和“非思考”评测榜单上均实现了性能提升,其中在部分代码和数学类的任务上,开启自动思考模式下的模型得分提升高达20分左右。更有趣的是,在部分榜单中,即使模型没有开启思考模式,受益于更优的推理形态,性能也有小幅上涨。

Kwaipilot 团队表示,未来将基于 preview 版本模型,进一步增强推理能力,支持更完善的思考中工具使用能力,并将全部技术细节、训练方法开源。

模型开源地址:https://huggingface.co/Kwaipilot/KwaiCoder-AutoThink-preview


相關推薦

2025-06-12

火山引擎正式发布了豆包大模型1.6、豆包·视频生成模型 Seedance 1.0 pro、豆包·语音播客模型。 全新发布的豆包大模型1.6系列由三个模型组成: doubao-seed-1.6:All-in-One 的综合模型,是国内首个支持256K 上下文的思考模型,支

2025-04-26

字节跳动方面宣布,其火山引擎边缘大模型网关已全面支持豆包 1.5・深度思考模型。 即日起,用户可以在边缘大模型网关使用豆包全系列模型,并享受 200 万 tokens 免费额度,只要在网关访问密钥使用了本次新增的豆包大模型

2025-04-22

称是“当前业界唯一的基于全国产算力训练的深度推理大模型”, 本次升级有这些关键信息⬇️ ✨实现了数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务效果显著提升,在模型参数比业界同类模型小一个

2023-09-29

负责研发的电力行业人工智能创新平台及自主可控电力大模型正式公开发布。 电力行业人工智能创新平台提供模型即服务(MaaS),支持模型快速迭代开发,并支撑电力人工智能资源面向全社会开放共享。百度提供了昆仑芯AI芯

2024-07-07

在2024世界人工智能大会上,快手高级副总裁、主站业务与社区科学负责人盖坤宣布,快手文生图大模型可图(Kolors)正式开源。该模型基于数十亿图文对进行训练,支持256的上下文token数,支持中英双语,技术细节参考技术报告

2025-05-09

决多样化复杂问题。 据介绍,基于阿里自研的推理大模型和夸克每天处理数十亿次的搜索请求,夸克 “深度搜索” 拥有超高的“搜商”。首先,它能够深入分析用户提出的复杂问题,逐步分析问题并进行充分地思考,从而

2025-05-23

推出大规模、可漫游的3D场景生成模型。 腾讯重申拥抱开源,已实现图像、视频、3D、文本等全模态开源,未来将持续推出多尺寸模型并开源更多多模态基础模型及插件。 腾讯也正在推广其AI IDE“Genie IDE”,目前已开放预约

2025-04-01

模型。其中核心链路的模型和技术,智谱将于4月14日正式开源。 「AutoGLM沉思」体现了智谱对AI Agent的核心理解:让机器不仅能够思考,还能主动行动,实现「边想边干」的目标。 这一能力的实现依赖于三个关键特性: 深度

2025-05-10

快手推出了基于多模态大模型的创新方案 KuaiMod,旨在优化短视频平台生态并提升用户体验。 KuaiMod 的核心在于其对短视频内容的质量判别。传统的内容判别方法往往依赖于静态规则和人工标注,成本高且难以应对用户偏好的动

2025-05-22

Context Protocol, MCP)定义的原生 SDK 支持,以便更轻松地与开源工具集成。 详情查看:https://mp.weixin.qq.com/s/NCcmWcgZGEY6Qrg3yZSRCg

2025-06-21

Ollama 最新版本已支持 RWKV7-G1 和 RWKV-7-World 系列模型。 3 月初,随着 RWKV 社区成员 @MollySophia 的 PR 被合并,llama.cpp 正式支持 RWKV-7 模型。Ollama 近期更新了最新版 llama.cpp,因此同步支持 RWKV-7 架构和对应模型。 Ollama 官方模型仓库

2025-04-17

stc 更新至 1.81 版本; 仓库更新了部分用户反馈第三方开源软件包; qemu 适配 LoongArch64 架构; glibc icu 合入 GB18030-2022 国家标准支持。 【DDE】 新增智能镜像源功能可通过控制中心更新-更新设置进行管理; 控制

2025-04-19

功能。理想汽车通过实验发现,在多轮对话场景下,部分开源深度思考模型存在强行关联用户上文无关输入的问题,导致回复中包含不相关信息,影响用户体验。而MindGPT3.0则能够自主对历史对话进行反思,有效过滤与当前问题

2025-06-07

6月6日,快手旗下可灵AI上线一周年。快手官网信息显示,可灵AI在推出10个月之后(即今年3月)的年化收入运行率(Annualized Revenue Run Rate)突破1亿美金,其今年4月和5月的月度付费金额均超过1亿元。 从收入构成来看,目前P(