阿里通义实验室开源检索增强预训练框架 MaskSearch

2025-06-11 發表於开源资讯

阿里通义实验室发布并开源了 MaskSearch 预训练框架，声称能让 AI 学会“主动搜索 + 多步推理”，从而更准确、更智能地回答复杂问题。

根据介绍，MaskSearch 的核心在于它提出的一种全新预训练任务——检索增强掩码预测（RAMP） ，在这个任务中，模型需要填补句子中的掩码部分，并且必须通过主动搜索和多步推理来完成任务。

例如，给定一个句子：

Andrew Barto received his [mask] with distinction in [mask] from the University of Michigan in 1970.

AI 需要通过搜索引擎查找相关信息，逐步推理出被遮盖的部分。模型首先分析上下文，判断需要查找的信息是“学位类型”和“专业方向”。随后，它调用搜索引擎进行查询，得到关于 Andrew Barto 的相关信息，并从中提取出关键片段：“Andrew Barto, B.S., math, University of Michigan, 1970”。

接着，AI 进行推理整合，最终填补掩码输出完整句子：

Andrew Barto received his B.S. with distinction in math from the University of Michigan in 1970。

实验表明，即使是小模型（如 Qwen2.5-1.5B），在经过 MaskSearch 预训练后，也能在多个开放域问答任务中取得显著提升。例如，在 Bamboogle 数据集中性能提升超过 11.78% ，真正做到了“小模型也能挑战大模型”。

阿里通义实验室开源检索增强预训练框架 MaskSearch

相關推薦

阿里开源 WebSailor，检索性能超 DeepSeek R1、Grok-3 等模型

阿里云开源通义千问 720 亿参数模型 Qwen-72B

阿里通义实验室发布 OmniAudio，可从 360° 视频生成空间音频

蚂蚁回应 AI 训练降本：基于不同芯片持续调优，将逐步开源

阿里通义开源音频语言模型 Qwen2-Audio

11Labs 发布对话式 AI 2.0，集成话轮转换和知识库，多语言多角色多模态

阿里通义开源多模态推理模型 HumanOmniV2

阿里发布 Qwen2-Math，超越 GPT-4o

阿里通义开源实首个音频生成模型 ThinkSound

国家天文台基于通义千问打造国际首个太阳大模型“金乌”

阿里云机器学习 PAI 开源中文 NLP 算法框架 EasyNLP，助力 NLP 大模型落地

一觉醒来，发现宇智波佐助在跳芭蕾

EasyCV 开源｜开箱即用的视觉自监督+Transformer算法库

阿里通义千问 Qwen3 全系适配 MLX