快手开源 KuaiMod，多模态 AI 专治各种劣质内容

2025-05-10 發表於开源资讯

快手推出了基于多模态大模型的创新方案 KuaiMod，旨在优化短视频平台生态并提升用户体验。

KuaiMod 的核心在于其对短视频内容的质量判别。传统的内容判别方法往往依赖于静态规则和人工标注，成本高且难以应对用户偏好的动态变化。而 KuaiMod 通过构建一个包含1000条真实短视频的数据集，制定了首个面向短视频的内容质量判别基准测试，涵盖了四类主要的劣质内容与15种细粒度内容类型。

通过引入强化学习策略，KuaiMod 能够根据用户反馈不断更新和优化其判别模型，实时掌握平台趋势，从而实现对新出现的劣质内容的精准识别。

初步测试显示，KuaiMod 在内容质量判别上的整体准确率高达92.4%，相比其他方案提升超过10%。该方案已在快手平台全面部署，为数以百万计的新视频提供质量判别服务，显著降低了用户举报率，展现出强大的市场潜力。

目前，KuaiMod 的评测标准和技术方案论文已经开源。

相關推薦

快手开源多模态大模型 Kwai Keye-VL

2025-06-28

快手宣布并开源其最新自研的多模态大语言模型 Kwai Keye-VL。根据介绍，Kwai Keye-VL 以 Qwen3-8B 语言模型为基础，引入了基于开源 SigLIP 初始化的 VisionEncoder，能够深度融合并处理文本、图像、视频等多模态信息，凭借其创新的自适

中国开源 AI 社区 7 月高亮时刻回顾

2025-08-05

、中国电信人工智能研究院（1个）、蚂蚁集团（4个）、快手（1个）、捏Ta（1个）、磐石（3个）、上海交通大学（1个）、腾讯（1个）、上海人工智能实验室（1个）、复旦大学（1个）。 1、阿里（9个）：编程模型Qwen3-Coder-30B-A3

快手文生图大模型可图宣布开源

2024-07-07

在2024世界人工智能大会上，快手高级副总裁、主站业务与社区科学负责人盖坤宣布，快手文生图大模型可图（Kolors）正式开源。该模型基于数十亿图文对进行训练，支持256的上下文token数，支持中英双语，技术细节参考技术报告

Xinference 0.14.1发布：文生视频 CogVideoX 等新功能齐上阵！

2024-08-15

！本周爆火的文生图模型 FLUX.1 系列，支持中文提示词的快手生图，还有 SenseVoice 语音识别，都在本版本得到支持。图一、图二：由FLUX.1-dev生成 - 新增内置支持模型 📦 - flux.1-schnell 和 flux.1-dev 🌟 - llama-3.1-instruct 4

11Labs 发布对话式 AI 2.0，集成话轮转换和知识库，多语言多角色多模态

2025-06-04

模型发布，拥有卓越的动态效果表现，更强的语义响应快手可灵 AI 发布了其 KLING 2.1 系列视频模型。据悉，可灵 2.1 系列拥有标准版和大师版两个版本模型：标准版支持标准（720P）和高品质（1080P）两种模式。价格方面，标准

Jina AI 开源多模态多语言向量模型 Jina Embeddings V4

2025-06-27

sp;是我们迄今为止最具突破性的一款向量模型。作为一款开源模型，它的性能表现已全面超越来自主流供应商的顶尖闭源模型。” 在多语言检索方面，其性能比 OpenAI 的 text-embedding-3-large 高出 12%（66.49 vs 59.27）。在长文档

LAION-AI 推出 OpenFlamingo，有望成为 GPT-4 开源替代品

2023-03-31

处理和推理图像、视频和文本的等多模态内容的框架）的开源复制品。其数据集 OpenFlamingo-9B 的 Demo 页面展示了训练结果，用户可以上传图片让该模型进行识别。小编浅试了一下，一张简单的图片耗时 11 秒，可以相当精准地

Mistral Small 3.1 开源发布：128K 上下文、多模态、轻量级

2025-03-20

Mistral AI 现已开源发布全新轻量级 AI 模型 Mistral Small 3.1。Mistral Small 3.1 能够处理文本和图像，参数仅为 240 亿。该模型提高了文本能力和多模态理解能力，并具备 128K 上下文窗口。核心特性轻量级部署：可在单个 RTX 4090

AI 时代的“数据之困”，什么是 AI-Ready Data

2025-06-11

深度学习模型的训练通常依赖于大规模的非结构化以及多模态数据，如图像、音频、文本和视频。这些数据往往需要进行大量且精准的标注，例如物体检测任务中的边界框、图像分割的掩码、语音识别的文本转录等。特征：数

中国电信星辰 AI 大模型开源

2024-01-13

中国电信宣布将自研星辰 AI 大型模型全面开源，公开其底层代码、算法逻辑及其预制的各种基础大模型、开发模块、训练工具等核心产品能力。用户既可以直接调用大模型，也可以根据自身业务需求对大模型进行微调或个性化

快手高级副总裁盖坤兼任可灵AI技术部负责人

2025-08-19

快手宣布高级副总裁盖坤兼任可灵 AI 技术部负责人，继续向 CEO 程一笑汇报，进一步强化可灵 AI 在快手战略中的地位。据了解，盖坤自 2020 年加入快手后，主导推荐算法、视频生成大模型等技术研发，并推动可灵 AI 成为全球

字节跳动旗下开源多模态智能体 Agent TARS 发布 Beta 版本

2025-06-28

式发布了 Agent TARS 的 Beta 版本，将其定位为一个开源的多模态 AI Agent 工具，旨在提供与各种现实世界工具的无缝集成能力，并实现“随时随地可用”。 Agent TARS 的早期预览版已于三月份开源。此次 Beta 版本

苹果发布 300 亿参数多模态大模型 MM1.5

2024-10-15

苹果近日发布多模态大模型 MM1.5，旨在增强对文本丰富的图像的理解、视觉指代和接地，以及多图像推理的能力。据悉， MM1.5在在 MM1 架构的基础上训练而成，MM1.5 采用了以数据为中心的模型训练方法，在整个模型训练生命周

上海 AI 实验室联合多所高校推出 PonderV2 预训练方法与模型

2023-10-26

，并将为各种AI实际应用奠定坚实基础。PonderV2代码同时开源。 PonderV2具有深度理解和感知三维真实世界的能力，并为广泛的三维应用提供强大支持。在预训练方面，该预训练与模型具备以下四项核心优势。统一的预训练方式

熱門推薦