生树科技发布高可控 AI 视频大模型「Vidu Q1」


生树科技旗下的 Vidu AI 发布了业内首个高可控 AI 视频大模型「Q1」。

据介绍,Vidu Q1 在多主体细节可控、音效同步可控、画质增强等方面都取得出色表现。并且 Vidu Q1 在四大核心能力进行了全面升级:

  • 极「质」高清:画质细节全面提升,出片更清晰、更具质感;
  • 极「质」镜头:首尾帧衔接更顺滑,镜头语言更具电影感;
  • 极「质」音效:一句话生成专属音效,支持时段自定义和音效叠加;
  • 极「质」风格:动漫风格再度升级,稳定流畅、更具表现力。

目前,Vidu Q1 已上线 Vidu 官网,支持时长 5 秒、1080p 的视频生成。

根据官方介绍,Vidu Q1 作为业内首个高可控 AI 视频大模型,其在多主体细节可控(特别是动作、布局可控)、音效同步可控、画质增强等方面均取得显著成效。

以多主体细节可控为例,在语义指令的基础上,通过融入参考图的视觉指令,Vidu Q1支持对场景中多主体的位置、大小、运动轨迹等属性进行更进一步的可控,对所有动作行为(出场、退场、坐立姿态、行动路线)进行精准调整。用户能够明显体验到用更低的抽卡率实现更高质量的可控生成。

音效同步可控功能则确保了随着视频环境与画面转场,Vidu Q1 能够输出生成相应音效,并可精准控制每段音效的长短区间,精准设置每段音频出现的时间点,如 0-2s 风声、3-5s 雨声等,节省时间的同时,也大大增强了视频的沉浸感与感染力。

Vidu Q1 模型通过进一步增强画质,则能够为用户带去更加清晰、细腻、逼真的视觉体验。


相關推薦

2024-07-05

成数字分身和不同风格的写真视频。目前,Vimi已在商汤科技官网开放预约。 Vimi 也入选了2024世界人工智能大会的“镇馆之宝”名单。其他入选的还包括阿里云AI编程助手通义灵码、支付宝智能助理、智谱AI基座大模型、特斯拉

2025-03-27

新步伐,紧跟世界先进水平。 有外媒近日报道称,中国科技公司选择开源路线,不仅是为了与同类型公司展开竞争,更是为了加速AI的采用和创新。开源模型降低了成本,为产品创新打开了大门。这一趋势不仅将推动中国AI领域

2024-01-23

殷勇作政府工作报告时指出,2023年,北京加快建设国际科技创新中心,加强科技领军人才尤其是青年人才培养引进,实施基础研究领先行动和关键核心技术攻坚战行动,推动在京国家实验室高质量运行,支持新型研发机构开展

2023-09-29

南方电网人工智能科技有限公司负责研发的电力行业人工智能创新平台及自主可控电力大模型正式公开发布。 电力行业人工智能创新平台提供模型即服务(MaaS),支持模型快速迭代开发,并支撑电力人工智能资源面向全社会开

2025-04-23

抖音发布《2025第一季度黑产治理数据报告》指出,今年第一季度,抖音封禁水军、欺诈和违规导流相关黑产账号260万个,并将涉嫌违法犯罪的线索上报有关部门。 公告称,在大模型基础上,通过构建以 AI 为核心的治理体系,

2024-08-20

昆仑万维发布全球首个集成视频大模型与3D大模型的AI短剧平台SkyReels。集剧本生成、角色定制、分镜、剧情、对白/BGM及影片合成于一体,旨在让创作者“一键成剧”,轻松制作高质量AI视频。 SkyReels平台集成了昆仑万维自研剧

2025-06-08

丸研发新型人脸动画技术,声音+指令精准控制表情 趣丸科技团队提出了一种新颖的肖像驱动框架 Playmate,该算法能够根据音频和各种可选的控制条件生成高质量的肖像视频。通俗来讲,就是给定一张照片和一段音频,就可以生

2025-03-21

,支持生成102帧、5秒、540P分辨率的视频,具备运动幅度可控和镜头运动可控两大核心特点,同时天生具备一定的特效生成能力。 公告称,和目前已有开源图生视频模型相比,Step-Video-TI2V 不仅在参数规模上对该领域的研究提供

2024-08-27

举行的第四届RISC-V中国峰会上,中国电信研究院、天翼云科技公司联合中国科学院软件所、达摩院等合作伙伴发布业界首个RISCV云计算试验平台“北海”,RVEI战略指导委员会主任、中国工程院院士倪光南共同参与发布。 中国电

2025-05-22

生态。采用商用友好的 Apache 2.0 开源协议,是“杭州无耳科技有限公司”开源的根级项目,是 Java 应用开发的生态基座(可替换美国博通公司的 Spring 生态)。 追求: 快速、小巧、简洁 提倡: 克制、高效、开放 7年开源

2025-06-19

社区的深度融合,将助力中国企业在未来十年实现真正的科技突围与产业升级。 真正的商业化成功,从不是孤军奋战,而是与时代共潮生。   数字化企业知识管理AI平台:next.oschina.net

2025-04-29

正式启动。由开源PHP联合战略合作伙伴,华为昇腾、商汤科技、智谱(Z.ai)、沐曦MetaX、天数智芯、睿思芯科、希姆计算等国内领先人工智能企业共同发起。他们将为赛事提供核心算力支持、先进AI模型、优质数据资源以及行业

2025-06-19

Xorbits Inference(Xinference)是一个 性能强大且功能全面的 分布式 推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地 一键部署你自己的模型或内置的前沿开源

2024-10-31

态,彩页提供多样且丰富的阅读体验,涵盖影视、财经、科技、娱乐等各个领域。彩页不仅可以发布到首页供其他用户点赞和收藏,还可以用于制作个人的工作或学习PPT;宝典则是AI时代的新型知识网页。当用户搜索任意问题时