AigcPanel v1.1.0 语音识别,声音替换,模型自启动,应用工具上线


AIGCPanel 的用户们,欢呼吧!全新 1.1.0 版本带着满满的诚意与惊喜正式上线,每一项更新都直击用户痛点,力求为大家带来更加便捷、高效且智能的 AI 数字人创作体验。
AIGCPanel  新版本带着一堆硬核功能来了!用过的都说效率翻倍

软件介绍

AigcPanel是一个简单易用的一站式免费开源AI数字人系统,小白也可使用。 支持智能直播、视频合成、声音合成、声音克隆,简化本地模型管理、一键导入和使用AI模型。

禁止使用本产品进行违法违规业务,使用本软件请遵守中华人民共和国法律法规。

32253_y9ll_9146.png

重磅更新!

模型能自启动了!设为自启动后不用手动点,打开就干活文件存哪自己定!

32370_nevl_7072.png

自定义存储路径,找文件再也不用翻遍电脑新增语音识别功能!

32406_as8d_7072.png

语音秒转文字,开会记笔记神器声音替换上线!

32442_cytl_3450.png

想给视频换个声线?一键搞定

32474_300q_6587.png

为什么选择 AigcPanel?

✅ 零门槛操作:本地部署操作简单,小白也能秒变 AI 大神!
✅ 云端算力:免部署,高性能模型即点即用!
✅ 免费模型:本地搭建,一键快速启动!
✅ VIP 专属模型:解锁更高精度、更强大功能!

功能特性

支持视频数字人合成,支持视频画面和声音换口型匹配
支持语音合成、语音克隆,多种声音参数可设置
支持多模型导入、一键启动、模型设置、模型日志查看
支持国际化,支持简体中文、英语支持本地免费多种模型一键启动包。

本地模型

视频模型:MuseTalk
视频模型:Wav2Lip
视频模型:LatentSync
语音模型:CosyVoice-300M
语音模型:CosyVoice-2.0-0.5B
语音模型:CosyVoice-300M-Instruct
语音模型:Fish Speech
语音模型:Spark-TTS
语音模型:IndexTTS
语音模型:GPT-SoVITS
语音模型:Funasr【新增】
视频模型:Wav2lip384(调优版)
语音模型:CosyVoice-300M模型(优化版)
视频模型:Heygem(调优版)
语音模型:IndexTTS(直播版)
直播模型:智能直播模型

云端模型快速生成:

声音模型:[云端]聚合声音合成模型
声音模型:[云端]CosyVoice2-0.5B模型
声音模型:[云端]CosyVoice-M300模型
声音模型:[云端]FishSpeech模型
声音模型:[云端]Step-Audio-TTS-3B模型
语音模型:[云端]Funasr模型【新增】
视频模型:[云端]MuseTalk模型
视频模型:[云端]LatentSync模型
视频模型:[云端]Wav2Lip模型
视频模型:[云端]Heygem模型

版本更新  v1.1.0【2025-08-11】

语音识别,声音替换,模型自启动,应用工具上线

新增:模型增加是否自启动属性,自启动模型无需手动启动
新增:声音和视频界面拆分
新增:窗口顶部点击最大化
新增:文件存储路径可配置,支持自定义文件存储路径
新增:声音合成自定义声音支持 mp3 格式
新增:语音识别功能
新增:声音替换功能
新增:首页增加应用工具
优化:任务运行调度底层重构
优化:文案拆分,功能定位清晰化
优化:界面显示优化
优化:模型重置可直达模型充值界面

功能预览

声音合成

32557_ip0u_6755.png

音色管理

32589_bjes_2340.png

声音克隆

32621_idvy_3160.png

声音识别

32442_cytl_3450.png

声音替换

32474_300q_6587.png

数字人形象

32683_qbyn_3483.png

数字人合成

32717_eqab_6088.png

数字人一键合成

32740_lleg_9804.png

直播知识库

32762_eobe_5877.png

直播控制台

32785_iign_7665.png

直播互动

32808_ar2i_9692.png

播报历史

32832_9wzt_4849.png

模型添加

32859_l9yz_9000.png

大模型设置

32887_m692_1534.png

模型日志

32922_xduf_9792.png

设置

32947_wsgo_9379.png

安装使用

Windows / Mac

访问 https://aigcpanel.com 下载安装包,一键安装即可
安装完成后,打开软件,下载模型一键启动包,即可使用。

32979_reg4_5895.png

相关链接

官网:

https://aigcpanel.com

Github:

https://github.com/modstart-lib/aigcpanel

Gitee:

https://gitee.com/modstart-lib/aigcpanel

Gitcode:

https://gitcode.com/modstart-lib/aigcpanel

License

Apache-2.0

33019_ujis_6073.png


相關推薦

2025-07-17

亲爱的 AigcPanel 用户们,我们又带来了令人兴奋的消息!AigcPanel v0.14.0 版本现已正式发布,本次更新致力于为大家带来更加流畅、高效且便捷的使用体验,快来看看都有哪些惊喜变化吧! 软件介绍 AigcPanel是一个简

2025-04-18

AIGCPanel v0.11.0 版本更新公告 亲爱的用户们,我们正式推出 AIGCPanel v0.11.0 版本!本次更新聚焦 声音合成能力升级 与 系统稳定性优化,为您带来更高效、多元的使用体验。 软件介绍 AigcPanel 是一个简单易用的一

2025-06-04

编辑:@赵怡岭、@鲍勃 01 有话题的技术 1、通义实验室语音团队推出 OmniAudio 技术,可直接从 360° 视频生成 FOA 空间音频 5 月 29 日,阿里通义大模型公布了「空间音频生成」模型——OmniAudio。据通义团队介绍,OmniAudio 能够直接

2024-08-07

能全面的 分布式 推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地 一键部署你自己的模型或内置的前沿开源模型 - https://github.com/xorbitsai/inference。无论你是

2023-06-07

。 通信功能主要是一些国内已经用了很久的功能,比如语音转文字、聊天时共享位置、共享电量等... 其次还有一些有趣的特性,比如拨打电话的人可以自定义自己在对方手机显示的外观。 还有比较实用的是实时语音邮件,

2025-08-21

le Docs 推出了一项全新的功能,用户现在可以通过 AI 生成语音来朗读他们的文档。此功能旨在提升用户的阅读体验,使得信息的获取更加便捷和生动。 在这一功能的使用过程中,用户可以自定义 AI 的音频输出,包括选择不同的

2025-04-30

AI 模型广场提供了行业大模型、文本生成、视觉模型、语音多模态、图像生成与处理、3D生成、文档处理/OCR、视频生成、自动语音识别、语音合成、向量化和重排、代码生成、风控识别十三大类共 81 款各领域的顶尖开源模型的

2025-06-08

的技术 1、Bland TTS 推出突破性声音克隆技术,仅需 3-6 个语音样本即可完美复制说话风格 Bland TTS 推出突破性声音克隆技术,仅需 3-6 个语音样本即可完美复制说话风格,并能根据文本内容自动调整情感表达。该技术颠覆传统 TTS

2025-07-12

AigcPanel v0.14.0 已经发布,开源 AI 数字人系统。 此版本更新内容包括: 新增:直播视频内容增加开关,默认关闭 新增:直播用户重复进入重复忽略可设置 新增:GPT-SoVITS模型一键运行包 新增:CosyVoice-300M模型(优化版)

2025-08-22

Gemini Live 是谷歌推出的实时 AI 语音助手,支持语音与视觉互动,用户可通过摄像头或屏幕共享与 AI 对话。它能实时识别画面内容并回应,例如看到物品可询问信息,看到日程可添加提醒。 近日,谷歌宣布 Gemini Live 迎来重

2025-08-22

英伟达NeMo团队发布并开源了两款多语言语音模型Canary-1b-v2和Parakeet-tdt-0.6b-v3,分别针对语音识别与翻译以及高吞吐量转录场景,均支持商用。 Canary-1b-v2拥有10亿参数,支持25种欧洲语言的自动语音识别(ASR)与双向语音翻

2024-08-09

点击标签发送,朗读没有被打断的问题 【AI助手】修复语音对话时回答长度超过朗读字符限制后会出错的问题 【AI助手】修复在AI助手下达上一首、下一首、快进等操作指令后,在影音应用不生效的问题 【AI助手】修复在端侧

2025-04-17

量化模型版本; AI 随航新增文本纠错功能,帮你快速识别文字错误; AI 随航新增支持对原文双击复制; AI 随航优化了划词后随航工具栏出现的时机,减少误触和打扰; AI 写作对已生成内容新增了原提示词标示能力

2024-10-01

发布v1.6版本。 在v1.6社区版中,应用方面,MaxKB新增支持语音方式问答,支持使用重排模型进行多路召回,支持自定义全局变量,支持OpenAI Compatible API调用格式,支持支持ECharts图表和HTML页面的渲染;知识库方面,支持上传Excel