ElevenLabs 发布 v3 Alpha API：支持 70+ 语言、无限数量说话人

ElevenLabs 新 TTS 模型支持音频标签丨日报

2025-06-08

： https://baike.baidu.com/item/ICML/14479665 （@机器之心） 3、ElevenLabs 推出高表现力 TTS 模型 Eleven v3（alpha）：支持 70 多种语言、多说话人对话和音频标签 ElevenLabs 推出了全新一代文本转语音模型 Eleven v3（Alpha 版），这是目前表现力

ElevenLabs 发布文本转语音模型 Eleven v3（Alpha 版）

2025-06-07

ElevenLabs发布了其最新、最先进的文本转语音模型Eleven v3的Alpha版本。该模型在生成具有高情感范围和跨多种语言的上下文理解能力的自然、逼真语音方面达到了业界领先水平。 Eleven v3 亮点如下：地表最强文本转语音模型之

李沐发布开源 TTS 语言大模型 Higgs Audio v2

2025-07-24

知名 AI 技术创业者李沐和其团队 Boson.ai 发布了开源 TTS 语言大模型 Higgs Audio v2，该模型不仅支持文本转语音，还能生成多语言自然多说话人对话、自动调整韵律、使用克隆声音哼唱旋律，甚至同时生成语音和背景音乐。

ElevenLabs 推出 AI 音乐生成服务“Eleven Music”

2025-08-08

ElevenLabs宣布推出 AI 音乐生成服务 “Eleven Music”，据称能够根据自然语言提示生成录音室级别的音乐。 https://elevenlabs.io/music Eleven Music 允许用户完全控制音乐的流派、风格和结构，可以选择生成带人声的歌曲或纯器乐，并支

ElevenLabs 上线 Eleven Music API，首款商用 AI 音乐生成接口

2025-08-20

ElevenLabs宣布推出Eleven Music API，这是首款基于全授权数据训练、专为开发者打造的商用AI音乐生成接口。自2024年推出以来，创作者已通过该工具生成超75万首歌曲，印证市场强劲需求。使用文档：https://elevenlabs.io/docs/cookbooks/mu

腾讯游戏被嫌弃的前半生

2025-04-26

不知道你有没有同感——前两天的腾讯游戏发布会，终于让人看得不困了。葡萄君说的不只是产品，还是调性。首先我发觉，这次会上真人露脸的数量，相比往年大大增多了。不少项目的制作人、主创，都站到镜头前直接向你

🔥🔥跨平台 SDK 版本管理器 VMR v0.6.4 发布！SDK 数量增加至 70 以上！

2024-07-06

官方文档：https://vdocs.vmr.us.kg/ VMR是一个类似于nvm, fnm, sdk-man, asdf-vm, pyenv, phpenv等的SDK版本管理器。跨平台，支持Windows/Linux/MacOS。支持各种常见编程语言，同时还支持一些常见编程工具。真正做到方便好用。不论是在支持的广

Istio 从 CNCF 毕业，微软加入项目社区

2023-07-14

” 毕业以后，Istio 方面表示项目工作将继续推进。月前发布的 Istio 1.18 中引入了 Alpha 版本的 ambient mesh，开发团队接下来将继续推动其投入生产。此外，Sidecar 部署仍然是使用 Istio 的推荐方法，预计 1.19 版本将支持 Kubernetes

11Labs 发布对话式 AI 2.0，集成话轮转换和知识库，多语言多角色多模态

2025-06-04

ls/fal-ai/playai/inpaint/diffusion (@HammadH4@X、 @PlayAIOfficial@X) 2、ElevenLabs 发布对话式人工智能 2.0 ，具备新一代先进的轮流发言功能和全面支持企业级应用 ElevenLabs 发布 Conversational AI 2.0，实现了自然转换对话能力，能识别语气词判断用

Mistral AI 开源 AI 音频模型系列 Voxtral

2025-07-17

格不到后者的一半。对于高端用例，Voxtral Small 的性能与 ElevenLabs Scribe 相当，但价格也不到后者的一半。” Mistral AI 指出，基准测试结果表明 Voxtral 的表现全面超越了目前领先的开源语音转录模型 Whisper large-v3。它在所有任务上

35 岁脑干出血程序员发声

2025-04-26

就一直在发烧，而且咳嗽，24小时地咳，根本没法睡觉，说话已经大舌头了，手脚都不利索。医生说我这个情况做不了康复，专家会诊完就把我送进了ICU。我最后只记得抽血检查，然后就昏过去了。后来才知道，我脑干部位长了

MOSS-TTSD 开源：百万小时训练打造 AI 播客新王者

2025-08-02

的优势下，MOSS-TTSD仍展现出强大的应用潜力。 MOSS-TTSD的发布为AI语音交互领域注入新活力，尤其在长篇访谈、播客制作和影视配音等场景中，其稳定性和表现力将推动内容创作的智能化进程。未来，团队计划进一步优化模型，

Subtitle Edit 4.0.7 发布，字幕编辑工具

2024-07-11

; 在"Multiple replace"输出中提示 overwrite 修复 TTS Azure/ElevenLabs 的"abort"问题修复视频播放器中音量文本 UI 修复法语 "L'"后的错误大小写问题修复在 TTS review 窗口中双击"Play"时崩溃的问题修复 DCinema 颜色更多详情可查

新型脑机接口系统可实时将想法转化为语言

2025-06-17

英国《自然》杂志日前刊发的一项研究显示，美国研究人员开发的脑机接口系统利用人工智能来解码使用者试图说话时的脑电活动，从而帮助患有严重言语障碍的人有表现力地说话和唱歌。美国加利福尼亚大学戴维斯分校研究

ElevenLabs 发布 v3 Alpha API：支持 70+ 语言、无限数量说话人

相關推薦