ElevenLabs 发布 v3 Alpha API:支持 70+ 语言、无限数量说话人


ElevenLabs 正式推出专为异步场景设计的 Eleven v3 Alpha API,号称是其迄今最具表现力的文本转语音模型。

其功能包括对话模式、支持无限数量的说话人、覆盖 70 多种语言,并可通过音频标签实现更精细的语音与情感控制。

根据官方介绍,这些功能使开发者能够为任何用例创建逼真、情感丰富的语音体验。在对话模式下,Eleven v3(alpha 版本)可以生成逼真的多说话人对话,并根据上下文处理打断、语调变化和情感暗示。如果在媒体和娱乐领域进行构建,包括视频、视频游戏、有声读物或媒体工具,这将开启一个新的表现力水平。


相關推薦

2025-06-08

: https://baike.baidu.com/item/ICML/14479665 (@机器之心) 3、ElevenLabs 推出高表现力 TTS 模型 Eleven v3(alpha):支持 70 多种语言、多说话人对话和音频标签 ElevenLabs 推出了全新一代文本转语音模型 Eleven v3(Alpha 版),这是目前表现力

2025-06-07

ElevenLabs发布了其最新、最先进的文本转语音模型Eleven v3的Alpha版本。该模型在生成具有高情感范围和跨多种语言的上下文理解能力的自然、逼真语音方面达到了业界领先水平。 Eleven v3 亮点如下: 地表最强文本转语音模型之

2025-07-24

知名 AI 技术创业者李沐和其团队 Boson.ai 发布了开源 TTS 语言大模型 Higgs Audio v2,该模型不仅支持文本转语音,还能生成多语言自然多说话人对话、自动调整韵律、使用克隆声音哼唱旋律,甚至同时生成语音和背景音乐 。

2025-08-08

ElevenLabs宣布推出 AI 音乐生成服务 “Eleven Music”,据称能够根据自然语言提示生成录音室级别的音乐。 https://elevenlabs.io/music Eleven Music 允许用户完全控制音乐的流派、风格和结构,可以选择生成带人声的歌曲或纯器乐,并支

2025-08-20

ElevenLabs宣布推出Eleven Music API,这是首款基于全授权数据训练、专为开发者打造的商用AI音乐生成接口。自2024年推出以来,创作者已通过该工具生成超75万首歌曲,印证市场强劲需求。 使用文档:https://elevenlabs.io/docs/cookbooks/mu

2025-04-26

不知道你有没有同感——前两天的腾讯游戏发布会,终于让人看得不困了。葡萄君说的不只是产品,还是调性。 首先我发觉,这次会上真人露脸的数量,相比往年大大增多了。不少项目的制作人、主创,都站到镜头前直接向你

2024-07-06

官方文档:https://vdocs.vmr.us.kg/ VMR是一个类似于nvm, fnm, sdk-man, asdf-vm, pyenv, phpenv等的SDK版本管理器。 跨平台,支持Windows/Linux/MacOS。支持各种常见编程语言,同时还支持一些常见编程工具。真正做到方便好用。不论是在支持的广

2023-07-14

” 毕业以后,Istio 方面表示项目工作将继续推进。月前发布的 Istio 1.18 中引入了 Alpha 版本的 ambient mesh,开发团队接下来将继续推动其投入生产。此外,Sidecar 部署仍然是使用 Istio 的推荐方法,预计 1.19 版本将支持 Kubernetes

2025-06-04

ls/fal-ai/playai/inpaint/diffusion (@HammadH4@X、 @PlayAIOfficial@X) 2、ElevenLabs 发布对话式人工智能 2.0 ,具备新一代先进的轮流发言功能和全面支持企业级应用 ElevenLabs 发布 Conversational AI 2.0,实现了自然转换对话能力,能识别语气词判断用

2025-04-26

就一直在发烧,而且咳嗽,24小时地咳,根本没法睡觉,说话已经大舌头了,手脚都不利索。医生说我这个情况做不了康复,专家会诊完就把我送进了ICU。我最后只记得抽血检查,然后就昏过去了。后来才知道,我脑干部位长了

2025-07-17

格不到后者的一半。对于高端用例,Voxtral Small 的性能与 ElevenLabs Scribe 相当,但价格也不到后者的一半。” Mistral AI 指出,基准测试结果表明 Voxtral 的表现全面超越了目前领先的开源语音转录模型 Whisper large-v3。它在所有任务上

2025-08-02

的优势下,MOSS-TTSD仍展现出强大的应用潜力。 MOSS-TTSD的发布为AI语音交互领域注入新活力,尤其在长篇访谈、播客制作和影视配音等场景中,其稳定性和表现力将推动内容创作的智能化进程。未来,团队计划进一步优化模型,

2024-07-11

; 在"Multiple replace"输出中提示 overwrite 修复 TTS Azure/ElevenLabs 的"abort"问题 修复视频播放器中音量文本 UI 修复法语 "L'"后的错误大小写问题 修复在 TTS review 窗口中双击"Play"时崩溃的问题 修复 DCinema 颜色 更多详情可查

2025-06-17

英国《自然》杂志日前刊发的一项研究显示,美国研究人员开发的脑机接口系统利用人工智能来解码使用者试图说话时的脑电活动,从而帮助患有严重言语障碍的人有表现力地说话和唱歌。 美国加利福尼亚大学戴维斯分校研究