谷歌公布 AI 模型 DolphinGemma，可理解海豚声音

2025-04-16 發表於开源资讯

谷歌旗下 AI 研究实验室 DeepMind 公布了一款名为「DolphinGemma」的 AI 模型，旨在帮助科学家理解海豚的声音，并生成类似海豚的声音序列。

DolphinGemma 基于谷歌开放的 Gemma 系列模型构建，其训练数据来源于专注于研究大西洋斑点海豚及其行为的非营利组织 Wild Dolphin Project（WDP）。该模型能够生成类似海豚的声音序列，并且非常高效，谷歌表示其可以在手机上运行。

今年夏天，WDP 计划借助谷歌的 Pixel 9 智能手机搭建一个平台，该平台能够合成海豚的声音，并且可以聆听海豚的发声以获得匹配的“回应”。

谷歌透露，WDP 此前一直使用 Pixel 6 来进行相关研究工作，而升级到 Pixel 9 后，将使该组织的研究人员能够同时运行 AI 模型和模板匹配算法，从而进一步提升研究效率。

相關推薦

百度公布“动物语言转换”专利，可实现与动物深度交流

2025-05-10

通的准确性和效率。阅读更多：谷歌公布 AI 模型 DolphinGemma，可理解海豚声音

ElevenLabs 新 TTS 模型支持音频标签丨日报

2025-06-08

过 AI 呈现作家的知识、个性、沟通风格、外貌和声音谷歌推出了一款全新的 AI 实验工具——Portraits，允许用户与基于真实专家的虚拟形象进行互动。首个版本以《Radical Candor》一书的作者 Kim Scott 为特色，使用她的原声和内

字节发布端到端同声传译模型 Seed LiveInterpret 2.0

2025-07-25

节奏的自然流畅。目前，Seed LiveInterpret 2.0 技术报告已公布，模型基于火山引擎对外开放。此外，Ola Friend 耳机也将在 8 月底接入 Seed LiveInterpret 2.0，成为首个支持该模型的智能硬件设备。评测结果显示，在语音到文本的同传

李沐发布开源 TTS 语言大模型 Higgs Audio v2

2025-07-24

术创业者李沐和其团队 Boson.ai 发布了开源 TTS 语言大模型 Higgs Audio v2，该模型不仅支持文本转语音，还能生成多语言自然多说话人对话、自动调整韵律、使用克隆声音哼唱旋律，甚至同时生成语音和背景音乐。 Higgs Audio

3 月全球人工智能领域新看点

2025-04-08

，因此推理将成为AI新阶段的核心动力。 3月25日，美国谷歌公司发布了号称最强推理模型的双子座 2.5 Pro。据介绍，它是谷歌旗下最先进的复杂任务模型，展示了强大的推理和代码能力，并拥有双子座系列此前各模型所具有的全

谷歌发布“目前最智能的 AI 模型” Gemini 2.5

2025-04-01

谷歌正式推出新一代 AI 模型 Gemini 2.5，主打 “思考 - 验证 - 回答” 的智能推理能力，官方称其为 “目前最智能的 AI 模型”，首个发布的实验性版本为 Gemini 2.5 Pro，已面向 Google AI Studio 和 Gemini 应用的高级版用户（月费 20 美元

DeepMind CEO：谷歌最终将合并 Gemini 和 Veo AI 模型

2025-04-12

谷歌 DeepMind 首席执行官 Demis Hassabis 最近在 LinkedIn 联合创始人 Reid Hoffman 联合主持的播客 Possible 上表示，谷歌计划最终将其 Gemini AI 模型与其Veo 视频生成模型相结合，以提高前者对物理世界的理解。 Hassabis 表示：“我们从一开

AI视野：百度开放文心4.0开发权限申请；腾讯混元大模型开放文生图功能；谷歌AI应用禁止生成受限内容；Midjourney新网站上线测试版

2023-10-26

人搜索功能让展示和查找作品更便捷。📰🤖📢AI新鲜事谷歌发布新规:AI应用禁止生成受限内容谷歌宣布要求 Android 应用改进对人工智能生成内容的审查，以确保用户可以方便举报冒犯性内容，并限制照片和视频权限。【AiBase提

谷歌推出与 ChatGPT 竞争的 AI 产品：Bard

2023-02-08

谷歌首席执行官桑德尔·皮查伊 (Sundar Pichai) 今天宣布，他们将在未来几周内面向公众推出由 LaMDA 提供支持的实验性对话式 AI 服务，称为 Bard —— 与当前流行的 ChatGPT 展开直接竞争。在公开发布之前，目前 Bard 仅开放给受信

华为语言模型推理专利公布，可提高对预设内容的理解能力

2025-03-26

“一种语言模型推理方法以及推理装置”专利于 3月25日公布。摘要信息显示，该方法包括：根据第四问题生成第五问题，所述第五问题用于提问所述第四问题、以及提示语言模型回答所述第四问题的回复中不要包括预设内容

谷歌 Gemini Deep Think AI 获官方认证奥数金牌

2025-07-23

谷歌 DeepMind 团队宣布，其一个高级版本的 Gemini Deep Think 模型，在国际数学奥林匹克（IMO）竞赛的问题上正式取得了金牌水平的成绩。该模型在六道题目中完美解决了五道，总共获得 35 分（满分 42 分），达到了金牌分数线。IMO

Google I/O 2025 聚焦四大领域：Android、AI、Web 和云

2025-04-25

谷歌一年一度的开发者大会 Google I/O 2025 将于 5 月 20 日至 21 日举行，目前谷歌已经提前公布了部分会议议程。 https://io.google/2025/explore 在本次大会中，Android 系统依旧是重头戏之一。谷歌表示将举办一场关于安卓“进阶版”用

清华博士带队，发布全球首个自回归视频生成大模型「Magi-1」

2025-04-24

日前，由清华博士曹越创立的 Sand.AI，公布了一款名为「Magi-1」的自回归视频生成模型，其主打两个能力：无限长度扩展：通过前一段生成的内容进行后一段视频的制作，从而实现跨时间的无缝连贯叙事；生成时长控制精

谷歌发布 Gemma 3n，专为移动设备打造的全新 AI 模型

2025-06-28

Google宣布推出 Gemma 3n，这是其下一代的开放 AI 模型，与我们之前看到的相比有了显著的提升。继上个月在 Google I/O 大会上进行预览后，完整版现已发布，可直接在移动硬件上运行。与 Gemini 的不同之处在于，Gemma 是为开发者

熱門推薦