Gemini 2.5 Flash 语音功能上线 AI Studio


Gemini 2.5 Flash 的语音功能已上线 AI Studio,支持中文,效果自然。用户可以使用包含多种风格和语气标记(如慢速、诗意感、正常、快速、热情等)的复杂文本进行测试。

该语音功能能够较好地遵循这些风格指令,并生成听起来相对自然的语音。

测试表明,系统对以下风格标记响应良好:

  • 语速控制(慢速/快速)

  • 情感表达(热情/诗意)

  • 语气调整(正式/随意)

体验地址:https://aistudio.google.com/live


相關推薦

2025-05-22

谷歌在 Google I/O 2025 大会上宣布为其旗舰AI模型Gemini 2.5 Pro引入名为“深度思考”(Deep Think)的增强推理模式。该模式允许模型在回应前考虑多个假设和答案,从而提升其在复杂查询,特别是数学和编码相关任务上的表现。 根据

2025-06-20

,带来了官方Roo Code Marketplace和20多项改进,其中包括对Gemini 2.5新模型的支持。 新功能上线 Roo Marketplace正式推出 :用户无需实验特性即可在Roo Code内浏览、安装社区创建的模型上下文协议(MCP)服务器和自定义模式,几下

2025-05-22

AI Mode 是 Google 搜索中的一个新选项卡,允许用户使用 Gemini AI 聊天机器人进行网络搜索,支持自然语言多轮对话式搜索。 AI Mode 基于 Gemini 2.5 打造,利用"query fan-out"技术将用户问题分解为更小的部分,同时在多样化来源中启

2025-06-07

谷歌于6月5日推出其迄今为止最智能的模型——Gemini 2.5 Pro的升级预览版。该版本是基于5月份的版本进行了重要升级,并计划在未来几周内作为正式稳定版(GA)向所有用户提供,为企业级规模的应用做好准备。 谷歌CEO Sundar Pich

2025-04-01

谷歌正式推出新一代 AI 模型 Gemini 2.5,主打 “思考 - 验证 - 回答” 的智能推理能力,官方称其为 “目前最智能的 AI 模型”,首个发布的实验性版本为 Gemini 2.5 Pro,已面向 Google AI Studio 和 Gemini 应用的高级版用户(月费 20 美元

2025-04-01

谷歌宣布免费向所有 Gemini 应用用户提供最新、最先进的 Gemini AI 模型 ——Gemini 2.5 Pro。此前,只有 Gemini Advanced 用户才能使用这一实验模型,而现在,该模型从上周六开始向公众开放。 Gemini 2.5 Pro 由谷歌于上周早些时候推出

2025-04-22

示之外,而无需每个项目进行配置。 新的模型,支持 Gemini 2.5 Pro、Gemini 2.5 Flash、Grok 3、Grok 3 Mini、GPT-4.1、o3 和 o4-mini。 支持将项目结构加入聊天上下文。 详情查看更新日志:https://www.cursor.com/cn/changelog/0-49

2025-05-20

一次,争议的焦点转向了AI对搜索体验的重塑。许多人将Gemini独立App拿来与ChatGPT和Meta AI做横向对比。数据显示,截至3月,Gemini App月活用户为3.5亿,而 ChatGPT为6亿,Meta AI为5亿。这种比较方式本身是否就存在偏差?Gemini独立App真

2025-04-30

优于DeepSeek-R1、o1、Grok-3等模型,仅在AIME'25(81.5)略低于Gemini-2.5-Pro(86.7)。 Qwen3-30B-A3B:在ArenaHard(91.0)、AIME'24(80.4)等测试中,超越QwQ-32B(激活参数为其10倍)。 Qwen3-4B:性能可与Qwen2.5-72B-Instruct媲美,如在ArenaHard中为7

2024-06-26

JetBrains 宣布将利用 Google Cloud 的 Vertex AI,将 Google 的 Gemini 模型集成到 AI 助手 (AI Assistant) 中。此举将使得 JetBrains AI Assistant 成为同类产品中第一个使用多个大语言模型的产品。 AI Assistant 是 JetBrains 推出的一款 AI 驱动的编程助

2025-06-07

定时期的信息,生成交互式图表并提供全面解释,借助 Gemini 多模式功能和多步骤推理方法理解问题意图,访问相关历史和实时信息,还能在图表生成后选择时间段提后续问题。 例如,您无需手动研究单个公司及其股价,而是

2024-08-01

0.97(满分 1 分)。 成本表现最佳模型: Google 的 Gemini 1.5 Flash。Google 模型在所有任务上均表现出色,在短、中、长上下文场景中分别获得了 0.94、1 和 0.92 的准确率,因此成为性价比最高的机型。 最佳开源模型:阿里巴

2025-04-15

import google_search root_agent = Agent( name="search_assistant", model="gemini-2.0-flash", # Or your preferred Gemini model instruction="You are a helpful assistant. Answer user questions using Google Search when needed.", description="An assistant that can search the web.", tools=[google_search]

2025-04-19

更便宜、更高效的预算导向型模型。周四,Google 推出了 Gemini 2.5 Flash ,这款推理模型的性能与 DeepSeek R1 相当,甚至更胜一筹,而且输入词元成本更低。 OpenAI 在致客户的一封宣布推出 Flex 定价的电子邮件中还指出,其使用等级