Kimi 开放平台:下调模型推理服务和上下文缓存价格


Kimi 开放平台官方公众号发文宣布,基于Moonshot AI一年来的技术积累和性能优化,已经在北京时间2025年4月7日0点对Kimi开放平台提供的模型推理服务进行价格调整,具体调整方案如图所示:

注:kimi-latest 模型自动缓存后的价格仍为 ¥1 / M Tokens。

上下文缓存的价格调整方案如下:

更多详情可查看:

  • 模型推理产品定价
  • 上下文缓存产品定价

相關推薦

2024-08-03

味着月之暗面正式开启B端业务。 Kimi API 从今年 2 月开始开放给企业和开发者使用。在此期间,很多企业有了规模化的落地,对稳定性和数据安全提出了更高的要求。 本次发布的 Kimi 企业级 API 主要是在数据安全保障、并发速

2025-04-30

续我们也将继续根据域名成本的变化,及时合理地调整(下调 / 上涨)域名价格,并始终为您提供高品质的专业服务!您的满意是我们的动力,感谢您的理解与支持! 据了解,阿里云已于今年 4 月 1 日对部分小众域名价格进

2024-08-04

DeepSeek 宣布启用上下文硬盘缓存技术,把预计未来会重复使用的内容,缓存在分布式的硬盘阵列中。如果输入存在重复,则重复的部分只需要从缓存读取,无需计算。该技术不仅降低服务的延迟,还大幅削减最终的使用成本。

2025-04-11

(检索增强生成)和工具调用等任务。该模型支持 128K 的上下文长度,并且可以在单个 8xH100 节点上进行推理。 据介绍,Llama-3.1-Nemotron-Ultra-253B 的设计目标是支持高级推理、指令遵循以及 AI 助手工作流程。技术特点如下:

2023-10-21

)、 Sally (Mihyoung) Lee(Uber) 和范斌(Alluxio)。活动现已开放报名:https://www.alluxio.io/ai-infra-day-2023/。 关于 Alluxio Alluxio 是全球领先的针对分析和 AI 的高性能数据平台提供商,可加速企业 AI 产品价值变现,并最大化基础设

2025-04-30

-32B、14B、8B、4B、1.7B、0.6B,均为Apache 2.0开源协议。 2. 上下文长度:密集模型中,0.6B、1.7B、4B为32K,8B及以上为128K;MoE模型均为128K。 模力方舟上的昇腾算力已为您准备好首批0.6B、8B、30B三款模型,其中 30B 为 Mixture-of-Experts

2025-04-19

Flex processing),这是一种 API 选项,它提供更低的人工智能模型使用价格,但响应时间较慢且“偶尔资源不可用”。 「Flex processing 」可以显著降低 Chat Completions 或 Responses 请求的成本,但会以较慢的响应时间和偶尔的资源

2024-08-17

示,减少提示成本和延迟。 提示缓存允许用户缓存常用上下文,以便在将来的 API 调用中使用。该公司称,通过为模型配备背景知识和过去的示例输出,长提示的成本可降低高达 90%,延迟可降低高达 85%。 提示缓存在多种用

2025-03-27

fig.json(tool calls 相关变动)。模型参数约 660B,开源版本上下文长度为 128K(网页端、App 和 API 提供 64K 上下文)。 V3-0324 模型权重下载请参考: Model Scope: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3-0324 Huggingface: https://

2024-06-25

更新:   AI 对话:集成了通义、文心、Kimi等大模型的AI对话功能 国际化:前后端完整的国际化方案实现 代码生成:devtools支持配置并生成业务对象选择器、配置并生成链接弹窗查看关联数据详情、生成移动端CRUD

2025-03-27

他用户的测试中,新版 V3 在多轮对话中体现出了更强的上下文理解能力。 从网友反馈的实测效果来看,V3-0324 有这些提升: 编码能力已经接近 Claude3.7 了,比之前的老版本 v3 能力要强; 提升幅度大约与 Sonnet 3.5 到 Sonnet 3.6

2025-03-26

,实现跨节点通信开销降低37%,推理速度提升 128K超长上下文:可解析50页PDF文档或完整代码库,多轮对话记忆保持能力提升 FP8混合精度训练:显存占用压缩,单卡推理成本较初代降低 2. 代码生成质的飞跃 单次生成400+

2023-07-19

放式多轮测评的常见任务中,如生成与创作、角色扮演、上下文对话、知识与百科,效果与ChatGPT3.5及Claude基础版相比是接近的(详见定量分析),但在复杂任务上,如代码生成、数学计算、逻辑与推理,还存在比较大的进步空

2023-10-26

谷歌推出新工具“关于此图像”,可验证图像来源、提供上下文信息,旨在增强搜索结果的可信度。【AiBase提要】:🔍 谷歌推出“关于此图像”工具,帮助验证图像来源和提供上下文信息。📷 用户可从搜索和 Google 图片结果中