人工智能应用程序接口价格战:深度求索V4专业版降价75%,杰米尼3.5闪电版上线

发布日期:2026-06-22 10:01:50   浏览量 :9
发布日期:2026-06-22 10:01:50  
9

人工智能应用程序接口价格战升温:深度求索 V4-Pro 降价 75% 且 Gemini 3.5 Flash 发布

2026年5月31日正成为人工智能应用程序接口市场具有里程碑意义的一天。两大进展正在汇聚:

  1. 深度求索 V4-Pro 降价 75% 成为永久政策 — 临时促销活动结束,该折扣成为新的基准价格。
  2. 谷歌的 Gemini 3.5 Flash 在 2026 年 I/O 开发者大会上亮相,号称速度提升 4 倍,输出定价低于 10 美元。

信息很明确:人工智能应用程序接口价格战不再暗流涌动——而是已全面爆发。

竞争格局:深度求索 V4-Pro 的激进举措

早在 5 月 22 日,深度求索抛出一枚重磅炸弹:V4-Pro 应用程序接口的定价将永久锁定在其原价的大约四分之一。原本应于 5 月 31 日到期的 75% 折扣?现在已成为永久费率。

以下是新定价的具体情况:

模型 输入(每 100 万令牌) 输出(每 100 万令牌) 上下文窗口
深度求索 V4-Pro 0.435 美元 0.87 美元 12.8 万
深度求索 V3 0.14 美元 0.28 美元 6.4 万
Gemini 3.5 Flash 1.50 美元 9.00 美元 100 万
Claude Haiku 4.5 1.00 美元 5.00 美元 20 万
GPT-4o 2.50 美元 10.00 美元 12.8 万

价格截至 2026 年 5 月准确无误。来源:官方应用程序接口文档和第三方聚合平台。

深度求索 V4-Pro 每百万令牌 0.87 美元的输出价格比 GPT-4o 便宜 10 倍,比 Claude Haiku 4.5 便宜 5 倍。对于构建每次请求生成数千个令牌的人工智能代理、聊天机器人或自动化工作流的开发人员来说,节省的成本会迅速累积。

为何此次举措比以往降价更重要

这不仅仅是另一个“我们正在降低价格”的公告。深度求索的举措有三点不同之处:

  1. 这是永久性的。 无需再猜测折扣是否会在下个月到期。
  2. 这是 V4-Pro,而非低端层级。 这是深度求索的旗舰推理模型,在基准测试中与 GPT-4o 和 Claude Opus 具有竞争力。
  3. 它重置了开发人员的预期。 当顶级模型的成本低于每百万输出令牌 1 美元时,整个行业的价格底线就会下降。

谷歌 Gemini 3.5 Flash 进入竞技场

不甘示弱的谷歌利用 2026 年 I/O 开发者大会 unveiled Gemini 3.5 Flash,其数据令人印象深刻:

  • 比其他前沿模型快 4 倍
  • 100 万令牌上下文窗口 — 同类产品中最大
  • 每 100 万输入/输出令牌定价为 1.50 美元/9.00 美元
  • 在编码和代理基准测试中表现优于 Gemini 3.1 Pro

谷歌将 Flash 定位为高容量主力模型:速度足以满足实时应用程序需求,成本低廉足以大规模运行,并且支持多模态(原生支持文本、视觉、视频和音频)。

权衡之处在于?在每百万输出 9.00 美元的价格下,对于纯文本工作负载而言,它仍然比 深度求索 V4-Pro 贵 10 倍。如果您的应用程序不需要多模态功能,那么成本差异就很难忽视。

宏观图景:为何每个应用程序接口都在变得更便宜

这并非偶然。三种结构性力量正在推动整体价格下降:

1. 推理优化正在吞噬成本

诸如推测

免责声明:本文内容来自互联网,该文观点不代表本站观点。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请到页面底部单击反馈,一经查实,本站将立刻删除。

关于我们
热门推荐
合作伙伴
免责声明:本站部分资讯来源于网络,如有侵权请及时联系客服,我们将尽快处理
Copyright © 2025-2027 ToB产业网址导航 公安备案 浙公网安备33010602013138号 浙ICP备16025413号-9
支持 反馈 关注 数据