人工智能应用程序接口价格战升温：深度求索 V4-Pro 降价 75% 且 Gemini 3.5 Flash 发布

2026年5月31日正成为人工智能应用程序接口市场具有里程碑意义的一天。两大进展正在汇聚：

信息很明确：人工智能应用程序接口价格战不再暗流涌动——而是已全面爆发。

竞争格局：深度求索 V4-Pro 的激进举措

早在 5 月 22 日，深度求索抛出一枚重磅炸弹：V4-Pro 应用程序接口的定价将永久锁定在其原价的大约四分之一。原本应于 5 月 31 日到期的 75% 折扣？现在已成为永久费率。

以下是新定价的具体情况：

模型	输入（每 100 万令牌）	输出（每 100 万令牌）	上下文窗口
深度求索 V4-Pro	0.435 美元	0.87 美元	12.8 万
深度求索 V3	0.14 美元	0.28 美元	6.4 万
Gemini 3.5 Flash	1.50 美元	9.00 美元	100 万
Claude Haiku 4.5	1.00 美元	5.00 美元	20 万
GPT-4o	2.50 美元	10.00 美元	12.8 万

价格截至 2026 年 5 月准确无误。来源：官方应用程序接口文档和第三方聚合平台。

深度求索 V4-Pro 每百万令牌 0.87 美元的输出价格比 GPT-4o 便宜 10 倍，比 Claude Haiku 4.5 便宜 5 倍。对于构建每次请求生成数千个令牌的人工智能代理、聊天机器人或自动化工作流的开发人员来说，节省的成本会迅速累积。

这不仅仅是另一个“我们正在降低价格”的公告。深度求索的举措有三点不同之处：

不甘示弱的谷歌利用 2026 年 I/O 开发者大会 unveiled Gemini 3.5 Flash，其数据令人印象深刻：

谷歌将 Flash 定位为高容量主力模型：速度足以满足实时应用程序需求，成本低廉足以大规模运行，并且支持多模态（原生支持文本、视觉、视频和音频）。

权衡之处在于？在每百万输出 9.00 美元的价格下，对于纯文本工作负载而言，它仍然比 深度求索 V4-Pro 贵 10 倍。如果您的应用程序不需要多模态功能，那么成本差异就很难忽视。

这并非偶然。三种结构性力量正在推动整体价格下降：

诸如推测

免责声明：本文内容来自互联网，该文观点不代表本站观点。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请到页面底部单击反馈，一经查实，本站将立刻删除。