DeepSeek打响AI价格战限时折扣引关注

DeepSeek V4发布后迅速成为焦点，并开启了限时折扣。4月26日，DeepSeek最新发布的DeepSeek-V4-Pro模型API提供2.5折优惠，输入（缓存命中）价格为0.25元/百万Tokens，输入（缓存未命中）价格为3元/百万Tokens，输出价格为6元/百万Tokens，优惠期截至5月5日。

相比之下，海外知名AI大模型GPT-5.5 Pro的加权平均输入价格为30美元/百万Token，输出价格为180美元/百万Token，与DeepSeek V4 Pro相差超过700倍。GPT-5.5标准版的加权平均输入价格为5美元/百万Token，输出价格为30美元/百万Token。其他如Anthropic Claude Opus系列、OpenAI GPT-5.4以及谷歌Gemini 3.1 Pro系列大模型的输出价格在12-25美元之间，均高于调价后的DeepSeek V4 Pro。

在AI行业整体算力成本上涨的情况下，DeepSeek V4坚持“AI降价”理念，进一步推动了业内的价格竞争。此前，阿里云宣布取消旗下大数据开发治理平台DataWorks对标准版和专业版用户每日调用API的数量限制，从2026年4月14日起逐步实施。百度智能云则因全球AI应用快速发展导致算力需求攀升，自4月18日起上调AI算力相关产品服务约5%至30%，并行文件存储等服务上调约30%。腾讯云也连续两次宣布涨价，分别于3月11日和4月9日调整部分模型的价格及收费标准。

除了云端服务外，下游模型端也出现了价格上涨的趋势。国产大模型厂商智谱年内已进行三次API价格上调。2月12日，智谱对GLM Coding Plan套餐进行了结构性调价，涨幅达30%。3月16日，智谱发布了专为智能体“龙虾”场景优化的通用大模型GLM-5-Turbo，并上调其API价格20%。4月8日，智谱正式发布GLM-5.1，再次提价10%。

此次DeepSeek在全球范围内受到广泛关注，不仅因为其创新性的技术架构，还在于其对国产芯片的全面适配。华为计算表示，昇腾超节点产品全面支持DeepSeek V4。通过双方芯模技术紧密合作，实现了昇腾超节点全系列产品对DeepSeek V4系列模型的支持。寒武纪也在第一时间宣布基于vLLM推理框架完成了对DeepSeek-V4-flash和DeepSeek-V4-Pro两个版本的Day 0适配，适配代码已开源到GitHub社区。

据DeepSeek的技术论文披露，DeepSeek V4的核心创新是“混合注意力架构”，由两种机制交替叠加构成：CSA（压缩稀疏注意力）和HCA（重度压缩注意力）。这两种机制交替出现在模型的不同层，CSA处理精细的中程信息，HCA处理粗粒度的超长程信息。每个注意力层还保留了一个“滑动窗口注意力分支”，专门负责最近128个token的近邻局部信息，以弥补压缩机制容易丢失局部细节的问题。在100万token的超长上下文场景下，与上一代V3.2相比，V4-Pro的推理计算量只需27%，KV缓存只需10%；而V4-Flash更极端，推理计算量降至10%，KV缓存降至7%。