DeepSeek V4发布后迅速成为焦点,并开启了限时折扣。4月26日,DeepSeek最新发布的DeepSeek-V4-Pro模型API提供2.5折优惠,输入(缓存命中)价格为0.25元/百万Tokens,输入(缓存未命中)价格为3元/百万Tokens,输出价格为6元/百万Tokens,优惠期截至5月5日。
相比之下,海外知名AI大模型GPT-5.5 Pro的加权平均输入价格为30美元/百万Token,输出价格为180美元/百万Token,与DeepSeek V4 Pro相差超过700倍。GPT-5.5标准版的加权平均输入价格为5美元/百万Token,输出价格为30美元/百万Token。其他如Anthropic Claude Opus系列、OpenAI GPT-5.4以及谷歌Gemini 3.1 Pro系列大模型的输出价格在12-25美元之间,均高于调价后的DeepSeek V4 Pro。
在AI行业整体算力成本上涨的情况下,DeepSeek V4坚持“AI降价”理念,进一步推动了业内的价格竞争。此前,阿里云宣布取消旗下大数据开发治理平台DataWorks对标准版和专业版用户每日调用API的数量限制,从2026年4月14日起逐步实施。百度智能云则因全球AI应用快速发展导致算力需求攀升,自4月18日起上调AI算力相关产品服务约5%至30%,并行文件存储等服务上调约30%。腾讯云也连续两次宣布涨价,分别于3月11日和4月9日调整部分模型的价格及收费标准。
除了云端服务外,下游模型端也出现了价格上涨的趋势。国产大模型厂商智谱年内已进行三次API价格上调。2月12日,智谱对GLM Coding Plan套餐进行了结构性调价,涨幅达30%。3月16日,智谱发布了专为智能体“龙虾”场景优化的通用大模型GLM-5-Turbo,并上调其API价格20%。4月8日,智谱正式发布GLM-5.1,再次提价10%。
此次DeepSeek在全球范围内受到广泛关注,不仅因为其创新性的技术架构,还在于其对国产芯片的全面适配。华为计算表示,昇腾超节点产品全面支持DeepSeek V4。通过双方芯模技术紧密合作,实现了昇腾超节点全系列产品对DeepSeek V4系列模型的支持。寒武纪也在第一时间宣布基于vLLM推理框架完成了对DeepSeek-V4-flash和DeepSeek-V4-Pro两个版本的Day 0适配,适配代码已开源到GitHub社区。
据DeepSeek的技术论文披露,DeepSeek V4的核心创新是“混合注意力架构”,由两种机制交替叠加构成:CSA(压缩稀疏注意力)和HCA(重度压缩注意力)。这两种机制交替出现在模型的不同层,CSA处理精细的中程信息,HCA处理粗粒度的超长程信息。每个注意力层还保留了一个“滑动窗口注意力分支”,专门负责最近128个token的近邻局部信息,以弥补压缩机制容易丢失局部细节的问题。在100万token的超长上下文场景下,与上一代V3.2相比,V4-Pro的推理计算量只需27%,KV缓存只需10%;而V4-Flash更极端,推理计算量降至10%,KV缓存降至7%。


