A
AgentCosts.xyz
AgentCosts · Deep Dive
English →

2026年2月:AI 算力成本大转折 —— DeepSeek 引发的定价范式变革

一句话总结:DeepSeek V3 的“地板价”打破了旧平衡。2026 年的收费维度不再只是 $/Token,而是在快速演进为 $/思考(Reasoning) + 架构效率(MoE 激活、缓存、上下文加载优化)。


1)现状:跌破眼镜的“地板价”

到 2026 年 2 月,DeepSeek V3 的持续攻势,基本终结了头部厂商之间的价格默契。

一个被广泛引用的数字是:DeepSeek 输入成本低至 $0.01 / 1M tokens,几乎只有 GPT‑4o 的 1/120

直接影响(面向 Agent 的视角):

  • Token 成本在大量场景中迅速商品化
  • 选型从“谁最强”变成“这件事此刻用谁最划算”
  • 路由与 fallback 变成默认架构,而不是优化项

注:价格会频繁变化。下面的矩阵更像是“范式信号”,不要当作长期报价承诺。


2)2026年2月核心模型定价矩阵(代表性快照)

| 模型 | 类型 | 输入 ($/1M) | 输出 ($/1M) | 亮点 | | :--- | :--- | ---: | ---: | :--- | | DeepSeek V3 | MoE | 0.01 | 0.07 | 极致成本控制 | | GPT‑4o | 通用 | 1.25 | 5.00 | 生态位防守性调价 | | Claude 3.5 | 代码/逻辑 | 1.50 | 6.00 | 预测性缓存机制 | | OpenAI o3 | 推理 | 15.00 | 60.00 | 开启按思考量计费 |

解读(Agent-first)

  • 如果你的任务是吞吐(客服、抽取、基础生成)→ 地板价模型胜率极高
  • 如果你的任务是高风险决策(多步推理、规划、纠错)→ 推理模型仍然能用更高单价换更低失败率

3)范式转换:从按 Token 计费到按“思考”计费

2026 年的真正变化并不是简单“降价”,而是 计费维度发生了迁移

3.1 MoE 的“激活成本”成为战略变量

MoE 通过“每个 token 只激活部分网络”来降本,带来两点后果:

  • 长上下文加载成本相对更低
  • 更便宜的上下文会鼓励更大的记忆窗口、更频繁的工具调用

3.2 “思考时长/深度溢价”开始显性化

推理模型越来越多地在卖:

  • 搜索深度
  • 验证步骤
  • 内部推演(更长、更复杂的 reasoning)

你买的不是“字数”,而是 决策质量


4)开发者与 Agent 的应对策略(可执行)

4.1 不要绑定单一供应商,绑定“路由策略”

一个简单但有效的策略:

  • 默认:DeepSeek 处理日常吞吐
  • 回流:Claude 处理更难的代码/逻辑
  • 升级:o3 处理关键推理(失败代价高时才用)

4.2 定义“失败成本”,而不是只看 token 单价

Agent 系统的真实成本往往来自:

  • 重试次数
  • 工具调用链
  • 人工升级
  • 错误动作造成的连锁损失

更贵的 $/token 可能因为更少失败而更便宜。

4.3 追踪真正有意义的单位经济学

不要只看 $/token,建议追踪:

  • $/成功任务
  • time-to-success
  • 分布外误差率(distribution shift)

5)AgentCosts 接下来会怎么做

从现在起,AgentCosts 将从开发者查价工具升级为 Agent 优先的情报产品

  • 每周情报(EN+ZH)
  • 深度报告(像本文)
  • 榜单与路由建议

下一步:我会发布一份 可复制的路由 playbook(策略模板)。