AgentCosts Router
在账单失控前,看清每一次 AI 调用花在哪里。
AgentCosts Router 是面向独立开发者的 AI 成本追踪与路由网关:先记录 workflow 成本、 生成每周省钱报告和预算提醒,再逐步启用简单路由规则。
本周可优化成本
把抽取、分类、打标等普通调用从高价模型迁移到更便宜模型,通常是第一层节省。
供应商后台只能看到总账单,很难知道哪个 Agent 步骤烧钱。
独立开发者需要在预算超标前收到信号,而不是月底才看到发票。
大量抽取、分类、打标调用要先形成省钱报告,再逐步进入自动路由。
MVP 路径
一个入口,一份报告,一个预算提醒开始。
接入一个 gateway
用 beta ingest key 记录供应商、模型、token、workflow 和预估成本。
生成省钱报告
找出哪些 workflow 真的需要强推理,哪些正在浪费预算。
设置预算提醒
在账单失控前提醒你,然后再逐步启用 cheap / fast / premium 路由规则。
Token 成本模型
加入 beta 前,先把用量换算成成本。
Token 成本计算器
把 token 用量换算成真实模型成本。
根据 input、cached input、output token 和请求量估算 LLM 成本;也可以反向输入预算,估算能跑多少请求和 token。
定义: 线索打分、意图标签、审核标记、路由判断等短标签任务。
Token 预设: 输入较短、输出很短、请求量较高。
工作负载画像只用于预填 token 和请求量假设,不决定模型质量或同级对标分组。
预估总成本
$6.048
单次请求成本
$0.00012096
加权每百万 token 成本
$0.1234
每千 token 成本
$0.00012343
计费拆分
当前模型
deepseek-v4-flash
$6.048
同级替代路线
glm-4.7-flashx
$4.15
对标依据
常规低成本同级
先按模型能力层级过滤,再按当前 token 结构计算价格;这里不是全库最低价排行。
潜在节省
$1.898
价格来源: DeepSeek · 复核日期: 2026-05-21
Legacy deepseek-chat and deepseek-reasoner map to DeepSeek V4 Flash modes.
这里使用公开文本 token 标价,价格可能变化;用于生产计费前应再次确认供应商官方价格页。