AgentCosts Router

在账单失控前，看清每一次 AI 调用花在哪里。

AgentCosts Router 是面向独立开发者的 AI 成本追踪与路由网关：先记录 workflow 成本、生成每周省钱报告和预算提醒，再逐步启用简单路由规则。

申请 beta onboarding 预览 Dashboard

本周可优化成本

$83

把抽取、分类、打标等普通调用从高价模型迁移到更便宜模型，通常是第一层节省。

抽取/分类DeepSeek

实时体验Groq

复杂推理OpenAI

供应商后台只能看到总账单，很难知道哪个 Agent 步骤烧钱。

独立开发者需要在预算超标前收到信号，而不是月底才看到发票。

大量抽取、分类、打标调用要先形成省钱报告，再逐步进入自动路由。

MVP 路径

一个入口，一份报告，一个预算提醒开始。

接入一个 gateway

用 beta ingest key 记录供应商、模型、token、workflow 和预估成本。

生成省钱报告

找出哪些 workflow 真的需要强推理，哪些正在浪费预算。

设置预算提醒

在账单失控前提醒你，然后再逐步启用 cheap / fast / premium 路由规则。

Token 成本模型

加入 beta 前，先把用量换算成成本。

申请早期访问

Token 成本计算器

把 token 用量换算成真实模型成本。

根据 input、cached input、output token 和请求量估算 LLM 成本；也可以反向输入预算，估算能跑多少请求和 token。

模型工作负载画像

定义: 线索打分、意图标签、审核标记、路由判断等短标签任务。

Token 预设: 输入较短、输出很短、请求量较高。

工作负载画像只用于预填 token 和请求量假设，不决定模型质量或同级对标分组。

每次请求输入 tokens每次请求输出 tokens每次请求缓存输入 tokens请求次数

预估总成本

$6.048

单次请求成本

$0.00012096

加权每百万 token 成本

$0.1234

每千 token 成本

$0.00012343

计费拆分

非缓存输入35M tokens$4.90

缓存输入10M tokens$0.0280

输出4M tokens$1.12

当前模型

deepseek-v4-flash

$6.048

同级替代路线

glm-4.7-flashx

$4.15

对标依据

常规低成本同级

先按模型能力层级过滤，再按当前 token 结构计算价格；这里不是全库最低价排行。

潜在节省

$1.898

价格来源: DeepSeek · 复核日期: 2026-05-21

Legacy deepseek-chat and deepseek-reasoner map to DeepSeek V4 Flash modes.

这里使用公开文本 token 标价，价格可能变化；用于生产计费前应再次确认供应商官方价格页。

用 Router 追踪这笔成本