A
AgentCosts.xyz

AgentCosts Router

在账单失控前,看清每一次 AI 调用花在哪里。

AgentCosts Router 是面向独立开发者的 AI 成本追踪与路由网关:先记录 workflow 成本、 生成每周省钱报告和预算提醒,再逐步启用简单路由规则。

本周可优化成本

$83

把抽取、分类、打标等普通调用从高价模型迁移到更便宜模型,通常是第一层节省。

抽取/分类DeepSeek
实时体验Groq
复杂推理OpenAI

供应商后台只能看到总账单,很难知道哪个 Agent 步骤烧钱。

独立开发者需要在预算超标前收到信号,而不是月底才看到发票。

大量抽取、分类、打标调用要先形成省钱报告,再逐步进入自动路由。

MVP 路径

一个入口,一份报告,一个预算提醒开始。

01

接入一个 gateway

用 beta ingest key 记录供应商、模型、token、workflow 和预估成本。

02

生成省钱报告

找出哪些 workflow 真的需要强推理,哪些正在浪费预算。

03

设置预算提醒

在账单失控前提醒你,然后再逐步启用 cheap / fast / premium 路由规则。

Token 成本模型

加入 beta 前,先把用量换算成成本。

申请早期访问

Token 成本计算器

把 token 用量换算成真实模型成本。

根据 input、cached input、output token 和请求量估算 LLM 成本;也可以反向输入预算,估算能跑多少请求和 token。

定义: 线索打分、意图标签、审核标记、路由判断等短标签任务。

Token 预设: 输入较短、输出很短、请求量较高。

工作负载画像只用于预填 token 和请求量假设,不决定模型质量或同级对标分组。

预估总成本

$6.048

单次请求成本

$0.00012096

加权每百万 token 成本

$0.1234

每千 token 成本

$0.00012343

计费拆分

非缓存输入35M tokens$4.90
缓存输入10M tokens$0.0280
输出4M tokens$1.12

当前模型

deepseek-v4-flash

$6.048

同级替代路线

glm-4.7-flashx

$4.15

对标依据

常规低成本同级

先按模型能力层级过滤,再按当前 token 结构计算价格;这里不是全库最低价排行。

潜在节省

$1.898

价格来源: DeepSeek · 复核日期: 2026-05-21

Legacy deepseek-chat and deepseek-reasoner map to DeepSeek V4 Flash modes.

这里使用公开文本 token 标价,价格可能变化;用于生产计费前应再次确认供应商官方价格页。

用 Router 追踪这笔成本