
我当前使用的模型大部分全部走到 Opus 了,很少走到 Haiku 。
我记得之前有一段时间,大部分的输入和缓存都是由 Haiku 这个模型去承载的,导致现在消耗得特别快。大家有遇到这个问题吗?是怎么解决的?
p.s 我默认/model 都是选择 Opus 的 模型使用统计 (今日)
────────────────┬──────┬───────────┬───────────┬──────────┬──────────┬──────── │ 模型 │ 请求 │ 输入 Token │ 输出 Token │ 缓存创建 │ 缓存读取 │ 费用 │ ├────────────────┼──────┼───────────┼───────────┼──────────┼──────────┼────────┤ │ claude-opus-4… │ 151 │ 2.8M │ 45.8K │ 1.6M │ 8.1M │ $29.34 │ │ claude-haiku-… │ 152 │ 41.5K │ 2.1K │ 25.7K │ 123.3K │ $0.10 │ ────────────────┴──────┴───────────┴───────────┴──────────┴──────────┴────────