[RFC] 092 - Token Usage 展示 #6699
arvinxx
started this conversation in
RFC | 特性开发
Replies: 2 comments 2 replies
-
自定义的服务商和模型怎么自定义价格啊? |
Beta Was this translation helpful? Give feedback.
1 reply
-
现在Token usage和生成时间都能显示了,是不是就能显示服务商生成token的速度了? 😋生成完之后,在token usage左边再显示个 |
Beta Was this translation helpful? Give feedback.
1 reply
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
背景
#6595 做了 Claude 3.7 搜索之后效果真的很好,但是需要 context cache 支持来降低成本。但目前用户无法感知到 context cache 的变化,结合本身希望让用户能逐步理解 token 和积分的概念,因此准备将模型的 token 展示专门展示出来。
设计思路
实现很简单,就是将原本流协议中扩展一下 usage 部分。
扩展的类型定义如下:
针对 openai 来说:
usage 在最后一个chunk 中:
直接取出来做映射即可:
针对 Anthropic ,会稍微有点特别,在两个 chunk 中,一个是在
message_start
,另外一个在最后的message_delta
:不过 Anthropic 没有像 openai 一样直接提供一个 total tokens,因此需要自行累加。由于input和 output 存在于两个不同的 chunks 中,因此需要用流中的 context 做一个暂存。
然后 UI 层考虑同时展示 Token 和积分。对积分的定义是 1$ = 1M 积分,这样就可以用很简单的乘法完成每个 token 的计费统计:
进展
不是一个大需求,放在 patch 版本发
Beta Was this translation helpful? Give feedback.
All reactions