Skip to content

广告 · 本站推荐

腾讯云特惠活动 · 云服务器、数据库、CDN 新用户专享折扣

Token Use

Token 是模型计费和上下文长度的基本单位。上下文越长,通常越贵、越慢。

减少 token 的方法:

  • 写清楚问题。
  • 开启上下文修剪。
  • 不把大日志全塞给模型。
  • 使用 Tokenjuice 压缩命令输出。

新手比喻

Token 像模型读字时用的小格子。你给它的上下文越长,小格子越多,费用和等待时间通常也越高。

什么时候特别注意

  • 让 Agent 读很长的日志。
  • 把整个仓库文件塞进一次对话。
  • 群聊长期不清理上下文。
  • 使用视频、图片说明或长语音转写。

继续阅读:Tokenjuice

用工程视角拆解 AI 智能体框架