Skip to content

上下文窗口与压缩(Compaction)

每个模型都有一个 上下文窗口(可以看到的最大 Token 数)。长时间运行的聊天会累积消息和工具结果;一旦窗口接近上限,OpenClaw 会对较旧的历史记录进行 压缩 以保持在限制范围内。


什么是压缩

压缩会将 较旧的对话摘要化 为一个紧凑的摘要条目,并保持最近的消息完整。摘要存储在会话历史中,因此后续请求使用:

  • 压缩摘要
  • 压缩点之后的最近消息

压缩会 持久化 到会话的 JSONL 历史记录中。


配置

openclaw.json 中使用 agents.defaults.compaction 设置来配置压缩行为(模式、目标 Token 数等)。


自动压缩(默认开启)

当会话接近或超过模型的上下文窗口时,OpenClaw 会触发自动压缩,并可能使用压缩后的上下文重试原始请求。

你会看到:

  • 在详细模式下显示 🧹 Auto-compaction complete
  • /status 显示 🧹 Compactions: <count>

在压缩之前,OpenClaw 可以运行一次 静默的记忆刷新 轮次,将持久性笔记写入磁盘。参见记忆了解详情和配置。


手动压缩

使用 /compact(可选附带说明)来强制执行一次压缩:

/compact Focus on decisions and open questions

上下文窗口来源

上下文窗口是模型特定的。OpenClaw 使用配置的模型提供商(Provider)目录中的模型定义来确定限制。


压缩与修剪的区别

  • 压缩(Compaction):摘要化并 持久化 到 JSONL 中。
  • 会话修剪(Session pruning):仅修剪旧的 工具结果仅在内存中,按请求进行。

参见 /concepts/session-pruning 了解修剪详情。


提示

  • 当会话感觉陈旧或上下文臃肿时使用 /compact
  • 大型工具输出已经被截断;修剪可以进一步减少工具结果的累积。
  • 如果需要一个全新的开始,/new/reset 会开始一个新的会话 ID。

用工程视角拆解 AI 智能体框架