工具系统
模型负责“想”,工具负责“做”。 如果没有工具,AI 只能在聊天框里回答;有了工具,它就可以查网页、打开浏览器、读写文件、运行命令、生成图片,甚至让手机或桌面节点帮它拍照、录屏、展示画布。
你可以把工具理解成给 AI 配的一套家用电器:浏览器像电视,命令行像工具箱,节点像远程遥控器。AI 不能随便乱碰,OpenClaw 会通过权限、审批和配置来约束它。
新手先知道这 4 点
工具不是聊天内容,而是动作能力。 AI 回答“我建议你运行测试”是一句话;AI 真的运行测试,就是用了工具。
工具越强,越要审批。 查网页风险低,运行命令、读写文件风险高。
先用默认权限。 不知道某个开关是什么意思时,不要急着放大权限。
出问题先看日志和审批记录。 很多“AI 没做事”,其实是工具没开、权限没给、或等待你批准。
常见工具
| 工具 | 能做什么 | 适合场景 |
|---|---|---|
| Browser 浏览器 | 打开网页、点击按钮、读取页面 | 登录后台、网页自动化、检查页面 |
| Browser Control API | 本地脚本控制浏览器 | 高级调试、内部集成 |
| Web 网络工具 | 搜索网页、抓取内容 | 查资料、读文档、做调研 |
| Web Fetch | 读取一个网页正文 | 已知 URL 的内容提取 |
| Exec 命令工具 | 在允许范围内运行命令 | 构建项目、跑测试、查看日志 |
| Code Execution | 远程 Python 沙盒分析 | 计算、统计、表格分析 |
| PDF 分析 | 阅读 PDF 文件 | 合同、论文、说明书 |
| Canvas 画布 | 在节点上展示可视化界面 | 手机/桌面交互、远程展示 |
| Image Generate 图像生成 | 生成图片 | 配图、草图、视觉素材 |
| Loop Detection 循环检测 | 发现无意义重复 | 防止 Agent 卡住反复调用 |
扩展能力
这些能力不一定像“一个按钮”那样直观,但非常有用。 如果你是第一次使用,可以先跳过这一节,等常见工具用顺了再回来。
- 技能 Skills:给 Agent 加一份专门说明书,比如“写周报时按这个格式”
- 创建技能:把经验沉淀成可复用能力
- 子智能体 Subagents:把一个大任务拆给多个 Agent
- 斜杠命令:用短命令触发固定动作
- BTW 临时问题:问旁支问题,不污染主会话
- Steer 引导:Agent 正忙时轻轻纠偏
- ACP Agents:把外部编码 harness 接进 OpenClaw
- ACP 设置:配置 acpx、权限和外部 CLI
- Agent Send CLI:从命令行把消息发给 Agent
- 插件专题:通过
openclaw.plugin.json声明和注册新能力 - Tokenjuice:压短 noisy 命令输出
- 轨迹导出:导出会话飞行记录
- Diffs 差异展示:把修改内容渲染成对比视图
- 添加能力 Cookbook:核心贡献者添加新能力的路线图
媒体工具
搜索提供商
web_search 可以接多个搜索提供商:
- Brave Search
- Exa Search
- Perplexity Search
- Gemini Search
- MiniMax Search
- Grok Search
- Kimi Search
- Tavily
- DuckDuckGo Search
- Ollama Web Search
- SearXNG Search
- Firecrawl
节点带来的工具
新版 OpenClaw 里,节点是很重要的一块。 节点可以是手机、桌面应用,也可以是远程机器。它们会连到网关,然后把自己的能力交给网关调度。
也就是说:手机不是另一个 OpenClaw 总服务台,它只是把相机、Canvas、语音这些能力借给 Gateway 使用。
节点可能提供这些能力:
- 摄像头:拍照或读取画面
- 录屏:记录屏幕片段
- 位置:读取设备位置
- Canvas:展示交互式界面
- 音频:语音输入或播放
安全原则
工具越强,越要管好。
尤其是 exec 这类命令工具,能读文件、跑脚本、启动程序。它很有用,但不应该无条件放开。
建议:
- 新手先使用默认策略
- 不熟悉的工具先不要开启太大权限
- 需要运行命令时,优先看 执行审批
- 远程网关不要暴露在公网裸奔
- 团队环境要记录谁触发了什么工具
一句话记住
工具不是越多越好,而是“够用、可控、能追踪”最好。
插件和工具是什么关系
插件像“安装包”,工具像“安装包提供出来的功能”。
比如一个插件安装后,可能提供一个“查公司订单”的工具。 插件负责把能力接进来,工具负责真正执行那件事。
一个插件可以提供:
- 新频道,比如某个聊天平台
- 新工具,比如一个公司内部查询工具
- 新命令,比如
/deploy - 新的配置页面或元数据
新版 OpenClaw 使用 manifest-first 的插件方式:先读 openclaw.plugin.json,知道插件叫什么、提供什么能力、需要什么权限,再决定是否加载运行时代码。
详细解释看 插件专题。
