Browser Control API:给本机集成用的浏览器遥控口
OpenClaw 的浏览器工具平时由 Agent 自动使用。Browser Control API 是更底层的本地接口,适合调试、脚本集成和高级自动化。
普通用户先看 浏览器工具。这一页是给“我要自己写脚本控制浏览器”的人看的。
它能做什么?
Gateway 会在本机提供一组浏览器控制接口,常见能力包括:
- 启动或停止浏览器。
- 打开、聚焦、关闭标签页。
- 获取页面快照和截图。
- 导航到 URL。
- 点击、输入、等待。
- 查看控制台、网络请求、错误。
- 管理 Cookie、Local Storage、权限和地理位置。
你可以把它理解成:Agent 平时用的是遥控器,这个 API 是遥控器背后的按键线路。
安全边界
这个接口应该只给本机或可信内网使用。
如果 Gateway 配了共享 token 或密码,浏览器控制接口也需要认证:
http
Authorization: Bearer <gateway token>或使用 Gateway 密码对应的认证方式。
WARNING
不要把浏览器控制接口直接暴露到公网。它能操作浏览器,也可能访问登录状态里的网页。
Playwright 依赖
高级点击、输入、AI 快照、元素截图和 PDF 导出通常需要 Playwright。
如果你看到类似“Playwright 不可用”的错误,先更新或重新安装 OpenClaw。Docker 环境还要确认 Chromium 浏览器二进制已安装并持久化。
什么时候用它?
适合:
- 调试浏览器工具为什么点不到元素。
- 写内部脚本控制 OpenClaw 浏览器。
- 连接远程 Chrome CDP。
- 需要截图、PDF、请求日志的自动化流程。
不适合:
- 普通网页搜索。
- 只想让 Agent 打开页面看一眼。
- 没有认证保护的远程暴露。
