Skip to content

广告 · 本站推荐

腾讯云特惠活动 · 云服务器、数据库、CDN 新用户专享折扣

Browser Control API:给本机集成用的浏览器遥控口

OpenClaw 的浏览器工具平时由 Agent 自动使用。Browser Control API 是更底层的本地接口,适合调试、脚本集成和高级自动化。

普通用户先看 浏览器工具。这一页是给“我要自己写脚本控制浏览器”的人看的。


它能做什么?

Gateway 会在本机提供一组浏览器控制接口,常见能力包括:

  • 启动或停止浏览器。
  • 打开、聚焦、关闭标签页。
  • 获取页面快照和截图。
  • 导航到 URL。
  • 点击、输入、等待。
  • 查看控制台、网络请求、错误。
  • 管理 Cookie、Local Storage、权限和地理位置。

你可以把它理解成:Agent 平时用的是遥控器,这个 API 是遥控器背后的按键线路。


安全边界

这个接口应该只给本机或可信内网使用。

如果 Gateway 配了共享 token 或密码,浏览器控制接口也需要认证:

http
Authorization: Bearer <gateway token>

或使用 Gateway 密码对应的认证方式。

WARNING

不要把浏览器控制接口直接暴露到公网。它能操作浏览器,也可能访问登录状态里的网页。


Playwright 依赖

高级点击、输入、AI 快照、元素截图和 PDF 导出通常需要 Playwright。

如果你看到类似“Playwright 不可用”的错误,先更新或重新安装 OpenClaw。Docker 环境还要确认 Chromium 浏览器二进制已安装并持久化。


什么时候用它?

适合:

  • 调试浏览器工具为什么点不到元素。
  • 写内部脚本控制 OpenClaw 浏览器。
  • 连接远程 Chrome CDP。
  • 需要截图、PDF、请求日志的自动化流程。

不适合:

  • 普通网页搜索。
  • 只想让 Agent 打开页面看一眼。
  • 没有认证保护的远程暴露。

继续阅读

用工程视角拆解 AI 智能体框架