OpenClaw 是什么？

OpenClaw 是一款自托管的多通道 AI 助手平台，通过 Gateway 统一连接控制 UI、聊天通道、节点、工具和模型，让你的 AI 助手在浏览器、手机和常用聊天软件中运行。

OpenClaw 支持哪些聊天平台？

OpenClaw 支持 WhatsApp、Telegram、Discord、Slack、Signal、iMessage、飞书（Feishu）、Mattermost、Google Chat、MS Teams、Matrix、Zalo、IRC 等主流即时通讯平台。

OpenClaw 支持哪些 AI 模型？

OpenClaw 支持 Anthropic Claude、OpenAI GPT、DeepSeek、通义千问（Qwen）、Kimi（月之暗面）、智谱 GLM、MiniMax、Ollama 本地大模型，以及通过 OpenRouter、LiteLLM、Cloudflare AI Gateway 接入的其他模型。

OpenClaw 怎么安装？

OpenClaw 推荐通过安装脚本或 npm 安装，然后运行 openclaw onboard --install-daemon 完成向导配置并安装 Gateway 后台服务。支持 macOS、Linux、Windows，Windows 完整体验推荐 WSL2。

OpenClaw 和 ClawdBot 是什么关系？

OpenClaw 的前身就是 ClawdBot，项目品牌升级后正式更名为 OpenClaw，功能与代码库保持延续，如果你之前使用过 ClawdBot，OpenClaw 就是它的新版本。

OpenClaw Gateway 是什么？

OpenClaw Gateway 是核心常驻进程，负责统一管理所有通道连接、消息路由、Agent 调度与会话存储。通过 openclaw gateway 命令启动，默认监听 18789 端口。

OpenClaw 支持本地大模型吗？

支持。OpenClaw 可通过 Ollama 接入本地大模型（如 Llama、Qwen、DeepSeek 等），实现完全私有化部署，无需外部 API，数据不出本地。

AI 图像生成工具（image_generate）

想象一下：你在和 AI 聊天，突然说一句"帮我画一张赛博朋克风格的猫咪"，然后 AI 真的就把图片画出来发给你了。这就是 image_generate 工具能做到的事情。

OpenClaw 内置了图像生成能力，无需额外安装插件，配置好 API Key 即可直接在聊天中生成图片。

和图像分析工具的区别

OpenClaw 有两个不同的图像相关工具：

image_generate（本文）：让 AI 创作图片，从文字描述生成全新图像
image：让 AI 理解图片，分析你发过去的图片内容

两者功能完全不同，请勿混淆。

快速上手

第一步：获取 Google Gemini API Key

image_generate 默认使用 Google 的 gemini-3-pro-image-preview 模型，需要 Gemini API Key。

访问 Google AI Studio
登录并创建一个 API Key
将 API Key 设置为环境变量：

bash

export GEMINI_API_KEY="your-api-key-here"

没有 Gemini API Key？

如果你暂时无法访问 Google Gemini，也可以使用 fal.ai 作为备用图像生成服务。详见本页末尾的备用方案。

第二步：配置图像生成模型

在你的 OpenClaw 配置文件中添加以下内容：

json5

{
  agents: {
    defaults: {
      imageGenerationModel: "google/gemini-3-pro-image-preview"
    }
  }
}

第三步：开始画图！

配置完成后，直接在聊天窗口里说：

text

帮我画一张夕阳下的富士山，水彩画风格

Agent 会自动调用 image_generate 工具，生成图片并返回给你。就这么简单！

使用示例

基础生图

直接描述你想要的画面，Agent 就能理解并生成：

text

画一只穿着宇航服的柴犬，站在月球上，背景是星空

text

生成一张极简风格的咖啡馆插画，暖色调，有一个人在看书

指定图片数量

你可以一次生成多张图片（最多 4 张），方便挑选：

text

帮我画一个 Logo 设计方案，要 3 张不同风格的，我来挑选

count 参数支持 1 到 4，一次生成多张让你有更多选择。

指定分辨率

有时候你需要高清图片，可以明确告诉 Agent：

text

生成一张 4K 高清的森林晨雾风景图，写实风格

分辨率支持 1K、2K、4K，默认生成标准清晰度。

参考图片进行二次创作

你可以上传一张参考图，让 AI 基于它进行再创作或风格迁移：

text

（发送参考图片）
请参考这张图的构图风格，重新画一张赛博朋克城市夜景

参数说明

image_generate 工具支持以下参数：

参数	说明	可选值
`action`	操作类型	`generate`（生成）、`list`（列出已生成）
`prompt`	图像描述，越详细越好	任意文字
`model`	使用的图像生成模型	默认 `google/gemini-3-pro-image-preview`
`image` / `images`	参考图（编辑模式）	图片文件或 URL
`size`	图片尺寸	取决于所用模型
`resolution`	分辨率	`1K`、`2K`、`4K`
`count`	一次生成几张	`1`～`4`

让描述更精准

图像生成的质量很大程度取决于你的描述。试着加入以下要素：

风格：水彩画、油画、像素风、摄影写实、极简线条……
色调：暖色调、冷色调、黑白、复古滤镜……
构图：特写、全景、俯视角、黄金分割……
细节：光线、材质、时间（清晨/黄昏）、季节……

完整配置参考

json5

{
  agents: {
    defaults: {
      // 图像生成模型（image_generate 工具使用）
      imageGenerationModel: "google/gemini-3-pro-image-preview",

      // 图像理解模型（image 分析工具使用，与生成无关）
      imageModel: "google/gemini-2.0-flash"
    }
  }
}

备用方案：fal.ai

如果你无法使用 Google Gemini，OpenClaw 支持通过 fal.ai 进行图像生成。

访问 fal.ai 注册账号
获取 API Key
设置环境变量：

bash

export FAL_KEY="your-fal-api-key-here"

在配置中指定 fal.ai 上的模型，例如：

json5

{
  agents: {
    defaults: {
      imageGenerationModel: "fal-ai/flux/schnell"
    }
  }
}

注意模型名称格式

使用 fal.ai 时，模型名称需要使用 fal.ai 平台上的模型 ID，具体可用模型请参考 fal.ai 模型列表。

常见问题

为什么 Agent 没有生成图片，只是描述了一下？

可能是以下原因：

imageGenerationModel 未配置，工具不知道用哪个模型
API Key 未正确设置或无效
Agent 的工具权限中 image_generate 被禁用了

检查配置文件和环境变量是否正确，再试一次。

生成图片消耗的是 API 额度吗？

是的。图像生成会消耗你的 Gemini API 或 fal.ai 账户额度，具体费用请参考各平台的定价页面。建议先用免费额度体验，确认效果后再考虑付费计划。

可以让 AI 对已有图片进行修改吗？

可以！把参考图片发给 Agent，同时描述你想要的修改，image_generate 的编辑模式（image/images 参数）会基于参考图生成新版本。

下一步：网络工具 | 工具系统总览

AI 图像生成工具（image_generate） ​

快速上手 ​

第一步：获取 Google Gemini API Key ​

第二步：配置图像生成模型 ​

第三步：开始画图！ ​

使用示例 ​

基础生图 ​

指定图片数量 ​

指定分辨率 ​

参考图片进行二次创作 ​

参数说明 ​

完整配置参考 ​

备用方案：fal.ai ​

常见问题 ​

AI 图像生成工具（image_generate）

快速上手

第一步：获取 Google Gemini API Key

第二步：配置图像生成模型

第三步：开始画图！

使用示例

基础生图

指定图片数量

指定分辨率

参考图片进行二次创作

参数说明

完整配置参考

备用方案：fal.ai

常见问题