openclaw小龙虾如何自动调用图片生成大模型生成图片?基于阿里千问qwen-image

新手注意事项:
可直接复制本文链接给到openclaw学习,可复现此功能。
训练前请先开启新会话,避免会话丢失,上下文失效。
本文由openclaw基于实现功能后的自动总结生成。
基于本文的学习复现后需要自己再调优训练。
图片模型appkey地址:https://dashscope.console.aliyun.com/

一、背景与目标

中医堂需要定期制作朋友圈推广海报,内容包括:

  • 主标题、副标题
  • 卖点标签(2-5个)
  • 行动指引(预约信息)
  • 国风/简约等风格要求

目标: 不需要设计师,每次给AI需求,直接出图。


二、遇到的问题

问题1:AI助手没有图片生成能力

OpenClaw自带的模型无法直接生成图片,需要接入外部AI绘图API。

问题2:API接入踩坑

我们尝试接入阿里云通义万相(DashScope),过程并非一帆风顺:

阶段尝试方案结果
初期直接调用文本模型接口Key有效,但不知道图像接口路径
第二阶段测试wan2.5-t2i-preview模型生成成功,但中文渲染极差
第三阶段测试qwen-image模型报错”不支持同步调用”
第四阶段尝试多种API路径全部404或模型不存在
关键突破发现必须加 X-DashScope-Async: enable header✅ qwen-image异步调用成功!

问题3:尺寸搞错

第一批生成的海报是 1024×1024(正方形),不是朋友圈标准的 9:16竖版

最终发现API支持的尺寸参数:

  • 1024*1792 = 竖版9:16 ✅(朋友圈海报标准)
  • 1024*1024 = 正方形
  • 1792*1024 = 横版16:9

AI生图API只能根据文字描述生成Logo,无法把真实的logo图片文件精确合成进去。


三、关键技术突破

1. API正确调用方式

API地址:

https://dashscope.aliyuncs.com/api/v1/services/aigc/text2image/image-synthesis

必须添加的Header:

X-DashScope-Async: enable

⚠️ 不加这个header会报错:AccessDenied – 不支持同步调用

可用模型(qwen-image系列):

模型中文渲染推荐场景
qwen-image✅ 优秀直接生成带中文海报 (首选)
qwen-image-plus✅ 优秀高质量中文图
qwen-image-2.0✅ 卓越(理论上)暂不支持当前Key的API路径
wan2.5-t2i-preview❌ 差仅生成背景场景图

2. 完整调用流程

Step 1:提交生成任务

curl -X POST "https://dashscope.aliyuncs.com/api/v1/services/aigc/text2image/image-synthesis" \
  -H "X-DashScope-Async: enable" \
  -H "Authorization: Bearer 你的API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen-image",
    "input": {"prompt": "完整海报描述(含中文文案)"},
    "parameters": {"size": "1024*1792", "n": 1}
  }'

返回:{"task_id": "xxx", "task_status": "PENDING"}

Step 2:等待并查询结果(等15-25秒)

curl -X GET "https://dashscope.aliyuncs.com/api/v1/tasks/你的task_id" \
  -H "Authorization: Bearer 你的API_KEY"

状态流转:PENDING → RUNNING → SUCCEEDED(成功)/ FAILED(失败)

Step 3:下载图片 从返回结果的 results[0].url 下载图片文件。


四、生成案例展示

案例一:针灸美容完整版海报(直接生成)

Prompt内容:

  • 主标题:针藏美丽·灸出好气色
  • 副标题:中医针灸美容·根源养颜
  • 场景:高端中医诊所内部,暖白玫瑰金调
  • 底部标签:自然变美/随做随走/无副作用/改善气色/长期维养
  • Logo:中医堂(AI根据描述生成)
  • 尺寸:1024×1792(9:16竖版)

生成结果:

(注:此版本Logo为AI根据描述绘制,非真实Logo)


案例二:春季养颜黄金期海报(国风)

原始需求:

  • 主标题:春季养颜黄金期
  • 副标题:针灸美容·从内到外养出好气色
  • 卖点:改善暗沉 · 细腻肌肤 · 淡化细纹
  • 行动指引:扫码预约·仅限前50名
  • 风格:中医元素,国风
  • 尺寸:9:16
  • Logo:中医堂女子医学抗衰中心

第一版(错误尺寸1024×1024,正方形):

第二版(正确尺寸1024×1792,竖版9:16):

(注:此版本Logo同样为AI根据描述绘制)


五、Prompt撰写规范

给AI需求时,按以下结构描述:

主标题:xxx
副标题:xxx
卖点:xxx · xxx · xxx(用分隔符隔开)
行动指引:xxx
风格:xxx
尺寸:9:16(朋友圈海报)
Logo:品牌名(有就提供,无就说"不需要")

示例:


六、当前局限与优化方向

当前局限

问题说明
Logo合成qwen-image只能根据描述画Logo,无法直接粘贴真实Logo文件
尺寸竖版最大支持1024×1792
生成速度每张图约需15-30秒
Prompt依赖海报效果高度依赖Prompt描述的准确性

优化方向

  1. Logo合成:先生成不带Logo的海报底图,再用Python/PIL将真实logo.png合成进去(两步骤)
  2. Prompt模板:针对不同主题(针灸美容/埋线减肥/脾胃调理)固化Prompt模板
  3. 多图并行:可同时生成多张不同风格/方案的图,供选择

七、经验总结

踩过的坑:

  • ❌ 以为Key有效就能调所有模型(实际上每个模型需要单独开通权限)
  • ❌ 没加异步header导致所有图像接口都报AccessDenied
  • ❌ 用错了尺寸参数1024×1024,导致第一批图都是正方形

成功的关键:

  • ✅ 找到正确的API路径 + X-DashScope-Async header
  • ✅ qwen-image模型的中文渲染能力超出预期
  • ✅ 尺寸参数1024×1792正好满足9:16需求
  • ✅ Prompt结构清晰 = 生成效果稳定

文档版本: v1.0 最后更新: 2026-03-20


八、图片案例说明

上文三张图片分别为:

图1:针灸美容完整版海报

  • 说明:qwen-image模型直接生成,含所有中文文案
  • 尺寸:1024×1024(正方形,早期测试版本)

图2:春季养颜黄金期海报(错误尺寸版本)

  • 说明:尺寸为1024×1024正方形,非朋友圈标准9:16
  • 属于踩坑记录,示意尺寸参数的重要性

图3:春季养颜黄金期海报(正确尺寸版本)✅

  • 说明:尺寸为1024×1792,竖版9:16,符合朋友圈海报标准
  • 所有中文内容(主标题/副标题/标签/Logo/行动指引)均为AI直接渲染
  • 达到可用水准

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注