新手注意事项:
可直接复制本文链接给到openclaw学习,可复现此功能。
训练前请先开启新会话,避免会话丢失,上下文失效。
本文由openclaw基于实现功能后的自动总结生成。
基于本文的学习复现后需要自己再调优训练。
图片模型appkey地址:https://dashscope.console.aliyun.com/
一、背景与目标
中医堂需要定期制作朋友圈推广海报,内容包括:
- 主标题、副标题
- 卖点标签(2-5个)
- 品牌Logo
- 行动指引(预约信息)
- 国风/简约等风格要求
目标: 不需要设计师,每次给AI需求,直接出图。
二、遇到的问题
问题1:AI助手没有图片生成能力
OpenClaw自带的模型无法直接生成图片,需要接入外部AI绘图API。
问题2:API接入踩坑
我们尝试接入阿里云通义万相(DashScope),过程并非一帆风顺:
| 阶段 | 尝试方案 | 结果 |
| 初期 | 直接调用文本模型接口 | Key有效,但不知道图像接口路径 |
| 第二阶段 | 测试wan2.5-t2i-preview模型 | 生成成功,但中文渲染极差 |
| 第三阶段 | 测试qwen-image模型 | 报错”不支持同步调用” |
| 第四阶段 | 尝试多种API路径 | 全部404或模型不存在 |
| 关键突破 | 发现必须加 X-DashScope-Async: enable header | ✅ qwen-image异步调用成功! |
问题3:尺寸搞错
第一批生成的海报是 1024×1024(正方形),不是朋友圈标准的 9:16竖版。
最终发现API支持的尺寸参数:
1024*1792= 竖版9:16 ✅(朋友圈海报标准)1024*1024= 正方形1792*1024= 横版16:9
问题4:Logo无法精确合成
AI生图API只能根据文字描述生成Logo,无法把真实的logo图片文件精确合成进去。
三、关键技术突破
1. API正确调用方式
API地址:
https://dashscope.aliyuncs.com/api/v1/services/aigc/text2image/image-synthesis
必须添加的Header:
X-DashScope-Async: enable
⚠️ 不加这个header会报错:AccessDenied – 不支持同步调用
可用模型(qwen-image系列):
| 模型 | 中文渲染 | 推荐场景 |
| qwen-image | ✅ 优秀 | 直接生成带中文海报 (首选) |
| qwen-image-plus | ✅ 优秀 | 高质量中文图 |
| qwen-image-2.0 | ✅ 卓越(理论上) | 暂不支持当前Key的API路径 |
| wan2.5-t2i-preview | ❌ 差 | 仅生成背景场景图 |
2. 完整调用流程
Step 1:提交生成任务
curl -X POST "https://dashscope.aliyuncs.com/api/v1/services/aigc/text2image/image-synthesis" \
-H "X-DashScope-Async: enable" \
-H "Authorization: Bearer 你的API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen-image",
"input": {"prompt": "完整海报描述(含中文文案)"},
"parameters": {"size": "1024*1792", "n": 1}
}'
返回:{"task_id": "xxx", "task_status": "PENDING"}
Step 2:等待并查询结果(等15-25秒)
curl -X GET "https://dashscope.aliyuncs.com/api/v1/tasks/你的task_id" \
-H "Authorization: Bearer 你的API_KEY"
状态流转:PENDING → RUNNING → SUCCEEDED(成功)/ FAILED(失败)
Step 3:下载图片 从返回结果的 results[0].url 下载图片文件。
四、生成案例展示
案例一:针灸美容完整版海报(直接生成)
Prompt内容:
- 主标题:针藏美丽·灸出好气色
- 副标题:中医针灸美容·根源养颜
- 场景:高端中医诊所内部,暖白玫瑰金调
- 底部标签:自然变美/随做随走/无副作用/改善气色/长期维养
- Logo:中医堂(AI根据描述生成)
- 尺寸:1024×1792(9:16竖版)
生成结果:
(注:此版本Logo为AI根据描述绘制,非真实Logo)
案例二:春季养颜黄金期海报(国风)
原始需求:
- 主标题:春季养颜黄金期
- 副标题:针灸美容·从内到外养出好气色
- 卖点:改善暗沉 · 细腻肌肤 · 淡化细纹
- 行动指引:扫码预约·仅限前50名
- 风格:中医元素,国风
- 尺寸:9:16
- Logo:中医堂女子医学抗衰中心
第一版(错误尺寸1024×1024,正方形):
第二版(正确尺寸1024×1792,竖版9:16):
(注:此版本Logo同样为AI根据描述绘制)
五、Prompt撰写规范
给AI需求时,按以下结构描述:
主标题:xxx
副标题:xxx
卖点:xxx · xxx · xxx(用分隔符隔开)
行动指引:xxx
风格:xxx
尺寸:9:16(朋友圈海报)
Logo:品牌名(有就提供,无就说"不需要")
示例:
主标题:夏季祛湿好时机 副标题:中医埋线减肥·不节食不反弹 卖点:躺着瘦 / 无需运动 / 7天见效 行动指引:扫码预约·送体质检测一次 风格:新中式,绿色自然风 尺寸:朋友圈海报9:16 Logo:中医堂
六、当前局限与优化方向
当前局限
| 问题 | 说明 |
| Logo合成 | qwen-image只能根据描述画Logo,无法直接粘贴真实Logo文件 |
| 尺寸 | 竖版最大支持1024×1792 |
| 生成速度 | 每张图约需15-30秒 |
| Prompt依赖 | 海报效果高度依赖Prompt描述的准确性 |
优化方向
- Logo合成:先生成不带Logo的海报底图,再用Python/PIL将真实logo.png合成进去(两步骤)
- Prompt模板:针对不同主题(针灸美容/埋线减肥/脾胃调理)固化Prompt模板
- 多图并行:可同时生成多张不同风格/方案的图,供选择
七、经验总结
踩过的坑:
- ❌ 以为Key有效就能调所有模型(实际上每个模型需要单独开通权限)
- ❌ 没加异步header导致所有图像接口都报AccessDenied
- ❌ 用错了尺寸参数1024×1024,导致第一批图都是正方形
- ❌ 以为AI能直接把真实Logo文件合成进去(实际只能画Logo)
成功的关键:
- ✅ 找到正确的API路径 + X-DashScope-Async header
- ✅ qwen-image模型的中文渲染能力超出预期
- ✅ 尺寸参数1024×1792正好满足9:16需求
- ✅ Prompt结构清晰 = 生成效果稳定
文档版本: v1.0 最后更新: 2026-03-20



八、图片案例说明
上文三张图片分别为:
图1:针灸美容完整版海报
- 说明:qwen-image模型直接生成,含所有中文文案
- 尺寸:1024×1024(正方形,早期测试版本)
- 注意:此版本Logo为AI根据描述绘制,非真实Logo文件
图2:春季养颜黄金期海报(错误尺寸版本)
- 说明:尺寸为1024×1024正方形,非朋友圈标准9:16
- 属于踩坑记录,示意尺寸参数的重要性
图3:春季养颜黄金期海报(正确尺寸版本)✅
- 说明:尺寸为1024×1792,竖版9:16,符合朋友圈海报标准
- 所有中文内容(主标题/副标题/标签/Logo/行动指引)均为AI直接渲染
- 达到可用水准
发表回复