做电商的朋友算过一笔账。

一个款,拍一套图。模特费、摄影费、场地费、后期修图,少则三五千,多则上万。

一个店一个月上新二十个款,光拍摄成本就是六位数。

要是能让AI替掉这环呢?

三个核心功能

AI模特生成。 不需要真人模特。输入服装图片,AI生成虚拟模特穿着这件衣服的效果图。可以选性别、肤色、体型。

虚拟试衣。 拿一张服装平铺图和一张模特图,AI把衣服"穿"到模特身上。不需要实际拍摄,合成效果自然。

场景更换。 白底图换成街拍、换成咖啡厅、换成任何场景。商品不变,背景随意切。

这三个功能串起来,意味着:拍一套平铺图,能产出所有渠道需要的素材。

技术选型

AI图像生成这块,试过几个方案。

SD本地部署:效果好,但显卡要求高,推理慢。中小商家跑不动。

商业API:Midjourney、DALL-E 3,效果没问题但成本太高,批量出图吃不消。

最后选了 Gemini 2.5 Flash Image。速度快、成本低、中文prompt支持好。对于电商这种需要批量出图的场景,性价比最高。

后端是Node.js + MongoDB。前端React 18。标准全栈方案,没什么花哨的。

踩过的坑

手部生成。 AI画手的问题大家都知道了。电商场景里手部不那么重要(主要是穿衣服的效果),但偶尔会出明显穿帮。解决方案是后处理加一轮检测,异常的自动重新生成。

一致性。 同一件衣服生成五张图,颜色和细节会有偏差。这个目前没有完美解法,靠prompt工程尽量控制。用固定的seed值能缓解一部分。

服装纹理。 针织、丝绸、牛仔,AI有时候分不清材质。需要在prompt里明确描述面料质感,否则出来的图不够专业。

成本对比

传统拍摄一个款:3000-10000元,周期3-7天。

AI生成一个款:电费+API调用,大概2-5元,10分钟出图。

中小商家一天上新十个款,一个月省下来的拍摄费够请两个运营。

不完美,但够用

AI生成的图和真人实拍比,专业的人一眼能看出来。

但电商80%的用图场景不需要那么完美——搜索列表缩略图、详情页辅助图、社交媒体素材,AI出图完全够。

真正需要质感的旗舰款、Lookbook,还是得真人拍。

两者结合着用,成本砍一半,效率翻三倍。

项目代码在 Gitee,感兴趣可以看看。