做电商的朋友算过一笔账。
一个款,拍一套图。模特费、摄影费、场地费、后期修图,少则三五千,多则上万。
一个店一个月上新二十个款,光拍摄成本就是六位数。
要是能让AI替掉这环呢?
三个核心功能
AI模特生成。 不需要真人模特。输入服装图片,AI生成虚拟模特穿着这件衣服的效果图。可以选性别、肤色、体型。
虚拟试衣。 拿一张服装平铺图和一张模特图,AI把衣服"穿"到模特身上。不需要实际拍摄,合成效果自然。
场景更换。 白底图换成街拍、换成咖啡厅、换成任何场景。商品不变,背景随意切。
这三个功能串起来,意味着:拍一套平铺图,能产出所有渠道需要的素材。
技术选型
AI图像生成这块,试过几个方案。
SD本地部署:效果好,但显卡要求高,推理慢。中小商家跑不动。
商业API:Midjourney、DALL-E 3,效果没问题但成本太高,批量出图吃不消。
最后选了 Gemini 2.5 Flash Image。速度快、成本低、中文prompt支持好。对于电商这种需要批量出图的场景,性价比最高。
后端是Node.js + MongoDB。前端React 18。标准全栈方案,没什么花哨的。
踩过的坑
手部生成。 AI画手的问题大家都知道了。电商场景里手部不那么重要(主要是穿衣服的效果),但偶尔会出明显穿帮。解决方案是后处理加一轮检测,异常的自动重新生成。
一致性。 同一件衣服生成五张图,颜色和细节会有偏差。这个目前没有完美解法,靠prompt工程尽量控制。用固定的seed值能缓解一部分。
服装纹理。 针织、丝绸、牛仔,AI有时候分不清材质。需要在prompt里明确描述面料质感,否则出来的图不够专业。
成本对比
传统拍摄一个款:3000-10000元,周期3-7天。
AI生成一个款:电费+API调用,大概2-5元,10分钟出图。
中小商家一天上新十个款,一个月省下来的拍摄费够请两个运营。
不完美,但够用
AI生成的图和真人实拍比,专业的人一眼能看出来。
但电商80%的用图场景不需要那么完美——搜索列表缩略图、详情页辅助图、社交媒体素材,AI出图完全够。
真正需要质感的旗舰款、Lookbook,还是得真人拍。
两者结合着用,成本砍一半,效率翻三倍。
项目代码在 Gitee,感兴趣可以看看。