用完万相 2.7,我悄悄卸载了电脑上的修图软件……
2026年4月2日 20:13·ithome
4 月 1 日,阿里巴巴正式发布图像生成与编辑统一模型 Wan2.7-Image,引起了很多网友的关注。
一直以来,AI 生图都有很多痛点问题,比如人物生成同质化严重,“AI 标准脸”让人审美疲劳;还有色彩不可控,让专业创作者难以对齐创作意图等等,很头疼。
而 Wan2.7-Image 主打的“千人千面”捏脸能力、“调色盘”精准色彩控制,恰好直击这些痛点。

基于更大规模数据训练的 Wan2.7-Image-Pro 版本也同步上线,在构图稳定性与语义理解精度上实现了进一步的提升。
作为 AI 生图的高频用户,小编在知道 Wan2.7-Image Pro 上线后,第一时间就进行了体验,现在小编把自己的体验感受给大家汇报一下,看看是否值得大家深度使用(下文测试使用的都是 Wan2.7-Image Pro,统一简称为“Wan2.7-Image”)。
一、千人千面:捏出真正的“活人感”
由于小编在工作中经常需要生成各种人物的配图,不过之前无论是用国内的还是国外模型,图生多了总觉得人物长得都差不多,用久了就不太爽。
所以这次体验中,小编首先针对 Wan2.7-Image Pro 主打的“千人千面”捏脸功能进行了多轮测试。
我们先尝试了基础定制需求,让它帮我生成一个中国女性生活照,其中对五官的要求比较细致,包括“鹅蛋脸”、“柳叶眉”、“带点肉感的秀鼻”“M 唇”、“梨涡”等特征。Wan2.7-Image 一次生成 4 张。

我们选择比较好的一张为例,可以看到,人物生成很自然,要求的特征都呈现出来了。

这里小编还使用之前常用的谷歌 Nano Banana Pro 进行对比,Nano Banana Pro 一次可生成 1 张。

仔细看 Nano Banana Pro 生成的也不错,唯一就是梨涡有点太突出了,不那么自然。

接着为了测试 Wan2.7-Image“千人千面”的捏脸能力,小编让它对图片中女生的样貌进行修改,要求它将这个女生的脸型修改为瓜子脸,眼睛改为丹凤眼,眉毛更淡一些,嘴唇改为嘟嘟唇。
Wan2.7-Image 很快给出了结果,果然,女生的样子真的变了,五官的更改符合要求,不过有个小问题就是脸上的梨涡没了。

Nano Banana Pro 这边,对女生的五官修改整体也不错,不过“嘟嘟唇”这一项修改得不太明显,至少没有 Wan2.7-Image 明显。

整体来说,Wan2.7-Image 确实能做到比较细致的人物五官定制化生成能力,大家可以直接用 AI 来“捏脸”了,这对于一些短剧与影视创作团队、或者虚拟偶像行业等大有用处,用它来做前期的人物造型、分镜预览设计等等,会很高效,或者对于电商、自媒体创作者来说,无论是定制专属的模特形象,还是打造个人 IP 的虚拟分身,都能通过这项功能快速实现,无需再依赖真人拍摄与后期修图。
二、精准调色盘:终结色彩盲盒
除了人物的生成,过去 AI 生图还有一个很严重的痛点,就是没法对色彩进行细致的自定义,你想要的唯美色彩,往往生成不出来,而生成出来的图片色彩往往不是你理想中的感觉,甚至有时候会比较“土”。
Wan2.7-Image 全新上线的“调色盘”功能,正是针对这一痛点给出的解决方案。
在实际使用过程中,如果你想要你的照片有某些独特的色彩艺术质感,就可以点击对话框右上方的“调色盘”功能,点开后,你就可以指定你想象中的颜色。Wan2.7-Image 默认给我们推荐了几种经典风格的色调,小编先从这些推荐的开始。

具体测试时,小编让 Wan2.7-Image 帮我生成一张具有“梦核”意境的阴天刮风老街的图片,然后选择推荐的“回忆”色调,这里面提供了 8 组颜色,生成的图片确实有我想象中的那种色彩艺术感。

接着同样的提示词小编再选择“蓝色”的色调,从淡蓝到黑的 8 种色号,生成的图片也遵循你指定的画面色调,满足小编想象中那种“梦幻”的感觉。

除了推荐的色彩,你也可以自己在调色盘里调整这 8 种色彩,比如小编自己调了一套色彩,调色的时候,你可以选择颜色的色号、色彩占比。

重新生成如下,面中的每一种颜色都完全贴合我指定的 HEX 参数,没有出现多余的杂色,也没有因为色彩的强制指定出现画面崩坏的问题。

而 Banana Pro 这边,虽然画面更精细,但色彩的风格就不可控,比如小编让它的画面风格偏孔雀蓝,而它生成多次也只能输出下面这种风格的蓝色。

另外 Wan2.7-Image 的调色盘还支持根据参考图色彩提取功能,还是上面这个画面,你想让它的色彩风格类似梵高的“星空”,那么就可以上传一张梵高《星空》的图片,Wan2.7-Image 会自动提取色彩。

这样,生成的画面风格就有梵高的《星空》的感觉了。

体验完之后,小编还是很喜欢“调色盘”这项功能的,它这是直接打通了 AI 生图从“能生成”到“可商用”的壁垒。比如对于商业设计师来说,无论是品牌海报、线下物料还是电商详情页的设计,都能通过调色盘功能精准对齐品牌 VI 规范,无需再经过后期软件的反复调色,又或者是对于艺术创作者而言,也可以快速复刻经典艺术作品的色系风格,完成不同色调的创作尝试。
三、超长文本渲染:实现印刷级 A4 纸全页输出
文本渲染能力,一直是 AI 生图模型的传统短板。过去绝大多数生图模型都只能处理简短的标题类文字,一旦输入长文本,就很容易出现文字模糊、内容错乱、缺字漏字,甚至是乱码的问题。
而凭借长上下文文本编码(Long Context Text Encoder)解析超长序列,Wan2.7-image 对超长文字、表格和复杂公式的渲染可达印刷级,支持 12 种语言,最高 3K tokens 的超长文字输入,可输出一页 A4 纸的论文。
测试时,小编让 Wan2.7-image 生成一张“书桌上一个笔记本上写着《Wish You Were Here》歌词的原文”的图片,重点看笔记本上歌词的原文,Wan2.7-image 生成的图片中,笔记本上的歌词没有错误,并且还有合理的排版。

Nano Banana Pro 这边生成的图片相对不那么美观,不过文字渲染也是正确的,没有错误。

接着小编又提升了测试难度,加入了复杂的数理公式、不同语言的文字。具体来说,小编让 Wan2.7-image 生成数学老师上课的黑板板书,板书上分别是等差数列、等比数列的定义和三个基本公式。在提示词中,小编没有将这些具体的内容写出来,而是让 Wan2.7-image 根据自己掌握的知识来生成。

先看 Wan2.7-image 生成的结果,整体来看,板书的内容还是非常丰富的,数学公式也能写出来,内容基本上也是对的,其中也有一些小错误,比如等比数列的前 n 项公式,第一个应该是当“q≠1”。

Nano Banana Pro 生成的板书内容则有点简单,定义的描述比较模糊,等比中项公式只给出了基本公式。两者算是各有千秋吧。

四、交互式编辑:哪里不对改哪里
很多时候 AI 生图都不是“一次生成就完事”的工作,还需要根据生成的内容修改调整到满意的效果。
但在过往的 AI 生图体验中,局部修改一直是比较困难的:往往只是想调整画面中的一个小元素,结果整个画面的风格、内容都发生了改变,想要实现精准的局部修改,几乎只能依靠专业的后期软件。
Wan2.7-Image 原生搭载的交互式编辑功能,就解决了这个痛点。在体验过程中,小编上传一张有序摆放各种物品的办公桌的照片。

然后小编在图像生成对话框左上角的选项中选择框选,然后点开图片进行框选,目前单次支持框选 1-2 个需要编辑的区域,支持消除、修改、添加、移动、尺寸变化等指令,整个交互体验很直观。

接着,小编在《高等数学》课本和手机上进行框选。

然后给出指令,让它将框选的物品互换位置。Wan2.7-Image 很快进行了修改,改后如下:

可以看到,修改后的图片手机和课本确实互换了位置,图片中其他的元素没有变化。
而 Banana Pro 这边,只能通过提示词指定明确的途中物品元素然后进行修改,改过后,虽然手机和课本的位置互换了,但课本挡住了笔记本,也算是对画面其他元素产生的修改。


在多轮测试中,无论是元素的添加、删除、移动,还是内容的替换、对齐,Wan2.7-Image 都能实现像素级的意图对齐,完全不会出现“一改全崩”的问题。
这种“哪里不爽点哪里”的编辑体验,无限贴近了专业设计软件的操作逻辑,却大幅降低了操作门槛,哪怕是没有设计基础的普通用户,也能快速完成画面的细节调整。
这下,像小编这样经常需要简单修图的人群,基本上可以告别各种修图软件了,直接用 Wan2.7-Image 就能快捷地满足日常工作地改图所需。
五、组图生成
Wan2.7-Image 还具备强大的组图生成能力,支持的图像数量可生成多达 12 张,用于批量制作同风格系列图、PPT 配图、分镜脚本、电商模特套图及多视角建筑图。
在测试中,小编将组图最大数量调节至 12,然后给它一段《卖火柴的小女孩》的开头部分的文本,让它帮我生成一组 12 张图片构成的电影分镜脚本。

可以看到 Wan2.7-Image 生成的分镜脚本还是非常不错的,12 张图人物高度一致,有全景有特写,故事逻辑也连贯,还有一定的台词,基本上可以作为分镜脚本参考了。

再看 Nano Banana Pro 生成的组图,整体表现也不错,不过在故事逻辑上存在一些问题,比如小女孩先是赤脚,然后才出现鞋子跑掉的画面,逻辑顺序反了,还有火柴竟然是擦墙点燃的,不符合逻辑。

六、多主体一致性:系列创作不翻车,最高支持 9 图参考
在复杂图片的创作中,多主体一致性一直是 AI 生图的核心难题。无论是制作影视分镜、海报,还是多人合影,都需要保证每个主体在不同画面中的一致性。过去的模型在面对多主体时,往往会出现注意力分散,换个图片,形象就变了的问题。而在 Wan2.7-Image 上,它的多主体一致性最高支持输入 9 张图片作为参考源。对于合影、电影海报及家具组合图等,可保持风格与特征的统一。
比如测试时小编找来 7 张西游记中的人物穿着现代衣服的照片让它作为参考图,然后让 Wan2.7-Image 以这 7 个人物为主体设计一张《西游商战篇》的电影海报。

可以看到,Wan2.7-Image 生成的海报还是比较出色的,7 个人物形象都保持了一致,海报的风格也满足小编的要求。

而 Nano Banana Pro 这边也可以将参考图合并成电影海报,优势是画面元素更丰富精致,但是在人物一致性上,女儿国国王的形象出现了偏差。

可见在多主体的一致性上,Wan2.7-Image 确实展现出不俗的表现。对于 IP 创作者来说,无论是虚拟形象、潮玩 IP 的多视角延展,还是系列漫画的创作,都能保证 IP 形象的一致性;而对于办公场景,系列化的 PPT 配图、企业宣传物料的制作,也能通过这项能力实现风格的统一,提升内容的专业度。
最后值得一提的是,对于时下大火的“龙虾热”,Wan2.7-image 现已支持 skill 调用,让龙虾画画。
具体步骤也不复杂,你只需在你的龙虾里通过对话安装 SKills,告诉他“帮我安装 SKills:https://github.com/ Wan-Video / Wan-skills”。

然后按照提示告诉龙虾你的阿里云百炼 API Key。

然后就可以用龙虾开启你的对话生图体验,比如小编在测试时让它生成了一个年轻女性的照片,龙虾很快就帮我完成了图像的生成。



七、总结
经过多轮的深度体验,Wan2.7-Image 给我们带来的最大感受,是它真正跳出了传统 AI 生图模型“重生成、轻理解,重效果、轻可控”的固有框架,从底层技术架构出发,解决了当前 AI 生图领域的多个核心痛点。
而这种体验上的飞跃,源于模型底层的技术重构。
Wan2.7-Image 采用了生成与理解统一的模型架构,通过共享隐空间实现语义映射,让文字与画面实现了深度绑定,模型无需再去猜测文字对应的画面内容,大幅提升了语义理解的精准度。
同时,模型在训练流程中引入了多模态指令训练,实现了从单纯的“像素拟合”到“底层语义认知”的本质飞跃。
除此之外,超大规模的异构数据底座,覆盖了全域品类的视觉素材与理解类数据,配合多维度的精细标注体系与分阶段训练策略,让模型即便是在复杂的长尾场景中,也能保持极高的生成稳健度。
在权威的人类偏好盲测中,Wan2.7-Image 的文生图能力已经超过了 GPT-Image1.5 与国内主流模型,在文本渲染、照片级成像、世界知识三大核心指标上,已经无限接近 Nano Banana Pro,同时整体的人类偏好盲测评分位列国内第一。

小编在上面和 Nano Banana Pro 的对比体验中也有这个感觉,Wan2.7-Image 在许多项目和体验上已经很接近天花板级别的 Nano Banana Pro 上,在人物捏脸、图像编辑等某些体验上还能有更好的生成效果。说它是国内目前最顶尖的生图模型,不为过。
整体来说,Wan2.7-Image 已经构建起了“文生图、图生组图、图像指令编辑、交互式编辑”的完整能力闭环,无论是普通用户的日常创作,还是专业创作者的商用级需求,都能得到全面的满足。
也许很快,我们传统的各种修图 PS 软件,真的就统统都不需要了……
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。





