Stable Diffusion局部重绘与涂鸦重绘:精准控制AI图像生成的核心技巧

1. 项目概述:从“修图”到“创图”的思维跃迁

如果你还在用传统修图软件,费劲地想把照片里不想要的电线杆P掉,或者想把一件普通T恤换成想象中的华丽礼服,那么是时候了解一下Stable Diffusion的“图生图”功能了。这不仅仅是“修图”,而是一种基于深度学习的“内容生成”。你提供一张草图、一张照片,甚至是一个模糊的想法,AI就能在理解原图内容的基础上,为你创造出全新的、符合逻辑的画面。而“局部重绘”和“涂鸦重绘”,正是这个强大功能中最具操控性的两把“手术刀”,它们能让你精准地告诉AI:“我只想改变画面的这一小块地方,其他地方请保持原样。”

很多新手在初次接触时,会把“局部重绘”简单理解为Photoshop的“内容识别填充”升级版,把“涂鸦重绘”当成高级版的“画笔工具”。这种类比有助于理解,但远远不够。它们的核心差异在于工作逻辑:局部重绘是你划定一个“禁区”,告诉AI“这里的内容我不满意,你根据我的文字描述重新画”;而涂鸦重绘则是你拿起“魔法画笔”,用简单的色块勾勒出你想要的形状和颜色倾向,AI则根据这些色块和你的描述,去“理解”并“渲染”出具体的物体。理解这个根本区别,是玩转这两个功能、避免“翻车”的第一步。无论是想给人物换装、给场景换天、修复老照片的破损部分,还是为设计稿快速生成多种风格的局部方案,掌握这两项技能都能让你的创作效率和质量获得质的飞跃。

2. 核心功能原理与操作逻辑拆解

2.1 局部重绘:基于蒙版的精准内容替换

局部重绘的核心是“蒙版”(Mask)。你可以把它想象成一张覆盖在原图上的透明薄膜,你用画笔在这张薄膜上涂黑的地方,就是告诉AI:“这里需要被重新生成。”白色的地方则是“请保持原样”。这个过程的底层逻辑是,AI会先分析你的原图(即“图生图”的输入),然后结合你提供的提示词(Prompt),在蒙版指定的区域内,进行扩散模型(Diffusion Model)的“去噪”生成过程。关键点在于,生成过程会严格受到蒙版区域外原图内容的“约束”,以确保新生成的内容与周围环境在光照、透视、纹理上自然融合。

这里有一个至关重要的参数叫“重绘幅度”(Denoising strength)。它控制着AI的“自由度”。如果设置为0,AI什么都不会做;如果设置为1,AI会完全无视原图内容,在蒙版区内天马行空地生成。通常,我们会在0.3到0.7之间调整。一个实用的经验是:当你想进行细微的修改,比如换个口红颜色、去掉一个小痘痘,重绘幅度设在0.3-0.45;当你想进行中等程度的改变,比如换一件款式相似但花纹不同的衣服,设在0.45-0.6;当你想进行颠覆性改变,比如把一条狗变成一只猫,或者把窗户外的风景从城市换成森林,则需要0.65以上,并配合非常精准的提示词。

2.2 涂鸦重绘:基于色块引导的意图绘制

涂鸦重绘则是一种更“主动”的引导方式。它没有严格的蒙版概念,而是允许你直接用画笔在画面上涂抹颜色。你涂上绿色,AI就知道这里大概是一片草地或树叶;你涂上蓝色,AI会联想到天空或海洋。它的原理是,将你的涂鸦色块作为一种强条件输入,与文本提示词一起,引导扩散模型的生成方向。AI的任务是:“根据这些颜色分布和我的文字描述,生成一个合理的、具体的图像。”

与局部重绘相比,涂鸦重绘对“边缘融合”的处理通常更柔和,因为它没有非黑即白的蒙版边界。但它对提示词的要求更高。例如,你在人物手上涂了一个红色的圆形色块。如果你只写“一个红色的球”,AI可能会生成一个漂浮的、与手部结合生硬的球体。但如果你写“人物手中拿着一个红色的苹果,手指自然弯曲握住”,AI就能更好地理解空间关系和物体属性,生成出握苹果的合理姿态。因此,使用涂鸦重绘时,提示词必须尽可能具体地描述你“涂鸦”的那个物体是什么,以及它与周围环境的交互关系。

2.3 功能选择决策树:我该用哪个?

面对一个修改需求,如何快速决定使用哪个功能?你可以遵循这个简单的决策流程:

  1. 目标是否明确且区域边界清晰?如果是,比如“精确替换图中第三颗纽扣”、“去掉画面左下角的垃圾桶”,首选局部重绘。用蒙版精准框选,效率最高。
  2. 想法比较模糊,或者想探索多种可能性?比如“我想在这片空地上加点东西,可能是棵树,也可能是个长椅”,或者“给这件衣服添加一些花纹,但还没想好具体样式”。这种情况更适合涂鸦重绘。你可以用大色块划定区域,用提示词描述可能性,让AI给出几种方案供你选择。
  3. 修改涉及复杂的形状或颜色渐变?例如,“把这条直裙改成有复杂褶皱的鱼尾裙摆”。用画笔精确画出鱼尾裙的蒙版非常困难,但用涂鸦重绘,你可以快速涂抹出裙摆的大致轮廓和明暗关系,再通过提示词细化,往往事半功倍。
  4. 需要严格保持原图某些部分绝对不变?必须用局部重绘。因为蒙版的白色区域是“硬性”保护,而涂鸦重绘的“保护”是软性的,AI有时会“脑补”并轻微改变你未涂鸦的区域。

3. 超强操作流程实战详解

3.1 前期准备:模型、提示词与底图处理

工欲善其事,必先利其器。在开始重绘之前,有三项准备工作至关重要,它们直接决定了最终效果的成败。

首先是模型选择。这不是随便选一个好看的模型就行。你需要根据修改内容的类型,选择最擅长的模型。例如,如果你想进行真人照片的修复或换装,应选择以“ChilloutMix”、“Realistic Vision”为代表的写实人像大模型;如果你想修改的是二次元插画,那么“Anything V5”、“Counterfeit”等动漫模型会更合适;如果涉及复杂的场景或物体,像“SDXL”这类通用性更强、细节更丰富的基础模型可能是更好的起点。一个常见的误区是使用过于“风格化”的模型进行精细修改,这可能导致生成内容与原图风格格格不入。

其次是提示词工程。对于局部/涂鸦重绘,提示词需要分为两部分:

  • 全局提示词:描述你希望整张图最终呈现的样子。这通常是对原图内容的概括,用于保持画面整体一致性。
  • 局部提示词:仅描述你希望在蒙版或涂鸦区域内生成的内容。这是精准控制的关键。例如,原图是一个女孩在公园,你想把她的纯色裙子换成碎花裙。你的全局提示词可以是“a girl standing in a park, sunny day, detailed”。而局部提示词则要聚焦在裙子上:“a beautiful summer dress with floral pattern, soft fabric, delicate lace trim”。

最后是底图处理。直接丢一张手机拍的照片进去,效果往往不佳。最佳实践是:

  1. 统一尺寸:将图片裁剪或缩放至你的模型常用的分辨率(如512x512, 512x768, 768x768等),最好是64的倍数,这符合模型训练的数据结构。
  2. 简单调色:如果原图过暗或过亮,在Photoshop或任何图片编辑软件中简单调整一下曝光和对比度,让主体清晰。这能帮助AI更好地识别内容。
  3. 格式与质量:保存为PNG或高质量的JPG格式,避免因压缩产生的噪点和色块干扰AI判断。

3.2 局部重绘标准操作流程(以WebUI为例)

假设我们有一张半身人像照,想将她的耳环从珍珠耳钉换成钻石吊坠耳环。

步骤一:导入与基础设置

  1. 在Stable Diffusion WebUI中,切换到“图生图”标签页。
  2. 将处理好的底图拖入“图生图”区域。
  3. 在“提示词”框中,填入你的全局提示词,例如:“photorealistic portrait of a beautiful woman with smile, studio lighting, highly detailed, 8k”。
  4. 在“负面提示词”中,填入你不想出现的内容,如:“deformed, blurry, bad anatomy, extra fingers”。
  5. 选择与你底图风格匹配的Checkpoint模型和VAE。
  6. 设置采样方法(Sampler),对于细节修改,推荐使用“DPM++ 2M Karras”或“Euler a”,步数(Steps)设置在20-30之间。
  7. 设置输出尺寸,通常与输入图尺寸一致。

步骤二:蒙版绘制与参数精调

  1. 在“图生图”页面下方,找到“局部重绘(上传蒙版)”区域。点击“启用”。
  2. 你会看到两个画布:左侧是原图,右侧是蒙版绘制区。默认情况下,在右侧画布上涂抹,黑色表示蒙版区域(要重绘),白色表示保护区域。
  3. 使用画笔工具,仔细地将原图中的珍珠耳环部分涂黑。这里有个技巧:将画笔硬度调低,使用边缘柔和的画笔,可以让生成的新内容与皮肤过渡更自然。同时,可以适当将蒙版区域画得比原耳环稍大一圈,给AI一些“发挥空间”,避免生成的内容被严格限制在原轮廓内显得局促。
  4. 回到参数设置部分:
    • 蒙版模式:选择“重绘蒙版内容”。(如果你想重绘蒙版以外的区域,则选“重绘非蒙版内容”,常用于“保留主体,替换背景”的场景)。
    • 蒙版模糊:这是关键参数!它决定了蒙版边缘的羽化程度。设置太小(如4),边缘会生硬;设置太大(如64),AI可能会影响到你不想修改的区域。对于耳环这种小物件,建议从8-16开始尝试。
    • 重绘幅度:如前所述,对于“换耳环”这种物体替换,设置在0.5-0.65之间比较合适。
    • 重绘区域:选择“仅蒙版区域”。这能最大程度保证画面其他部分不变。

步骤三:生成与迭代

  1. 在提示词框中,现在需要加入局部提示词。你可以这样写:“global prompt], sparkling diamond pendant earring, elegant, reflective”(将局部提示词放在后面,并用逗号隔开)。
  2. 点击“生成”。观察结果。
  3. 第一次结果不理想是常态。如果钻石形状奇怪,可以尝试加强提示词,如“princess cut diamond”;如果耳环与耳朵连接处不自然,可以轻微增大蒙版模糊值,或稍微调整蒙版形状,覆盖多一点皮肤区域;如果颜色不对,可以在提示词中加入“silver”或“white gold”。
  4. 采用“小步快跑,多次迭代”的策略。每次修改一两个参数或提示词,生成2-4张图,对比效果,找到最优解。

3.3 涂鸦重绘进阶操作流程(以换装为例)

现在,我们想将人物穿的白色衬衫换成一件深蓝色的毛衣。

步骤一:启用涂鸦与草图绘制

  1. 在“图生图”页面,将底图拖入后,点击下方的“涂鸦”标签页(在WebUI中可能显示为“Sketch”)。
  2. 你会看到原图上方多了一个透明的画布层。选择画笔工具和颜色。
  3. 关键技巧:不要只涂一个色块。根据毛衣的纹理和光照,用不同明暗的蓝色进行涂抹。在肩膀受光处用较浅的蓝色,在腋下、腰部褶皱处用更深的蓝色。这相当于为AI提供了简单的体积和光影信息。
  4. 粗略地涂满衬衫所在的区域,稍微溢出原衬衫边界也没关系,涂鸦重绘对边缘处理比较宽容。

步骤二:参数配置与提示词聚焦

  1. 采样器、步数等设置与局部重绘类似。
  2. 重绘幅度需要调整:因为涂鸦提供了较强的颜色引导,重绘幅度可以比纯局部重绘稍低一些,设置在0.4-0.55之间,以避免过度改变原有的人物体型和姿势。
  3. 提示词是成败关键。全局提示词描述人物和场景。局部提示词必须详细描述毛衣:
    • 基础描述:“a thick knit dark blue sweater”
    • 材质细节:“wool texture, cable knit pattern, soft”
    • 合身程度:“fitted, on a female body”
    • 与环境的交互:“folds where the arm bends, shadows under the chest”
    • 一个综合的提示词示例:“photorealistic portrait of a woman, [global details], wearing a fitted dark blue cable-knit wool sweater, soft texture, detailed folds, natural lighting on fabric”。

步骤三:利用“噪声”增加多样性涂鸦重绘有一个隐藏技巧:在涂鸦时,可以使用带有轻微杂色的画笔,或者生成时适当提高“噪声强度”(如果界面有该选项)。这相当于在给AI的“草图”中引入了一些随机性,能促使AI生成更多样化的纹理细节,而不是死板地填充你涂的颜色。对于生成毛衣纹理、森林树叶、砖墙等复杂表面特别有效。

4. 高阶技巧与疑难问题排查实录

4.1 融合与边缘处理:让生成内容“长”在原图上

无论是局部重绘还是涂鸦重绘,新手最常遇到的“翻车”现场就是边缘生硬、光影不符、透视错位,新生成的东西像“贴上去”的一样。解决这个问题的核心在于“信息补偿”。

  1. 蒙版模糊与扩张的配合使用:在局部重绘中,除了调整“蒙版模糊”,还有一个“蒙版扩张”参数。模糊处理边缘,而扩张则是将蒙版区域向外扩大几个像素。对于像头发丝、羽毛边缘这类复杂边界,先使用较小的扩张(如4-8),再配合中等程度的模糊(12-24),能让AI在重绘时考虑到边界外的像素信息,生成更自然的过渡。
  2. 提示词描述环境光:在局部提示词中,加入对环境光的描述。例如,重绘一个放在室内的苹果,除了描述苹果本身,加上“under warm indoor lighting, cast soft shadow on the table”,AI就会尝试让生成的苹果匹配环境的光照和阴影方向。
  3. 分区域多次重绘:对于非常大的修改区域(比如替换整片天空),不要试图一次完成。可以将天空分为“远景”、“中景云层”、“近景天际线”2-3个部分,分别进行局部重绘,每次的重绘幅度和提示词略有侧重,最后合成的效果会比一次生成更加自然、有层次。

4.2 控制网络与插件的加持

当基础功能无法满足精细控制需求时,就需要请出“外援”。

  • ControlNet:这是局部/涂鸦重绘的“终极控制器”。最常用的是inpaint模型和inpaint_only模型。在局部重绘时,启用ControlNet并选择inpaint模型,将原图同时传入。它能更好地理解原图的结构和语义,使得重绘区域的内容在姿势、线条上与原图保持极高的一致性,特别适用于修复人物肢体、保持建筑结构不变等场景。
  • Regional Prompter插件:当你的画面需要在一个重绘区域内同时生成两种不同属性的东西时(例如,在同一个蒙版区域里,左边生成木头,右边生成金属),这个插件可以让你为同一个蒙版内的不同子区域指定不同的提示词,实现超精细的局部控制。
  • Inpaint Sketch插件:它结合了局部重绘的蒙版精确性和涂鸦重绘的色彩引导性。你可以先画一个精确的蒙版,然后在这个蒙版区域内直接进行涂鸦上色,再生成。这比单纯的涂鸦重绘更能控制形状边界。

4.3 常见问题速查与解决方案

在实际操作中,你一定会遇到下面这些问题。这里是我踩过坑后总结的“药方”:

问题现象可能原因解决方案
生成内容扭曲、畸形1. 重绘幅度过高。
2. 蒙版区域过小,AI没有足够空间生成合理结构。
3. 提示词与模型能力不匹配。
1. 逐步降低重绘幅度(每次降0.05)。
2. 适当扩大蒙版区域,给予AI更多上下文。
3. 简化提示词,或更换更擅长此类内容的模型。
边缘生硬,有明显接缝1. 蒙版模糊值太低。
2. 重绘区域与周围像素差异太大。
1. 提高蒙版模糊值(尝试16-32)。
2. 在提示词中加入“seamlessly blended, natural transition”等描述。尝试使用“仅蒙版区域”模式,但勾选“蒙版区域内容处理”为“原图”,这会让AI参考更多边缘原图信息。
颜色或风格与整体不搭1. 未在全局提示词中统一风格描述。
2. 局部提示词过于突出,忽略了整体协调。
1. 确保全局提示词定义了整体风格(如“film grain style, muted colors”)。
2. 在局部提示词中加入“in the same style as the image, consistent lighting with the scene”。
涂鸦重绘时,AI完全忽略涂鸦颜色1. 重绘幅度太低,AI改动太小。
2. 提示词与涂鸦颜色冲突。
1. 提高重绘幅度至0.5以上。
2. 检查提示词。如果你涂了蓝色却写“red dress”,AI会以提示词优先。确保提示词颜色与涂鸦一致,或使用更中性的描述。
生成内容总是超出蒙版范围蒙版模糊值过高,或“重绘区域”错误地选择了“全图”。降低蒙版模糊值,并确认“重绘区域”设置为“仅蒙版区域”。
人物脸部在重绘后崩坏在重绘身体或服装时,脸部区域虽未被蒙版覆盖,但AI在生成过程中可能发生“漂移”。1. 使用“ADetailer”等面部修复插件,在生成后自动修复脸部。
2. 更稳妥的方法是:先对需要重绘的身体部分进行重绘,生成一张满意的身体图;再将这张新图和原图的脸部裁剪出来,使用“图生图”中的“重绘”功能,以很低的重绘幅度(0.2-0.3)将原脸“贴”回去,实现完美融合。

掌握局部重绘和涂鸦重绘,就像是获得了在数字画布上施展的“因果律武器”。你不再是被动地等待AI随机出图,而是可以主动地、精准地引导它去修改和创造。这个过程充满实验性,没有唯一的最优解,最好的学习方式就是动手去试。从一个小物件开始,调整每一个参数,观察每一次变化,你会逐渐积累起对AI“思维方式”的直觉。最终,这些工具将不再是陌生的按钮和滑块,而成为你延伸的创意画笔,让你脑海中的每一个细微调整,都能在屏幕上获得惊艳的回响。