Stable Diffusion局部重绘与涂鸦重绘：精准控制AI图像生成的核心技巧-拓冰建站

1. 项目概述：从“修图”到“创图”的思维跃迁

如果你还在用传统修图软件，费劲地想把照片里不想要的电线杆P掉，或者想把一件普通T恤换成想象中的华丽礼服，那么是时候了解一下Stable Diffusion的“图生图”功能了。这不仅仅是“修图”，而是一种基于深度学习的“内容生成”。你提供一张草图、一张照片，甚至是一个模糊的想法，AI就能在理解原图内容的基础上，为你创造出全新的、符合逻辑的画面。而“局部重绘”和“涂鸦重绘”，正是这个强大功能中最具操控性的两把“手术刀”，它们能让你精准地告诉AI：“我只想改变画面的这一小块地方，其他地方请保持原样。”

很多新手在初次接触时，会把“局部重绘”简单理解为Photoshop的“内容识别填充”升级版，把“涂鸦重绘”当成高级版的“画笔工具”。这种类比有助于理解，但远远不够。它们的核心差异在于工作逻辑：局部重绘是你划定一个“禁区”，告诉AI“这里的内容我不满意，你根据我的文字描述重新画”；而涂鸦重绘则是你拿起“魔法画笔”，用简单的色块勾勒出你想要的形状和颜色倾向，AI则根据这些色块和你的描述，去“理解”并“渲染”出具体的物体。理解这个根本区别，是玩转这两个功能、避免“翻车”的第一步。无论是想给人物换装、给场景换天、修复老照片的破损部分，还是为设计稿快速生成多种风格的局部方案，掌握这两项技能都能让你的创作效率和质量获得质的飞跃。

2. 核心功能原理与操作逻辑拆解

2.1 局部重绘：基于蒙版的精准内容替换

局部重绘的核心是“蒙版”（Mask）。你可以把它想象成一张覆盖在原图上的透明薄膜，你用画笔在这张薄膜上涂黑的地方，就是告诉AI：“这里需要被重新生成。”白色的地方则是“请保持原样”。这个过程的底层逻辑是，AI会先分析你的原图（即“图生图”的输入），然后结合你提供的提示词（Prompt），在蒙版指定的区域内，进行扩散模型（Diffusion Model）的“去噪”生成过程。关键点在于，生成过程会严格受到蒙版区域外原图内容的“约束”，以确保新生成的内容与周围环境在光照、透视、纹理上自然融合。

这里有一个至关重要的参数叫“重绘幅度”（Denoising strength）。它控制着AI的“自由度”。如果设置为0，AI什么都不会做；如果设置为1，AI会完全无视原图内容，在蒙版区内天马行空地生成。通常，我们会在0.3到0.7之间调整。一个实用的经验是：当你想进行细微的修改，比如换个口红颜色、去掉一个小痘痘，重绘幅度设在0.3-0.45；当你想进行中等程度的改变，比如换一件款式相似但花纹不同的衣服，设在0.45-0.6；当你想进行颠覆性改变，比如把一条狗变成一只猫，或者把窗户外的风景从城市换成森林，则需要0.65以上，并配合非常精准的提示词。

2.2 涂鸦重绘：基于色块引导的意图绘制

涂鸦重绘则是一种更“主动”的引导方式。它没有严格的蒙版概念，而是允许你直接用画笔在画面上涂抹颜色。你涂上绿色，AI就知道这里大概是一片草地或树叶；你涂上蓝色，AI会联想到天空或海洋。它的原理是，将你的涂鸦色块作为一种强条件输入，与文本提示词一起，引导扩散模型的生成方向。AI的任务是：“根据这些颜色分布和我的文字描述，生成一个合理的、具体的图像。”

与局部重绘相比，涂鸦重绘对“边缘融合”的处理通常更柔和，因为它没有非黑即白的蒙版边界。但它对提示词的要求更高。例如，你在人物手上涂了一个红色的圆形色块。如果你只写“一个红色的球”，AI可能会生成一个漂浮的、与手部结合生硬的球体。但如果你写“人物手中拿着一个红色的苹果，手指自然弯曲握住”，AI就能更好地理解空间关系和物体属性，生成出握苹果的合理姿态。因此，使用涂鸦重绘时，提示词必须尽可能具体地描述你“涂鸦”的那个物体是什么，以及它与周围环境的交互关系。

2.3 功能选择决策树：我该用哪个？

面对一个修改需求，如何快速决定使用哪个功能？你可以遵循这个简单的决策流程：

目标是否明确且区域边界清晰？如果是，比如“精确替换图中第三颗纽扣”、“去掉画面左下角的垃圾桶”，首选局部重绘。用蒙版精准框选，效率最高。
想法比较模糊，或者想探索多种可能性？比如“我想在这片空地上加点东西，可能是棵树，也可能是个长椅”，或者“给这件衣服添加一些花纹，但还没想好具体样式”。这种情况更适合涂鸦重绘。你可以用大色块划定区域，用提示词描述可能性，让AI给出几种方案供你选择。
修改涉及复杂的形状或颜色渐变？例如，“把这条直裙改成有复杂褶皱的鱼尾裙摆”。用画笔精确画出鱼尾裙的蒙版非常困难，但用涂鸦重绘，你可以快速涂抹出裙摆的大致轮廓和明暗关系，再通过提示词细化，往往事半功倍。
需要严格保持原图某些部分绝对不变？必须用局部重绘。因为蒙版的白色区域是“硬性”保护，而涂鸦重绘的“保护”是软性的，AI有时会“脑补”并轻微改变你未涂鸦的区域。

3. 超强操作流程实战详解

3.1 前期准备：模型、提示词与底图处理

工欲善其事，必先利其器。在开始重绘之前，有三项准备工作至关重要，它们直接决定了最终效果的成败。

首先是模型选择。这不是随便选一个好看的模型就行。你需要根据修改内容的类型，选择最擅长的模型。例如，如果你想进行真人照片的修复或换装，应选择以“ChilloutMix”、“Realistic Vision”为代表的写实人像大模型；如果你想修改的是二次元插画，那么“Anything V5”、“Counterfeit”等动漫模型会更合适；如果涉及复杂的场景或物体，像“SDXL”这类通用性更强、细节更丰富的基础模型可能是更好的起点。一个常见的误区是使用过于“风格化”的模型进行精细修改，这可能导致生成内容与原图风格格格不入。

其次是提示词工程。对于局部/涂鸦重绘，提示词需要分为两部分：

全局提示词：描述你希望整张图最终呈现的样子。这通常是对原图内容的概括，用于保持画面整体一致性。
局部提示词：仅描述你希望在蒙版或涂鸦区域内生成的内容。这是精准控制的关键。例如，原图是一个女孩在公园，你想把她的纯色裙子换成碎花裙。你的全局提示词可以是“a girl standing in a park, sunny day, detailed”。而局部提示词则要聚焦在裙子上：“a beautiful summer dress with floral pattern, soft fabric, delicate lace trim”。

最后是底图处理。直接丢一张手机拍的照片进去，效果往往不佳。最佳实践是：

统一尺寸：将图片裁剪或缩放至你的模型常用的分辨率（如512x512, 512x768, 768x768等），最好是64的倍数，这符合模型训练的数据结构。
简单调色：如果原图过暗或过亮，在Photoshop或任何图片编辑软件中简单调整一下曝光和对比度，让主体清晰。这能帮助AI更好地识别内容。
格式与质量：保存为PNG或高质量的JPG格式，避免因压缩产生的噪点和色块干扰AI判断。

3.2 局部重绘标准操作流程（以WebUI为例）

假设我们有一张半身人像照，想将她的耳环从珍珠耳钉换成钻石吊坠耳环。

步骤一：导入与基础设置

在Stable Diffusion WebUI中，切换到“图生图”标签页。
将处理好的底图拖入“图生图”区域。
在“提示词”框中，填入你的全局提示词，例如：“photorealistic portrait of a beautiful woman with smile, studio lighting, highly detailed, 8k”。
在“负面提示词”中，填入你不想出现的内容，如：“deformed, blurry, bad anatomy, extra fingers”。
选择与你底图风格匹配的Checkpoint模型和VAE。
设置采样方法（Sampler），对于细节修改，推荐使用“DPM++ 2M Karras”或“Euler a”，步数（Steps）设置在20-30之间。
设置输出尺寸，通常与输入图尺寸一致。

步骤二：蒙版绘制与参数精调

在“图生图”页面下方，找到“局部重绘（上传蒙版）”区域。点击“启用”。
你会看到两个画布：左侧是原图，右侧是蒙版绘制区。默认情况下，在右侧画布上涂抹，黑色表示蒙版区域（要重绘），白色表示保护区域。
使用画笔工具，仔细地将原图中的珍珠耳环部分涂黑。这里有个技巧：将画笔硬度调低，使用边缘柔和的画笔，可以让生成的新内容与皮肤过渡更自然。同时，可以适当将蒙版区域画得比原耳环稍大一圈，给AI一些“发挥空间”，避免生成的内容被严格限制在原轮廓内显得局促。
回到参数设置部分：
- 蒙版模式：选择“重绘蒙版内容”。（如果你想重绘蒙版以外的区域，则选“重绘非蒙版内容”，常用于“保留主体，替换背景”的场景）。
- 蒙版模糊：这是关键参数！它决定了蒙版边缘的羽化程度。设置太小（如4），边缘会生硬；设置太大（如64），AI可能会影响到你不想修改的区域。对于耳环这种小物件，建议从8-16开始尝试。
- 重绘幅度：如前所述，对于“换耳环”这种物体替换，设置在0.5-0.65之间比较合适。
- 重绘区域：选择“仅蒙版区域”。这能最大程度保证画面其他部分不变。

步骤三：生成与迭代

在提示词框中，现在需要加入局部提示词。你可以这样写：“global prompt], sparkling diamond pendant earring, elegant, reflective”（将局部提示词放在后面，并用逗号隔开）。
点击“生成”。观察结果。
第一次结果不理想是常态。如果钻石形状奇怪，可以尝试加强提示词，如“princess cut diamond”；如果耳环与耳朵连接处不自然，可以轻微增大蒙版模糊值，或稍微调整蒙版形状，覆盖多一点皮肤区域；如果颜色不对，可以在提示词中加入“silver”或“white gold”。
采用“小步快跑，多次迭代”的策略。每次修改一两个参数或提示词，生成2-4张图，对比效果，找到最优解。

3.3 涂鸦重绘进阶操作流程（以换装为例）

现在，我们想将人物穿的白色衬衫换成一件深蓝色的毛衣。

步骤一：启用涂鸦与草图绘制

在“图生图”页面，将底图拖入后，点击下方的“涂鸦”标签页（在WebUI中可能显示为“Sketch”）。
你会看到原图上方多了一个透明的画布层。选择画笔工具和颜色。
关键技巧：不要只涂一个色块。根据毛衣的纹理和光照，用不同明暗的蓝色进行涂抹。在肩膀受光处用较浅的蓝色，在腋下、腰部褶皱处用更深的蓝色。这相当于为AI提供了简单的体积和光影信息。
粗略地涂满衬衫所在的区域，稍微溢出原衬衫边界也没关系，涂鸦重绘对边缘处理比较宽容。

步骤二：参数配置与提示词聚焦

采样器、步数等设置与局部重绘类似。
重绘幅度需要调整：因为涂鸦提供了较强的颜色引导，重绘幅度可以比纯局部重绘稍低一些，设置在0.4-0.55之间，以避免过度改变原有的人物体型和姿势。
提示词是成败关键。全局提示词描述人物和场景。局部提示词必须详细描述毛衣：
- 基础描述：“a thick knit dark blue sweater”
- 材质细节：“wool texture, cable knit pattern, soft”
- 合身程度：“fitted, on a female body”
- 与环境的交互：“folds where the arm bends, shadows under the chest”
- 一个综合的提示词示例：“photorealistic portrait of a woman, [global details], wearing a fitted dark blue cable-knit wool sweater, soft texture, detailed folds, natural lighting on fabric”。

步骤三：利用“噪声”增加多样性涂鸦重绘有一个隐藏技巧：在涂鸦时，可以使用带有轻微杂色的画笔，或者生成时适当提高“噪声强度”（如果界面有该选项）。这相当于在给AI的“草图”中引入了一些随机性，能促使AI生成更多样化的纹理细节，而不是死板地填充你涂的颜色。对于生成毛衣纹理、森林树叶、砖墙等复杂表面特别有效。

4. 高阶技巧与疑难问题排查实录

4.1 融合与边缘处理：让生成内容“长”在原图上

无论是局部重绘还是涂鸦重绘，新手最常遇到的“翻车”现场就是边缘生硬、光影不符、透视错位，新生成的东西像“贴上去”的一样。解决这个问题的核心在于“信息补偿”。

蒙版模糊与扩张的配合使用：在局部重绘中，除了调整“蒙版模糊”，还有一个“蒙版扩张”参数。模糊处理边缘，而扩张则是将蒙版区域向外扩大几个像素。对于像头发丝、羽毛边缘这类复杂边界，先使用较小的扩张（如4-8），再配合中等程度的模糊（12-24），能让AI在重绘时考虑到边界外的像素信息，生成更自然的过渡。
提示词描述环境光：在局部提示词中，加入对环境光的描述。例如，重绘一个放在室内的苹果，除了描述苹果本身，加上“under warm indoor lighting, cast soft shadow on the table”，AI就会尝试让生成的苹果匹配环境的光照和阴影方向。
分区域多次重绘：对于非常大的修改区域（比如替换整片天空），不要试图一次完成。可以将天空分为“远景”、“中景云层”、“近景天际线”2-3个部分，分别进行局部重绘，每次的重绘幅度和提示词略有侧重，最后合成的效果会比一次生成更加自然、有层次。

4.2 控制网络与插件的加持

当基础功能无法满足精细控制需求时，就需要请出“外援”。

ControlNet：这是局部/涂鸦重绘的“终极控制器”。最常用的是inpaint模型和inpaint_only模型。在局部重绘时，启用ControlNet并选择inpaint模型，将原图同时传入。它能更好地理解原图的结构和语义，使得重绘区域的内容在姿势、线条上与原图保持极高的一致性，特别适用于修复人物肢体、保持建筑结构不变等场景。
Regional Prompter插件：当你的画面需要在一个重绘区域内同时生成两种不同属性的东西时（例如，在同一个蒙版区域里，左边生成木头，右边生成金属），这个插件可以让你为同一个蒙版内的不同子区域指定不同的提示词，实现超精细的局部控制。
Inpaint Sketch插件：它结合了局部重绘的蒙版精确性和涂鸦重绘的色彩引导性。你可以先画一个精确的蒙版，然后在这个蒙版区域内直接进行涂鸦上色，再生成。这比单纯的涂鸦重绘更能控制形状边界。

4.3 常见问题速查与解决方案

在实际操作中，你一定会遇到下面这些问题。这里是我踩过坑后总结的“药方”：

问题现象	可能原因	解决方案
生成内容扭曲、畸形	1. 重绘幅度过高。 2. 蒙版区域过小，AI没有足够空间生成合理结构。 3. 提示词与模型能力不匹配。	1. 逐步降低重绘幅度（每次降0.05）。 2. 适当扩大蒙版区域，给予AI更多上下文。 3. 简化提示词，或更换更擅长此类内容的模型。
边缘生硬，有明显接缝	1. 蒙版模糊值太低。 2. 重绘区域与周围像素差异太大。	1. 提高蒙版模糊值（尝试16-32）。 2. 在提示词中加入“seamlessly blended, natural transition”等描述。尝试使用“仅蒙版区域”模式，但勾选“蒙版区域内容处理”为“原图”，这会让AI参考更多边缘原图信息。
颜色或风格与整体不搭	1. 未在全局提示词中统一风格描述。 2. 局部提示词过于突出，忽略了整体协调。	1. 确保全局提示词定义了整体风格（如“film grain style, muted colors”）。 2. 在局部提示词中加入“in the same style as the image, consistent lighting with the scene”。
涂鸦重绘时，AI完全忽略涂鸦颜色	1. 重绘幅度太低，AI改动太小。 2. 提示词与涂鸦颜色冲突。	1. 提高重绘幅度至0.5以上。 2. 检查提示词。如果你涂了蓝色却写“red dress”，AI会以提示词优先。确保提示词颜色与涂鸦一致，或使用更中性的描述。
生成内容总是超出蒙版范围	蒙版模糊值过高，或“重绘区域”错误地选择了“全图”。	降低蒙版模糊值，并确认“重绘区域”设置为“仅蒙版区域”。
人物脸部在重绘后崩坏	在重绘身体或服装时，脸部区域虽未被蒙版覆盖，但AI在生成过程中可能发生“漂移”。	1. 使用“ADetailer”等面部修复插件，在生成后自动修复脸部。 2. 更稳妥的方法是：先对需要重绘的身体部分进行重绘，生成一张满意的身体图；再将这张新图和原图的脸部裁剪出来，使用“图生图”中的“重绘”功能，以很低的重绘幅度（0.2-0.3）将原脸“贴”回去，实现完美融合。

掌握局部重绘和涂鸦重绘，就像是获得了在数字画布上施展的“因果律武器”。你不再是被动地等待AI随机出图，而是可以主动地、精准地引导它去修改和创造。这个过程充满实验性，没有唯一的最优解，最好的学习方式就是动手去试。从一个小物件开始，调整每一个参数，观察每一次变化，你会逐渐积累起对AI“思维方式”的直觉。最终，这些工具将不再是陌生的按钮和滑块，而成为你延伸的创意画笔，让你脑海中的每一个细微调整，都能在屏幕上获得惊艳的回响。