Midjourney AI绘画入门到精通:云端创作全流程指南

1. 项目概述:从零开始,驾驭AI绘画的“云端画笔”

如果你最近在社交媒体上看到那些令人惊叹、风格各异的数字艺术作品,并好奇它们是如何诞生的,那么你很可能已经接触到了“Midjourney”这个名字。它不是一个安装在电脑上的软件,而是一个运行在Discord平台上的AI绘画机器人。简单来说,你通过向它发送文字描述(我们称之为“提示词”或“咒语”),它就能在云端为你生成对应的图像。这个项目,就是带你从注册账号、理解基础指令,到掌握高级技巧,最终能够稳定产出高质量AI绘画作品的完整旅程。无论你是设计师、插画师、内容创作者,还是仅仅对AI艺术充满好奇的爱好者,这套教程都能让你快速上手,将脑海中的创意视觉化,真正“飞上云端创作天空”。

Midjourney的核心魅力在于其强大的图像理解与生成能力,以及极低的入门门槛。你不需要购买昂贵的显卡,也无需配置复杂的本地环境,只需要一个能上网的设备和一个Discord账号,就能开始创作。然而,低门槛并不意味着没有深度。如何精准地描述你的想法,如何通过参数控制画面的细节、风格和构图,如何迭代优化以获得满意的结果,这里面充满了技巧和学问。本教程将系统性地拆解这些环节,结合我个人的大量实操经验,让你避开新手常见的“坑”,快速从“看图说话”进阶到“指哪打哪”的创作阶段。

2. 核心准备:注册、订阅与基础环境搭建

在开始挥洒创意之前,我们需要先把“画笔”准备好。Midjourney的整个使用流程都依托于Discord,因此第一步是确保你有一个可用的Discord账号并完成Midjourney的订阅。

2.1 Discord账号注册与服务器加入

首先,访问Discord官网或下载其客户端,注册一个账号。这个过程和注册其他社交平台类似,需要邮箱验证。注册完成后,登录Discord。

接下来,你需要加入Midjourney的官方服务器。最直接的方式是访问Midjourney的官方网站,在首页通常会有一个显著的“Join the Beta”或类似的按钮,点击后会自动引导你通过Discord授权加入Midjourney服务器。成功加入后,你会在Discord左侧的服务器列表中看到“Midjourney”的图标。

注意:新加入的用户在官方服务器的公共频道(如#newbies-xxx)中生成图像是免费的,但有一定次数限制,并且你的作品会公开显示在频道里,供其他用户看到。这对于学习和观摩他人提示词非常有帮助。

2.2 Midjourney订阅计划选择与支付

免费试用次数用完后,或者你希望获得更快的生成速度、私密生成等功能,就需要订阅付费计划。在Discord中,输入/subscribe命令,Midjourney机器人会回复一个带有管理订阅链接的卡片,点击即可进入订阅页面。

Midjourney提供按月或按年付费的订阅制,主要分为三档:

  1. 基础计划:适合轻度用户,提供有限的快速生成时间。
  2. 标准计划:最受欢迎的计划,提供充足的快速生成时间,并支持“隐身模式”(生成的图片不会出现在公开画廊)。
  3. 专业计划:适合高强度使用的用户或团队,提供无限的快速生成时间和其他高级功能。

支付方式支持主流信用卡。成功订阅后,你的账号权限会立即升级。这里有一个关键点:订阅绑定的是你的Discord账号,而不是设备。这意味着你在任何地方登录这个Discord账号,都能享受订阅权益。

2.3 创建私人服务器与邀请机器人

在公共频道创作虽然热闹,但信息流很快,自己的作品容易被刷走,且缺乏隐私。因此,我强烈建议创建一个属于自己的Discord服务器用于创作。

在Discord界面左侧,点击“+”号添加服务器,选择“亲自创建”,然后选“仅供我和我的朋友使用”,为你服务器起个名字即可。创建好私人服务器后,你需要将Midjourney机器人邀请进来。方法是:回到Midjourney官方服务器,在成员列表中找到“Midjourney Bot”,右键点击其头像,选择“添加至服务器”,然后在下拉列表中选择你刚创建的私人服务器,并授权所需的权限。完成这一步后,在你的私人服务器里,你就可以像在官方频道一样,直接输入命令与Midjourney机器人对话了。这样,你的创作过程将完全私密、专注且易于管理。

3. 核心操作解析:从第一个提示词到参数大师

一切就绪,现在让我们开始真正的创作。Midjourney的操作完全通过文本命令完成,理解其语法和参数是成为高手的关键。

3.1 基础图像生成:你的第一句“咒语”

在你的私人服务器或任意Midjourney机器人所在的频道,在聊天框输入/imagine命令,会自动弹出一个提示词输入框。在这里,用英文描述你想要的画面。例如,输入:/imagine prompt: a cute corgi puppy playing in a sunny garden, cartoon style

按下回车,Midjourney机器人会回复一条消息,显示“Waiting to start...”,然后开始处理。大约一分钟左右,你会看到它生成了四张缩略图。这就是你的第一次生成结果!下方会出现两排按钮:

  • U1、U2、U3、U4:代表“Upscale”(放大)。点击对应的按钮,Midjourney会单独优化并放大你选择的那张图,增加更多细节。
  • V1、V2、V3、V4:代表“Variation”(变体)。点击后,Midjourney会以你选择的那张图的风格和构图为基础,重新生成四张新的变体图。
  • 🔄:代表“重新生成”。点击后,Midjourney会使用完全相同的提示词,再生成一组四张新图。

实操心得:最初的提示词不必追求完美。先从简单的名词+形容词+风格开始。生成四宫格后,仔细观察哪一张最接近你的想法,然后使用“V”按钮在其基础上进行微调迭代,这比每次都完全重写提示词效率高得多。

3.2 提示词工程:从模糊到精确的魔法

提示词的撰写是AI绘画的核心技能,其质量直接决定输出结果。一个结构化的提示词通常包含以下几个部分,并非必须全部包含,但理解它们有助于你精准控制:

  1. 主体描述:画面中最重要的对象。如“an astronaut”(一位宇航员)、“a futuristic city”(一座未来都市)。
  2. 细节与属性:修饰主体的外观、材质、状态等。如“wearing a detailed mechanical suit”(穿着精密的机械套装)、“made of glowing crystal”(由发光水晶构成)。
  3. 环境与背景:主体所处的场景。如“floating in the depths of space”(漂浮在太空深处)、“in a rainy neon-lit alley”(在雨夜的霓虹灯小巷中)。
  4. 艺术风格与媒介:这是塑造画面美感的关键。你可以指定艺术运动(如“surrealism”超现实主义、“impressionism”印象派)、著名艺术家(如“in the style of Hayao Miyazaki”宫崎骏风格)、渲染引擎(如“Unreal Engine 5 render”)、或具体媒介(如“oil on canvas”油画、“cinematic photography”电影摄影)。
  5. 构图与镜头:控制画面的视角和框架。如“wide shot”全景、“extreme close-up”极端特写、“low angle shot”低角度拍摄、“Dutch angle”荷兰角。
  6. 灯光与色彩:定义画面的氛围。如“dramatic lighting”戏剧性灯光、“soft morning light”柔和的晨光、“vibrant color palette” vibrant色彩组合、“monochromatic”单色。

例如,一个综合的提示词可能是:/imagine prompt: A majestic white dragon, intricate scales glowing with inner light, perched on a snow-capped mountain peak under the aurora borealis, fantasy art, epic composition, cinematic lighting, hyper-detailed, art by Greg Rutkowski and Albert Bierstadt --ar 16:9

3.3 核心参数详解:控制生成的秘密武器

在提示词后面,你可以添加一系列参数来进一步控制生成过程。参数以--开头。以下是几个最常用且强大的参数:

  • --aspect--ar:设置图片宽高比。例如--ar 16:9(宽屏)、--ar 1:1(正方形,默认)、--ar 2:3(竖版肖像)。Midjourney有固定的模型支持比例,非标准比例可能会被自动调整。
  • --chaos:控制四宫格初始结果的差异性和创意性。值范围0-100。--chaos 0时,四张图彼此非常相似;--chaos 100时,四张图可能天差地别,充满意外性。适合在寻找灵感时使用。
  • --stylize--s:控制Midjourney美学模型的强度。值范围0-1000(默认100)。数值越低(如--s 50),图像越贴近你的文字描述,但可能艺术性较弱;数值越高(如--s 750),图像的艺术性和创意性会更强,但可能偏离你的描述。这是一个在“听话”和“好看”之间寻找平衡的重要参数。
  • --iw:当使用“图生文”或“图生图”功能时,此参数控制参考图片的权重。值范围0.5-2。数值越高,生成结果越像参考图。
  • --no:排除不想要的元素。例如--no text, people会尽量避免在画面中出现文字和人。
  • --seed:种子值。每个生成任务都有一个随机种子。如果你指定一个种子值(如--seed 12345),并使用完全相同的提示词和参数,理论上可以生成几乎相同的图像。这对于精确复现某次满意的结果或进行细微调整非常有用。

3.4 进阶功能:图生图与混合模式

除了文字描述,Midjourney还支持以图作为输入的一部分。

  • 上传图片作为提示的一部分:在输入/imagine prompt后,你可以直接将图片拖拽到Discord输入框,或者点击上传按钮。图片上传后,会生成一个链接。你可以将这个链接放在提示词的最前面,后面跟上文字描述。例如:图片链接 + a steampunk style portrait。这样,Midjourney会以你上传的图片为构图或风格参考,结合文字描述生成新图。
  • /describe命令:如果你看到一张喜欢的图但不知道如何用文字描述,可以使用这个功能。上传图片后,输入/describe命令,Midjourney会分析图片并给出4条可能的提示词文本,为你提供绝佳的写作灵感。
  • /blend命令:允许你上传2-5张图片,Midjourney会将它们的视觉概念和风格融合起来,生成新的图像。这是创造混合风格或转移风格的利器。

4. 工作流与高级技巧:从生成到精修

掌握了基础生成后,一个高效的工作流和一系列高级技巧能让你如虎添翼,将“还不错”的图变成“惊艳”的作品。

4.1 高效迭代工作流

我的标准工作流通常如下:

  1. 头脑风暴与提示词草稿:先用简短的句子写下核心想法。
  2. 初代生成:使用基础提示词生成四宫格,观察大方向。
  3. 选择与变体:从四张中选出最有潜力的一张,点击“V”按钮生成变体,进行风格和构图的微调。
  4. 放大与细节优化:确定最终方向后,点击“U”放大。在放大后的单图上,你可以使用“Vary (Subtle)”或“Vary (Strong)”按钮(在最新版本中)进行更精细的局部重绘或风格调整,也可以使用“Zoom Out”功能扩展画布视野。
  5. 提示词与参数调优:根据初代结果,回头优化你的提示词。是主体不够突出?增加细节描述。是风格不对?更换风格关键词。是构图太满?尝试更改宽高比或添加镜头关键词。同时,调整--stylize--chaos等参数。
  6. 多轮循环:重复步骤3-5,直到获得满意结果。记得善用“Remix Mode”(混音模式),在设置中开启后,每次点击Vary或Upscale按钮时,你都可以修改提示词,实现更可控的迭代。

4.2 风格化与一致性控制

创作系列作品或固定角色时,保持风格一致性是关键。

  • 使用风格关键词:在提示词中固定使用某几个艺术家或风格描述词,如“in the style of Studio Ghibli, watercolor and ink”。
  • 利用种子值:当生成一张满意的图后,在回复中点击“添加反应”(笑脸图标),搜索“envelope”并点击,机器人会私信你该图片的种子值。在后续生成类似主题的图片时,使用相同的种子值和核心风格提示词,能获得相对一致的视觉感受。
  • 角色一致性技巧:对于同一个角色,尝试使用非常详细的描述(发型、瞳色、服装细节),并配合种子值。更高级的方法是,生成一张满意的角色图后,将其作为后续生成的图片参考(图生图),并适当降低参考权重(如--iw 1.2),让模型在保持角色特征的同时适应新场景。

4.3 实用命令与设置

除了/imagine,还有其他实用命令:

  • /info:查看你的账号信息,包括剩余快速生成时间、任务队列等。
  • /settings:调出设置面板,可以快速切换模型版本(如MJ V6, Niji等)、风格化强度、质量模式、隐私模式等,比手动输入参数更方便。
  • /fast/relax:在“快速模式”和“放松模式”间切换。快速模式消耗订阅时间,生成速度快;放松模式免费但需要排队,速度慢。
  • /prefer option set:创建自定义选项。例如,你可以设置一个缩写,来代表一长串你常用的参数组合,极大提升输入效率。

5. 常见问题、避坑指南与资源推荐

即使掌握了所有指令,在实际操作中仍会遇到各种问题。以下是我总结的一些高频疑问和避坑经验。

5.1 生成结果不理想的排查思路

问题现象可能原因解决方案
图片完全偏离描述提示词语义过于复杂或矛盾;模型版本理解有误。简化提示词,确保主谓宾清晰;尝试使用--style raw参数(如果模型支持)来减少风格化干扰;换用不同的模型版本(如V5, V6)试试。
人物多手指、五官扭曲AI在生成复杂结构时的常见缺陷,尤其在早期版本。使用“Vary (Subtle)”进行局部重绘修正;在提示词中加入“perfect anatomy, detailed hands”等正面引导,或加入--no deformed hands, bad anatomy负面提示;最有效的方法是切换到更新的模型版本(如V6及以上),其对解剖结构的理解大幅提升。
画面元素杂乱,主体不突出提示词中元素过多,缺乏重点;构图关键词缺失。精简提示词,聚焦1-2个核心元素;使用“::”权重符号,如a cat::2 on a sofa::1,让猫的权重高于沙发;添加构图关键词如“close-up on [主体]”, “bokeh background”(背景虚化)。
风格不符合预期风格关键词太模糊或与主体冲突。使用更具体、公认的风格或艺术家名称;参考其他人生成的优秀作品,学习其风格关键词组合。
生成速度慢,一直排队处于“放松模式”;或当前服务器负载高。切换到“快速模式”(需消耗订阅时间);或稍后再试。

5.2 版权、伦理与最佳实践

  • 版权归属:根据Midjourney的服务条款,付费用户拥有其生成图像的完整使用权,可用于商业用途。但需注意,如果生成的图像中包含可识别的真实人物肖像或受版权保护的特定角色(如米老鼠),则商业使用可能存在风险。
  • 伦理考量:避免生成真实、有害或侵犯他人隐私的内容。Midjourney有内容过滤器,但创作者自身也应负起责任。
  • 提示词礼仪:在公共频道,避免发送过长的提示词刷屏。生成NSFW(不适宜工作场合)内容时,务必使用私信或自己的私人服务器。

5.3 学习资源与灵感获取

  • 官方文档:Midjourney的官方用户指南是最权威的信息源,详细列出了所有命令、参数和模型更新。
  • 社区画廊:多在Midjourney官网的社区画廊或官方Discord的频道里浏览。看到喜欢的图,可以点击查看其完整的提示词和参数,这是学习最直接的方式。
  • 提示词网站与工具:诸如PromptHero、Lexica.art等网站汇集了海量由用户生成的AI图像及其提示词,是寻找灵感和学习高级提示词的宝库。
  • 关于“ComfyUI整合包”:你在热词中看到的“ComfyUI整合包”是另一个流行的AI绘画领域工具。ComfyUI是一个基于节点流程的Stable Diffusion(另一个著名的开源AI绘画模型)图形化界面,适合本地部署和高度定制化的工作流。这与Midjourney的云端、易用性定位不同。如果你在深入学习后,对AI绘画的技术底层、模型控制、本地运行产生兴趣,可以转向研究Stable Diffusion和ComfyUI。但对于绝大多数希望快速、优雅地开始艺术创作的初学者和创作者来说,Midjourney无疑是更友好、更强大的起点。

最后,成为AI绘画高手的路上,最重要的不是记住所有参数,而是持续地观察、思考和实践。每次生成都是一次与AI的对话,从结果中反推模型的“理解”,不断优化你的“语言”。大胆尝试各种关键词组合,建立自己的提示词库,享受这种将想象力瞬间可视化的魔力。天空没有极限,你的创作也是。