前言
PREFACE
当今时代,人工智能领域的技术发展日新月异,AIGC(Artificial Intelligence Generated Content,人工智能生成内容)已经渗透到人们的工作和生活场景中,其技术与产业形态已初步形成。Stable Diffusion作为其中的杰出代表,以其独特的从文本到图像的生成能力已在业界崭露头角。目前,Stable Diffusion已开始在众多领域展现出巨大的应用价值:在艺术创作领域,艺术家可利用它激发灵感、辅助创作;在游戏开发领域,可辅助快速生成场景、角色等素材;在广告设计领域,能高效产出富有创意的广告图片等。不同领域的用户对这一技术的需求日益增长,越来越多不同背景的人想要学习和使用它,对于如何系统学习和掌握AI(Artificial Intelligence,人工智能)绘画技术存在迫切需求。
正是基于以上背景,编者在通过认真的理论学习和实际应用Stable Diffusion之后,开始编写本书。本书的目标用户是AI绘画零基础人员,因此编写方面注重以下特色:一是内容适量、适度,精选Stable Diffusion中最基础、最实用的内容(如模型、提示词、文生图、图生图、ControlNet插件等)进行重点介绍,不贪大求全;二是理论联系实际,第1~6章理论部分精讲精练,并穿插众多实例,第7章用较大篇幅详细介绍AI绘画在不同领域的实战应用,力求使读者在学完之后能够快速上手;三是语言简练、画风质朴,语言方面力求表述清晰、通俗易懂,画风方面不追求酷炫华丽,而是简洁大方,留给读者更多想象和发挥的空间;四是绘画内容力求丰富全面,画面中既有动物、植物,又有人物、风景等,如此安排旨在使读者能够比较全面地领会Stable Diffusion AI绘画的强大功能。
本书共分7章。第1章为Stable Diffusion概述,介绍软件基础知识;第2章为Stable Diffusion模型,介绍大模型的下载、模型种类和常用的大模型;第3章为提示词工程,介绍提示词的用法、语法、反推技巧和提示词矩阵;第4章为Stable Diffusion文生图,介绍Stable Diffusion中最常用的由文本生成图像的方法技巧;第5章为Stable Diffusion图生图,介绍由图像生成图像的方法技巧;第6章为ControlNet与热门扩展插件,介绍功能强大的ControlNet插件的应用及一些扩展插件;第7章为AI绘画实战应用,着重介绍Stable Diffusion在不同领域和场景的应用。全书提供了大量应用实例。
本书既可作为高等学校设计类、艺术类专业(如产品设计、视觉传达设计、环境设计、动画设计、数字媒体艺术等专业)本科生、研究生的教材,也可作为成人教育及自学考试教材,还可作为广大AI绘画爱好者的参考学习用书。
AI绘画作为一种新生事物,发展速度很快,目前,人们对于AI绘画应用尚在不断摸索之中,加之编者水平有限,书中不当之处在所难免,欢迎广大同行和读者批评指正。
编 者
2025年12月
目录
CONTENTS
第1章 Stable Diffusion概述1
1.1 Stable Diffusion简介1
1.2 Stable Diffusion的应用领域2
1.2.1 艺术与设计领域2
1.2.2 广告与营销领域3
1.2.3 游戏开发领域4
1.2.4 影视与动画领域5
1.2.5 建筑设计领域6
1.3 Stable Diffusion的安装7
1.3.1 本地安装7
1.3.2 云服务器部署8
1.4 Stable Diffusion WebUI界面简介9
1.5 使用Stable Diffusion生成一张图像10
1.6 本章小结11
第2章 Stable Diffusion模型12
2.1 Stable Diffusion大模型下载12
2.1.1 使用绘世启动器下载大模型12
2.1.2 在第三方模型网站下载大模型15
2.2 Stable Diffusion中的模型种类16
2.2.1 Checkpoint大模型:生成基本图像17
2.2.2 Embedding模型:微调图像19
2.2.3 Hypernetwork模型:转换风格20
2.2.4 LoRA模型:固定画风21
2.2.5 VAE模型:修复图像22
2.3 Stable Diffusion大模型介绍23
2.3.1 基础大模型23
2.3.2 二次元模型24
2.3.3 写实类模型26
2.3.4 2.5D数绘模型26
2.3.5 特定风格模型27
2.4 本章小结28
第3章 提示词工程29
3.1 提示词用法29
3.1.1 提示词类型29
3.1.2 提示词构成元素30
3.1.3 提示词输入规则30
3.1.4 提示词套用公式30
3.2 提示词语法32
3.2.1 强调关键词语法32
3.2.2 分步绘制语法33
3.2.3 融合语法34
3.2.4 打断语法35
3.2.5 交替绘制语法35
3.3 提示词反推技巧36
3.3.1 使用CLIP反推提示词36
3.3.2 使用DeepBooru反推提示词37
3.3.3 使用WD 1.4标签器反推提示词39
3.4 提示词矩阵40
3.5 本章小结41
第4章 Stable Diffusion文生图42
4.1 Stable Diffusion常用采样方法42
4.1.1 Euler a采样方法42
4.1.2 DPM++ 2M Karras采样方法43
4.1.3 DDIM采样方法44
4.2 Stable Diffusion文生图基本参数44
4.2.1 迭代步数(Steps)44
4.2.2 高分辨率修复(Hires. fix)45
4.2.3 图像尺寸46
4.2.4 出图批次46
4.2.5 提示词引导系数(CFG Scale)47
4.2.6 随机数种子(Seed)47
4.3 文生图实例48
4.4 本章小结50
第5章 Stable Diffusion图生图51
5.1 图生图概述51
5.1.1 “图生图”界面51
5.1.2 缩放模式52
5.1.3 “重绘幅度”参数54
5.1.4 图生图应用55
5.2 图生图主要模式56
5.2.1 “图生图”模式56
5.2.2 “涂鸦”模式58
5.2.3 “局部重绘”模式59
5.2.4 “涂鸦重绘”模式61
5.2.5 “上传重绘蒙版”模式62
5.2.6 “批量处理”模式64
5.3 图生图实例64
5.4 本章小结66
第6章 ControlNet与热门扩展插件67
6.1 ControlNet插件概述67
6.2 常用的ControlNet控制类型70
6.2.1 Canny(硬边缘)71
6.2.2 SoftEdge(软边缘)73
6.2.3 Lineart(线稿)74
6.2.4 Scribble/Sketch(涂鸦/草图)76
6.2.5 MLSD(直线)78
6.2.6 Depth(深度)80
6.2.7 NormalMap(法线贴图)83
6.2.8 OpenPose(姿态)85
6.2.9 T2I-Adapter88
6.2.10 Segmentation(语义分割)90
6.2.11 Shuffle(随机洗牌)91
6.2.12 Tile/Blur(分块/模糊)93
6.2.13 局部重绘96
6.2.14 InstructP2P98
6.2.15 Reference(参考)100
6.2.16 Recolor(重上色)102
6.2.17 Revision104
6.2.18 IP-Adapter106
6.2.19 Instant_ID108
6.2.20 SparseCtrl(稀疏控制)111
6.3 Stable Diffusion扩展插件111
6.3.1 ADetailer:修复图像111
6.3.2 Ultimate SD upscale:无损放大图像113
6.3.3 X/Y/Z图表115
6.4 本章小结118
第7章 AI绘画实战应用119
7.1 建筑设计领域119
7.1.1 建筑设计效果图119
7.1.2 室内设计效果图122
7.1.3 线稿图转效果图124
7.2 平面设计领域128
7.2.1 艺术二维码129
7.2.2 艺术字设计134
7.2.3 表情包设计141
7.3 盲盒设计领域144
7.3.1 线稿转3D盲盒144
7.3.2 涂鸦转3D盲盒153
7.3.3 大模型直接生成盲盒158
7.3.4 三视图生成158
7.4 电商服装领域159
7.4.1 “局部重绘”换装160
7.4.2 “涂鸦重绘”换装162
7.4.3 Inpaint Anything换装164
7.4.4 电商人台转真人模特166
7.5 本章小结177
参考文献178