当前位置: > 财经>正文

每天一个赚米小技巧, Stable Diffusion 文生图最全教程! 基金理财小技巧有哪些方面的问题呢视频讲解

2023-08-20 14:00:43 互联网 未知 财经

我是Everest无限悟

探索AI领域的设计师

对体验过AI绘画的朋友们来说,提示词可以说是耳熟能详了,目前市面上的AI绘图工具基本都是围绕着文生图的基本功能展开的。不过相较于其他工具,Stable Diffusion的在咒语编写上会具有技巧性,相信大家在学习过程中都遇到过类似问题:复制别人的咒语但效果却很差、咒语的控图效果不理想、加了关键词但绘图结果却没有体现等。

老规矩,提神时刻!

01

关于文生图

文生图是Stable Diffusion中的一种绘图模式,它可以通过选择不同的模型、填写提示词和设置参数来生成我们想要的图片。下面是文生图的基础操作流程:

1.选择模型:在文生图界面中,你可以从可用的模型列表中选择一个适合你需求的模型。不同的模型有不同的画风和特点,可以根据你的喜好和需求进行选择。

2.填写提示词:在文生图界面中,你需要填写一些提示词来指导生成的图片内容。这些提示词可以是具体的物体、场景或者是一些抽象的概念,根据你的提示词,模型会尽量生成符合你要求的图片。

3.设置参数:文生图界面中还提供了一些参数设置选项,你可以根据需要进行调整。这些参数可以影响图像的预设属性,如颜色、饱和度、清晰度等,可以根据自己的需求进行调整。

4.点击生成:完成上述步骤后,你可以点击生成按钮来生成图片。模型会根据你选择的模型、填写的提示词和设置的参数来生成一张图片,你可以在生成结果中进行查看和调整。

关于模型需要讲解的内容有很多,我会在后面的文章中单独进行介绍,今天我们重点关注提示词的写法以及各种设置参数的功能和含义,准备好了吗,下面让我们正式开始吧~

02

提示词的基本语法

如今,大部分模型都是基于英文训练,因此输入的提示词大多只支持英文,中间也会夹杂了各种辅助模型理解的数字和符号。由于AI绘图无需经历手绘、摄影等过程就能凭空生成图片,国内最早一批AI爱好者贴切的将AI绘画过程比作施展魔法,提示词就是我们用来控制魔法的咒语,参数就是增强魔法效果的魔杖。

2.1 基础书写规范

相较于简单易上手的Midjourney,Stable Diffusion的咒语上除了prompt(正向关键词)外,还有Negative prompt反向关键词。顾名思义,正向提示词用于描述想要生成的图像内容,而反向关键词用于控制不想出现在图像中的内容,比如目前很多模型还无法理解的手部构造,为了避免出现变形,我们可以提前在反向关键词中输入手部相关的提示词,让绘图结果规避出现手的情况。不过目前很多反向提示词都已经集成到Embedding模型中,使用时只需输入模型触发词即可,在后续的文章中我会详细介绍。

前面我们提到Stable Diffusion只支持识别英文提示词,因此大家务必记住全程在英文输入法下进行输入,模型是无法理解中文字符的。但好消息是我们不用像学习英语时那样遵照严格的语法结构,只需以词组形式分段输入即可,词组间使用英文逗号进行分隔。除了部分特定语法外,大部分情况下字母大小写和断行也不会影响画面内容,我们可以直接将不同部分的提示词进行断行,由此来提升咒语的可读性。

在Stable Diffusion中,提示词默认并不是无限输入的,在提示框右侧可以看到75的字符数量限制。不过不用担心内容过长的问题,作者A41大佬提前在WebUI中预设好了规则,如果超出75个参数,多余的内容会被截成2段内容来理解。注意这里表示的并非75个英文单词,因为模型是按照标记参数来计算数量的,一个单词可能对应多个参数。

此外,提示词的内容并非越多越好,过多的提示词会导致模型在理解时出现语意冲突的情况,难以判断具体以哪个词为准,并且我们的绘图过程往往会根据出图效果不断修饰提示词内容,太多内容也会导致修改时难以精确定位目标关键词。

看到这里,你可能会担心提示词的编写过程会非常复杂。但实际上,SD的绘图过程是非常自由的。提示词的作用是引导和辅助模型的绘图过程,并非硬性要求,即使你的输入框没有填写任何内容,模型依旧可以为你画出一张图来,甚至可能效果还不错。

但如果想成为专业的魔法师,遵循一套标准的书写规范还是很有必要的:一方面完整且内容丰富的提示词可以让我们更好的控制最终出图效果,另一方面在后期微调过程中,也可以快速修改和验证特定关键词对出图结果的影响。

下面我会为大家介绍如何编写一段优雅的魔法咒语。

2.2 提示词的万能公式

一段能被模型清楚理解的好咒语首先应该保证内容丰富充实,描述的内容尽可能清晰。这个过程就像是甲方给我们布置任务,如果只说设计一张图,不说图中放什么,也不提图片是用来干嘛,我们会一脸懵逼无从下手。同理,Stable Diffusion在绘制图片时需要提供准确清晰的引导,提示词描述的越具体,画面内容就会越稳定。

在下面的例子中,如果我只是简单的写上【A girl】,对于画面中女孩着装、场景、镜头角度等内容都没有提及,Stable Diffusion只能根据模型训练时的历史经验自行发挥。得益于模型的强大,我们得到的绘图结果都还不错,但如果对画面内容有特定要求,这样抽奖的方式就效率很低了。

在下面的例子中,我们对提示词内容进行了丰富,描述了具体的场景和画面构图等信息后,出图结果明显稳定了许多。

当然如果每次都是想到什么输什么,画面中可能还是会缺失很多信息,这里给大家分享一下我自己平时使用的提示词公式,按顺序分别为:主体内容、环境背景、构图镜头、图像设定、参考风格。后续在编写咒语时可以按照一下类目对号入座,会更加规范和易读。当然网络上也有许多其他博主分享的咒语公式,内容都大同小异,只要能满足出图需求即可。

需要注意的是,公式只是参考,并非每次编写咒语我们都要包含所有内容,正常的流程应该是先填写主体内容看看出图效果,再根据自己的需求来做优化调整。

下面我们具体看下每个部分的信息,先说主体内容 ,这里是用于描述画面的主体内容,比如说是人或者动物,人物的着装、表情,动物的毛发、动作等,物体的材质等。一般同一画面中的主体内容不要超过2个,Stable Diffusion对多个物体的组合生成能力较弱,如果对画面内容有特定要求,可以先挨个生成主体素材进行拼合,然后用controlNet插件约束进行出图。

其次是环境背景 ,这个很好理解,就是设定周围的场景和辅助元素,比如天空的颜色、四周的背景、环境的灯光、画面色调等,这一步是为了渲染画面氛围,凸显图片的主题。

构图镜头 主要用来调节画面的镜头和视角,比如强调景深,物体位置等,黄金分割构图、中全景、景深。

图像设定 是增强画面表现力的常用词汇,我们经常在一些惊艳的真实系AI图片中看到比如增加细节、摄影画质、电影感等词,可以一定程度上提升画面细节。但注意最终图像的分辨率和精细度主要还是由图像尺寸来决定的,而本地运行的Stable Diffusion支持的绘图尺寸很大程度决定于显卡性能。如果电脑显卡算力跟不上,再多的关键词也弥补不了硬件差距,当然在Stable Diffusion中也有一些实现高清修复的小技巧,我会在后面的文章中为大家介绍。

最后就是参考风格,用于描述画面想呈现的风格和情绪表达,比如加入艺术家的名字、艺术手法、年代、色彩等。其实参考风格关键词在Stable Diffusion中使用的并不多,平时我们出图,多数情况下都是先选好特定风格的模型,然后根据模型作者提供的触发词强化风格。因为在Stable Diffusion中,图像风格基本是由模型决定的,如果此前该模型并没有经过艺术风格关键词的训练,是无法理解该艺术词含义的。

因此,大家如果对图像风格有要求,最好还是直接使用对应风格的模型来绘图,会比单纯使用提示词有效的多。

你可能会奇怪,为什么参考风格的关键词在Midjourney中效果会格外明显,这是由基础模型决定的。Midjourney调用的是官方服务器的超大模型,里面容纳了海量的训练数据,经过包罗万象的AI学习后基本各类风格的提示词都能理解,这也是为什么Midjourney如今的出图效果基本都很惊艳的原因。另一个典型的例子就是当我们在Midjourney中选择Niji模型时,即使加入高保真、3D等词汇,最终的出图效果也都是二次元画风的原因。

当然,如果每次编写咒语时都要背一次公式也太过麻烦。这里我搜集了网络上各类关键词,并结合自己使用经验整理了一套自用关键词文档,里面有3k+中英文对照词汇,大家平时在输入提示词时可以查找对应词条,基本能涵盖日常大多数的使用场景了,如果大家需要的话可以在公众号后台回复【关键词宝典】获取。

最后再提一点,我们最终的出图结果是由提示词、绘图模型和参数等共同决定的,不同模型对提示词的敏感度也不同,因此大家尽量结合模型特点灵活控制提示词的内容,比如对写实类模型可以多使用真实感等词汇,对二次元风格模型多使用卡通插画等词汇。

03

高阶语法技巧

看到这里,你已经掌握了Stable Diffusion提示词的基础书写规则。但WebUI的强大并不止于此,作者“贴心”的为我们预设了很多更加高阶的玩法,掌握这些技巧可以让你更高效的控制模型出图,下面就是本篇文章的高能部分,记得做好笔记哦~

上图中我为大家整理汇总了Stable Diffusion常用语法的格式和功能说明,WebUI的高阶语法包括:强调关键词、分步绘制、停止绘制、打断提示词、

版权声明: 本站仅提供信息存储空间服务,旨在传递更多信息,不拥有所有权,不承担相关法律责任,不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的,请发送邮件至 举报,一经查实,本站将立刻删除。