你的位置:真实迷奸女高中生 > 哥也色中文网 > 【GAS-011】爆乳momo Decrypt 踏实扩散指南:最执意的 AI 图像生成开源器用
【GAS-011】爆乳momo Decrypt 踏实扩散指南:最执意的 AI 图像生成开源器用
发布日期:2024-08-24 04:28    点击次数:98

【GAS-011】爆乳momo Decrypt 踏实扩散指南:最执意的 AI 图像生成开源器用

图片

Stable Diffusion 是一种文本到图像生成东说念主工智能器用,这意味着它将笔墨转念为图像。这个过程雷同于将详备的简介邮寄给一位画家,然后恭候用心创作的艺术品的复返。

将踏实扩散视为你个东说念主的基于东说念主工智能的创意盟友。这种深度学习模子主如果为了证据文本请示生成图像而遐想的,它杰出了单一功能。它还可用于建筑(转变图像的部分)、遮蔽(将图像推广到其现存界限除外)以及证据文本请示翻译图像。这种多功能性特殊于领有一位多艺多才的艺术家供你使用。

踏实扩散的力学

踏实扩散基于深度学习模子运行,该模子证据文本描述制作图像。其复旧是扩散过程,其中图像通过一系列尺度从随即噪声迂回为连贯图像。该模子经过磨练可以指挥每个阶段,从而证据提供的文本请示携带从出手到完成的系数这个词过程。

踏实扩散背后的中心念念想是将噪声(随即性)转念为图像。该模子以一堆随即噪声(想象一下来自无信号电视的白噪声的彩色版块)来启动该过程,然后在文本请示的影响下冉冉细化为可鉴别的图像。这种细化系统地进行,踏实地减少噪声并增强细节,直到出现高质地的图像。

跟着扩散过程的出手,初步阶段在很猛进程上决定了图像的合座构图,随后的要津字转变仅影响较小的部分。这强调需要仔细留心要津字权重和时代安排,以完了你想要的驱散。

踏实扩散的优点和缺欠

踏实扩散的优点之一是,它擅长创建详备的高质地图像,并证据特定请示进行定制遐想。它可以轻佻地浏览多样艺术格调,无缝会通不同艺术家的本事,并在不同的要津词之间平滑过渡。

与 MidJourney等同类家具不同,Stable Diffusion 是免费的,这对你的预算来说是一个福音。它亦然开源的,这意味着你可以证据需要对其进行修改。不论你渴慕创造明天派时局如故动漫格调的图像,踏实扩散都有一个稳健你的模子。稍后咱们将深入预计奈何下载并证据你的喜好定制这些模子。

你可以离线运行它,无需持续的互联网一语气或服务器走访,这使其成为注重阴私的用户的认真器用。

关联词,也有一些缺欠,与 MidJourney 不同,Stable Diffusion 具有笔陡的学习弧线。要生成确切出色的图像,你必须使用自界说模子、插件和一些请示工程。这有点像 Windows 与 Linux 的情况。

此外,该模子有时会推崇出弗成预见的关联,从而导致巧合的驱散。请示中的细小失实可能会导致输出出现首要偏差。举例,在请示中指定眼睛表情可能会巧合中影响生成的扮装的种族(举例,蓝眼睛通常与白种东说念主干系)。因此,为了得回最好驱散,必须深入了解其责任旨趣。

此外,请示中需要大量细节智商提供令东说念主印象深远的驱散。与 MidJourney 不同,MidJourney在“一个鲜艳的女东说念主在公园分布”等请示下推崇邃密,而踏实扩散需要对你但愿(或不但愿)在图像中看到的系数内容进行全面描述。为冗长、详备的请示作念好准备。

操作踏实扩散

运行踏实扩散的行为有多种,可以通过基于云的平台,也可以平直在土产货诡计机上。 

以下是一些可让你在云中测试它的在线平台:

Leonardo AI:允许你尝试不同的模子,其中一些模子效法 MidJourney 的好意思学。

Sea Art:使用插件测试大量踏实扩散模子的好场地是其他高档器用。

Mage Space:提供踏实扩散版块 v1.5 和 2.1。尽管它有大量其他模子,但它需要会员经验。

Lexica:一个用户友好的平台,可携带你发现图像的最好请示。

Google Colabs:另一个易于走访的选项。

然则,如果你采纳土产货装置,请确保你的诡计机具有必要的功能。

系统条目

要在土产货运行 Stable Diffusion,你的 PC 应运行 Windows 10 或更高版块,而况至少配备具有至少 4 GB VRAM 的寥寂 Nvidia 显卡 (GPU)、16GB RAM 和至少 10GB 可用空间。

为了得回最好体验,提倡使用具有 12GB vRAM、32GB RAM 和高速 SSD 的 RTX GPU。磁盘空间将取决于你的具体需求:你霸术使用的模子和附加组件越多,你需要的空间就越多。一般来说,模子需要 2GB 到 5GB 的空间。

使用自动 1111 导航踏实扩散

当你出手踏实扩散之旅时,采纳正确的图形用户界面 (GUI) 变得至关膺惩。在绘制方面,Invoke AI处于最先地位,而SD.Next 则注重效力。ComfyUI是一个基于节点的超轻量级选项,由于与新的 SDXL 兼容,最近得回了很大的和蔼。关联词,Automatic 1111以其流行性和用户友好性成为最受接待的。让咱们深入探讨奈何出手使用 Automatic 1111。

图片

运行踏实扩散的两个不同的 GUI(A1111 和 ComfyUI)

缔造自动 1111

由于此存储库上提供了一键式装置尺度,Automatic 1111 的装置过程并不复杂。干预 Github 页面的“assets”部分,下载 .exe 文献并运行它。这可能需要一些时代,是以请相持下去 - 请记着,耐烦是要津。

告捷装置后,“A1111 WebUI”快捷方式将在新掀开的文献夹中出现。酌量将其固定到任务栏或创建桌面快捷方式以便于走访。单击此快捷方式将启动踏实扩散,为你的创意号令作念好准备。

最好勾选以下复选框:自动更新 WebUI(使尺度保持最新)、自动更新推广(保持插件和第三方器用更新),而况,如果你的电脑功能不是那么执意,还应激活低 VRam (medvram) 和启用 Xformers 的选项。

图片

启动 A1111 之前出现的屏幕

了解用户界面

装置了 A1111 的踏实扩散后,掀开它时你将看到以下内容

图片

自动 1111 GUI

但不要被吓倒。以下是运行踏实扩散时界面的简要浏览:

检查点或模子:内容上是 AI 图像操作背后的中枢,这些事前磨练的踏实扩散权重可以与汲取不同派别的不同艺术家进行相比。一个东说念主可能擅长动画,而另一个东说念主则擅长执行目的。你在这里的采纳决定了你图像的艺术格调。

积极请示:这是你在形象中抒发你想要的东西的场地。

狡赖请示:在此指定你不但愿在你的作品中看到的内容。

创建姿首:如果你但愿将正面和负面请示的特定组合保存为“姿首”以供将来使用,请单击此处进行操作。

应用姿首:将往常保存的姿首应用到现时请示。

生成:缔造完系数参数后,单击此处使你的图像活龙活现。

采样尺度:此参数界说将随即噪声迂回为最终图像所遴选的尺度。20 到 75 之间的范围通常会产生邃密的驱散,25-50 是实用的中间值。

采样行为:如果模子代表该尺度的中枢,那么采样器等于一切背后的大脑。这是用于获取请示、编码器和每个参数并证据你的号令将噪声转念为连贯图像的本事。有许多采样器,但咱们推选“DDIM”用于快速渲染,只需几个尺度,“Euler a”用于皮肤光滑的东说念主的画图或相片,“DPM”用于详备图像(DPM++ 2M Karras 可能是一个可以的安全采纳) 。以下是使用踏实扩散的不同采样行为得回的驱散的汇编。

批次计数:批次计数将一个接一个地运行多批生成。这将允许你使用疏通的请示创建不同的图像。这需要更长的时代,但使用更少的 vRAM,因为每个图像都是在前一个图像完成青年景的

批次大小:这是每个批次中有几许并行图像。这将为你提供更多图像,速率更快,但也需要更多 vRAM 来经管,因为它会在归拢代中生成任何图像。

CFG比例:它决定了模子的创作解放度,在罢黜你的请示和我方的想象力之间取得均衡。较低的 CFG 将使模子忽略你的请示并更具创造性,较高的 CFG 会使其王人备莫得解放地相持下去。5 到 12 之间的值通常是安全的,7.5 提供可靠的中间值。

宽度和高度:在此处指定图像尺寸。肇端分辨率可以是 512X512、512X768、768x512 或 768x768。关于 SDXL(Stability AI 的最新式号),基天职辨率为 1024x1024

种子:将其视为图像的独一 ID,为出手随即噪声缔造参考。如果你缱绻复制特定驱散,这少量至关膺惩。此外,大奶喵喵酱每个图像都有一个独到的种子,这等于为什么弗成能确切 100% 复制特定的执行生涯图像 - 因为它们莫得种子。

骰子图标:将种子缔造为 -1,使其随即化。这保证了每个图像生成的独一性。

回收图标:保留前次图像生成的种子。

剧本:它是引申影响你的责任经由的高档指示的平台。作为入门者,你可能但愿暂时保持不变。

保存:将生成的图像保存在你采纳的文献夹中。请留心,踏实扩散还会自动将图像保存在其专用的“输出”文献夹中。

发送到 img2img:将你的输起程送到 img2img 选项卡,使其成为雷同它的新一代的参考。

发送到建筑:将图像定向到建筑选项卡,使你豪爽修改特定图像区域,举例眼睛、手或伪像。

发送到额外内容:此操作会将你的图像从头定位到“额外内容”选项卡,你可以在其中赈济图像大小,而不会丢失大量细节。

等于这么——一切都准备好了!目下【GAS-011】爆乳momo,让你的创造力尽情阐扬,见证踏实扩散的神奇魔力。

请示工程 101:奈何为 SD v1.5 制作邃密的请示

踏实扩散的告捷很猛进程上取决于你的请示——将其视为指挥东说念主工智能的指南针。细节越丰富,生成的图像就越准确。

快速制作有时可能看起来令东说念主怯怯,因为踏实扩散不罢黜线性模式。这是一个充满尝试和纰谬的过程。从请示出手,生成图像,采纳你可爱的输出,修改你珍视或但愿摒除的元素,然后从头出手。冲洗并重迭这个过程,直到你的宏构通过建筑赈济和不懈的更正而出现。

正面请示、负面请示和微调要津词权重

Stable Diffusion 的遐想可以通过语法(要津字:因子)赈济要津字权重。低于 1 的身分会淡化其膺惩性,而高于 1 的身分会放大其膺惩性。要控制权重,请采纳特定要津字并按 Ctrl+Up 增多或按 Ctrl+Down 减少。此外,你可以使用括号——使用的越多,要津字的权重就越大。

修饰符为你的图像添加临了的丽都,指定方式、格调或细节(如“阴霾、复杂、高度详备、了了的焦点”)等元素。

积极的请示详尽了你想要的元素。快速构建的可靠计谋是按规定指定图像类型、主题、绪论、格调、配景或时局、艺术家、使用的器用和分辨率。civita.com 的演示可以是“确切感渲染、(数字绘画)、(最好质地)、宁静的日本花坛、开放的樱花、(((锦鲤池)))、东说念主行桥、浮图、浮世绘艺术格调,北斋灵感,特地艺术流行,8k超写实,柔软的配色决策,柔软的灯光,黄金时刻,宁静的氛围,时局导向”

违反,负面请示详备证实了你但愿从图像中拆除的系数内容。示例包括:阴霾的表情、丑陋、晦气的手、太多的手指、NSFW、会通的动作、最差的质地、低质地、迷糊、水印、文本、低分辨率、长脖子、超出框架、充足的手指、变异的手、单色、丑陋的、重迭的、病态的、不良的剖解结构、不良的比例、毁容、低分辨率、变形的手、变形的脚、变形的脸、变形的体格部位、((疏通的发型))等。不要窄小用不同的词。

酌量请示的一个好行为是“What+SVCM(主语、动词、高下文、修饰语) ”结构:

内容:细则你想要的内容:肖像、相片、插图、绘画等。

主题:描述你正在酌量的主题:一个鲜艳的女东说念主、一个超等骁雄、一个亚洲老东说念主、一个黑东说念主士兵、小孩、鲜艳的时局。

动词:描述拍摄对象正在作念什么:女东说念主正在对着镜头摆姿势吗?超等骁雄是飞如故跑?亚洲东说念主是含笑如故向上? 

配景:描述你的想法中的场景:场景发生在那边?在公园、在教室、在拥堵的城市?尽可能具有描述性

修改器:添加关联图像的附加信息:如果是图片,则使用哪个镜头。如果是一幅画,是哪位艺术家画的?使用哪种类型的照明,哪个地点会汲取这种照明?你正在酌量哪种服装或前卫格调,图像吓东说念主吗?这些见识用逗号分隔。但请记着,越接近出手,它们在最终作品中就越隆起。如果你不知说念从那边出手,如果你不想仅仅复制/粘贴其他东说念主的请示,这个网站和这个Github 存储库有许多好主意供你尝试

因此,积极请示的一个例子可以是:在一家奋发的栈房里对着镜头摆姿势的可儿贵客犬的肖像,(((黑尾巴)))、秋天、散景、宏构、强光、胶片颗粒、佳能 5d 符号4、F/1.8、Agfacolor、演叨引擎。

狡赖请示不需要合适的结构,只需添加你不可爱的系数内容,就好像它们是修饰符通常。如果你生成图片并看到一些你不可爱的内容,只需将其添加到狡赖请示中,从头运行生成并评估驱散即可。这等于东说念主工智能图像生成的旨趣,这并不是什么古迹。负面请示的一个例子可以是:迷糊、画得不好、猫、东说念主类、东说念主、素描、恐怖、丑陋、病态、变形、标志、文本、不良剖解学、不良比例

要津词整合和实时安排

要津字混杂或请示蜕变汲取语法[要津字1:要津字2:因子]。该因子是一个介于 0 和 1 之间的数字,决定在哪一步从要津字 1 切换到要津字 2。

懒惰的长进:复制请示

如果你不细则从那边出手,请酌量愚弄各个网站的想法并进行赈济以同意你的需求。请示的优秀起原包括:

奇维泰

辞书

踏实的扩散网

请示骁雄

或者,保存你观赏的东说念主工智能生成的图像,将其拖放到“PNG 信息”选项卡上,踏实扩散会提供从头创建它的请示和干系信息。如果图像不是 AI 生成的,请酌量使用 CLIP Interrogator 插件来更好地意会其描述。关联此附加组件的更多详备信息将在指南背面提供。

幸免罗网

踏实扩散的后果取决于它给出的请示。注重细节和准确性,提供了了具体的请示并爱好见识而不是解释至关膺惩。不要用心遐想一个句子来描述广博、当然清明充足的场景,而只需说“广博、当然清明”。

请留心某些属性可能带来的巧合关联,举例指定眼睛表情时的特定种族。对这些潜在罗网保持警惕可以匡助你制定更有用的请示。

请记着,你的指示越具体,你的驱散就越容易抑制。然则,如果你假装创建长请示,请务必小心,因为使用矛盾的要津字(举例长发,然后仇敌发进行排序,或者狡赖请示中的迷糊和服气请示中的迷糊)可能会导致巧合驱散:

装置新模子

装置模子是一个浅显的过程。最先细则稳健你需求的模子。Civita 是一个很好的起初,它以最大的踏实扩散器用存储库而著明。与其他替代决策不同,Civita 饱读动社区共享他们的告诫,为模子的功能提供视觉参考。

走访 Civita,单击过滤器图标,然后在“模子类型”部分中采纳“检查点”。

图片

Civitai 使用过滤器让用户个性化搜索/Jose Lanz/Decrypt Media

然后,浏览网站上系数可用的模子。请记着,踏实扩散未经审查,你可能会遭逢 NSFW 内容。采纳你可爱的型号并单击下载。确保模子具有 .safetensor 推广名以确保安全(旧模子使用 .ckpt 推广名,但不太安全)。

图片

从 Civitai 下载特定自界说 SD v1.5 模子的页面示例。

下载后,将其放入土产货 Automatic 1111 的模子文献夹中。为此,请导航到装置 A111 Stable Diffusion 的文献夹,然后按照以下阶梯操作:“stable-diffusion-webuimodelsStable-diffusion”

罕有百种型号可供采纳,但作为参考,咱们的一些首选是: 

如果你想玩传神的图像,请使用 Juggernaut、Photon、Realistic Vision 和 aZovya Photoreal。

Dreamshaper、RevAnimated 以及 DucHaiten 的系数模子(如果你可爱 3d 艺术)。

DuelComicMix、DucHaitenAnime、iCoMix、DucHaitenAnime 如果你可爱漫画和漫画等 2D 艺术。

剪辑图像:图像到图像和建筑(待工作项)

踏实扩散还允许你使用 AI 剪辑你不可爱的图像。你可能想要转变构图的艺术格调,在太空中添加鸟类,删除东说念主工成品,或修改手指过多的手。为此,有两种本事:图像到图像和建筑。

图片

由 Stable Diffusion(右)基于用作参考的相片(左)使用 Img2img/Jose Lanz 创建的图像

图像到图像内容上是让踏实扩散使用另一张图片作为参考来创建新图像,不论它是确切图像如故你创建的图像。为此,只需单击图像到图像 (Img2Img) 选项卡,将参考图像放入相应的框中,创建你但愿诡计机罢黜的请示,然后单击生成。需要留心的是,你应用的降噪强度越大,新图像与原始图像的相似进程就越低,因为踏实扩散将具有更多的创作解放度。

知说念了这少量,你可以作念一些很酷的技能,比如扫描你祖父母的旧相片作为参考,通过低降噪强度的踏实扩散和一个相等糊涂的请示(如“RAW,4k 图像,高度详备”)运行它们,望望奈何东说念主工智能重建你的相片。

建筑允许你在原始图像中绘制或剪辑内容。为此,从归拢个 Img2Img 选项卡中,采纳建筑选项并将参考绘画遗弃在那里。

然后,你只需绘制要剪辑的区域(举例,扮装的头发)并添加要创建的请示(举例,直长的金发),就完成了!

图片

使用建筑在金发女超东说念主的参考图像上剪辑蓝色头发。由 AI/Jose Lanz 生成

咱们提倡生成多批图像,以便你可以采纳最可爱的图像并修改请示。关联词,临了,如果你相等留心,手头有一个像 Photoshop 这么的器用老是有平正的,这么可以得到完整的驱散。

增强踏实扩散功能的 5 大推广

目下你依然纯熟了踏实扩散,你可能渴慕进一步阐扬你的创造力。也许你想要固定特定的手部位置、强制模子生成五指手、指定某种类型的衣着、增强细节、使用特定的脸部,或者将小图像转念为大型 8K 文献,同期尽可能减少细节圆寂。

推广可以匡助你完了这些方针。固然有许多可用选项,但咱们要点先容了五个必备推广:

LoRA:细节决定成败

图片

不使用 LoRA 生成的图像与使用 LoRA 生成的疏通图像以添加更多细节。

LoRA 是旨在增强模子特异性的文献,无需下载全新模子。这使你可以完善细节,汲取特定的状貌、服装或格调。

要装置 LoRA,请按照下列尺度操作:

单击“推广”选项卡并采纳“从 URL 装置”。

在框中输入 URL:https: //github.com/kohya-ss/sd-webui-additional-networks.git ,然后单击“装置”。

完成后,单击“已装置”,然后单击“应用并从头启动 UI”。

装置 LoRA 的尺度与装置模子疏通。在 Civitai 上,将过滤器缔造为“LoRA”,并使用以下旅途将文献放入 LoRA 文献夹中:stable-diffusion-webuimodelsLora

请记着,某些 LoRA 需要在请示中输入特定要津字智商激活,因此请务必在使用前阅读其证实。

要使用 LoRA,请导航到 text2img 选项卡,单击雷同小画的图标(显现/避讳额外网罗),LoRA 将出目下请示下方。

ControlNet:开释视觉魔法的力量

图片

不使用 LoRA 生成的图像与使用 LoRA 生成的疏通图像以添加更多细节。

如果你对踏实扩散的功能尚未作念出决定,请让 ControlNet 推广成为最终的谜底。ControlNet 领有深广的多功能性和执意功能,使你豪爽从参考图像中索取构图,阐述我方是图像生成界限的游戏章程改变者。

ControlNet 确乎是万事通。不论你是需要复制姿势、模拟配色决策、从头遐想你的生涯空间、制作五指手、在不使 GPU 职守过重的情况下引申险些无穷的升级,如故将浅显的涂鸦迂回为令东说念主咋舌的 3D 渲染或传神的视觉后果,ControlNet 都可觉得你提供匡助。方式。

装置 ControlNet 波及以下浅显尺度:

走访推广页面并采纳“从 URL 装置”选项卡。

将以下 URL 粘贴到“推广存储库的 URL”字段中:https: //github.com/Mikubill/sd-webui-controlnet

单击“装置”。

关闭踏实扩散界面。

要启用 ControlNet,你需要从此存储库下载模子:https://huggingface.co/lllyasviel/ControlNet-v1-1/tree/main

然后,将系数下载的文献复制到此文献夹中:stable-diffusion-webuiextensionssd-webui-controlnetmodels

从头启动踏实扩散后,你会留心到 text2img 选项卡中出现了一个新的“ControlNet”部分。 

向你提供两个主要选项:用于拖放参考图像的框、控件类型采纳和预经管器。

“参考图像框”是你上传想要参考的姿势、脸部、颜色组成、结构等的图像的场地。

“抑制类型采纳”是 ControlNet 魔法发生的场地。此功能允许你细则要复制或抑制的内容。

你还有其他更高档的选项可让你微调驱散:预经管器(用于激活抑制网的本事)、权重(你的参考有多膺惩)和出手/扫尾点(抑制网何时出手/扫尾其影响)

以下是每种控件类型的功能的快速详尽:

OpenPose:缜密则位体格的要津部位并复制姿势。你可以使用预经管器采纳系数这个词体格、面部或手部的姿势。

Canny:将你的参考图像转念为带有细线的是曲涂鸦。这允许你的创作罢黜这些线条作为边际,从而与你的参考准确相似。

深度:生成“深度图”以创建图像的 3D 印象,分别近处和远方的对象 - 相等稳健效法 3D 电影镜头和场景。

法线:法线贴图料想名义的标的,相等稳健为盔甲、织物和外部结构等对象提供纹理。

MLSD:识别直线,相等稳健再现建筑遐想。

艺术线条:将图像转念为画图 - 关于动漫和卡通等 2D 视觉后果相等有用。

Softedge:与 Canny 模子雷同,但边际更柔软,为模子提供更多解放度,但精度稍低。

涂鸦:将图像转念为涂鸦,产生比 Canny 模子更通用的驱散。此外,你还可以在绘画上创建涂鸦,并将其用作参考,无需预经管器即可将图像酿成执行的创作。

分割:创建图像的表情图,料想其中的对象。每种表情代表一种特定的物体。你可以使用它来从头遮挡你的图像,或者从头想象具有疏通见识的场景(举例,将 1800 年代的相片酿成赛博一又克替代执行中疏通时局的传神描述,或者仅仅用不同的床、墙壁从头遮挡你的房间不同表情等)

平铺:向图片添加细节并促进放大,而不会使 GPU 职守过重。

建筑:修改图像或推广其细节。目下,借助最近的更新和“仅建筑 + 骆驼”模子,你可以极其注重细节地绘制图像

随即播放:再现参考图像的表情结构。

参考:生成在格调、构图和偶尔的状貌方面与你的参考相似的图像。

T2IA:让你抑制图像的表情和艺术构图。

图片

掌合手这些选项可能需要时代,但它们提供的无邪性和定制性值得付出致力。在线稽察多样教程和携带视频,以充分愚弄 ControlNet。

Roop:Deepfakes九牛二虎之力

Roop 提供了一种轻佻的行为来生成传神的深度伪物。Roop 无需经管复杂的模子或 LoRA,而是可以经管辛勤的责任,使你只需单击几下即可创建高质地的深度伪物。

要下载并激活,请按照官方 Roop Github 存储库上的证实进行操作

要使用它,请创建请示,导航到 Roop 菜单,上传参考面,启用它,然青年景图像。为了得回最好后果,请使用你想要复制的脸部的高分辨率正面相片。请记着,归拢个东说念主的不同图像可能会产生不同的驱散 - 有些比其他图像更传神。

Photopea:Photoshop 踏实扩散的力量

图片

Photopea 推广在 A1111 里面的外不雅

有时,需要手动赈济智商得回完整的驱散,这等于 Photopea 的用武之地。此推广将雷同 Photoshop 的功能平直引入踏实扩散界面,使你无需切换平台即可微调生成的图像。

你可以从此存储库装置 Photopea:https://github.com/yankoliveira/sd-webui-photopea-embed

CLIP 商榷器:从任何图像创建请示

如果你不知说念从那边出手使用请示,那么这是一个很棒的器用。拍摄一张图像,将其放入框中,运行商榷器,它会告诉你哪些单词可以与你提供的图像干系联。

CLIP Interrogator 是一个便捷的器用,用于从特定图像中导出要津字。通过协调 OpenAI 的 CLIP 和 Salesforce 的 BLIP,该推广可以生成与给定参考图像匹配的文本请示。

狠狠干

你可以从此存储库装置:https://github.com/pharmapsychotic/clip-interrogator-ext.git

论断

通过踏实扩散,你将成为视觉管弦乐队的群众。不论是“艾玛·沃特森作为女巫的超执行肖像”如故“幻想环境中海盗的复杂数字绘画”,独一的限度等于你的想象力。 

目下,用你新发现的学问武装起来,继续将你的联想描述成执行,一次一个文本请示。

图片

由 Decrypt 使用 AI/Jose Lanz 创建的图像【GAS-011】爆乳momo

本站仅提供存储服务,系数内容均由用户发布,如发现存害或侵权内容,请点击举报。

相关资讯