跳转至

新闻

Tip

目前 Stable Diffusion WebUi 迭代非常快,每天都会有大量更新,因此建议每天都拉取最新代码。

12/5

用于角色动画的一致且可控的图像到视频合成

https://humanaigc.github.io/animate-anyone/

11/?

LCM-LoRA 以最少的推理步骤生成高质量的图像,快速生成图像。

论文 https://arxiv.org/abs/2311.05556

介绍视频 https://www.bilibili.com/video/BV1Q94y1E7uc/

11/?

Novel AI V3 模型发布,各方面表现都强于 V2 和其他任何模型。人体把握准确。训练数据未公开,疑似采用版权数据/画集,微博水印清晰可见。

https://twitter.com/novelaiofficial

7/18

Civitai 的现状

自从 civitai 建站以来,虽然 civitai 提供了公开模型的下载。但是欠缺对一些原始事情的交代(数据集来源)。

热榜模型脸部特征趋同,模型质量参差不齐。

3/23

Encoder-based Domain Tuning for Fast Personalization of Text-to-Image Models https://tuning-encoder.github.io/

A powerful and modular stable diffusion GUI with a graph/nodes interface. https://github.com/comfyanonymous/ComfyUI

2/27

LoRA for convolution network

https://github.com/KohakuBlueleaf/LyCORIS

Using ControlNet right in Blender.

https://github.com/coolzilj/Blender-ControlNet

2/13

ControlNet is a neural network structure to control diffusion models by adding extra conditions.

https://github.com/Mikubill/sd-webui-controlnet

2/6

StableDiffusionWebUI accelerated using TensorRT

https://github.com/ddPn08/Lsmith

1/17

GPU 性能分析图

https://twitter.com/umiyuki_ai/status/1615153720333078528/photo/1

Lora

https://github.com/microsoft/LoRA https://github.com/CCRcmcpe/scal-sdt/blob/main/modules/lora.py

12/1

WebUi:Newly created embeddings considered malicious

11/30

DreamArtist DA 更新了动态 cfg,可以根据时间步自动调整 cfg,支持非线性。动态 cfg 可以加快收敛,可能提高学习质量,对多图大数据集更好使。

11/28

DreamArtist DA 更新了局部学习增强,可以强调更多学习某一部分特征了。增强图是一个灰度图,图像值的范围 0-255.0-127 表示降低注意力从 1-0.01 等分,127-255 表示加强注意力,从 1-5 等分。

11/24

Stable Diffusion 2.0 Release

https://stability.ai/blog/stable-diffusion-v2-release

DiffusionDet: Diffusion Model for Object Detection

https://arxiv.org/abs/2211.09788

11/23

How to train Stable Diffusion (SD) "efficiently" and how to use SCAL-SDT itself (WIP). SCAL-SDT

11/22

梯度累积、autocast 修复、新的潜在采样方法等

Nerfgun3/bad_prompt

The idea behind this embedding was to somehow train the negative prompt as an embedding, thus unifying the basis of the negative prompt into one word or embedding.

11/21

Spellbrush 和 Midjourney 共同研发的 nijijourney 开始内测。官方 Discord 频道分设 日本語,中文,한글,English 四个子区。

niji · journey is developed in collaboration by Spellbrush and Midjourney 

经过初步测试,nijijourney 有良好的构图能力,但是效果仍待观望。

11/18

逆向思维修复手部问题的推文

11/16

Anything-V3.0.ckpt 为来自 元素法典 群友融合出的混合模型。

还有一个所谓手部修复模型,是根据一名著名画师的作品训练的再生 DreamBooth 模型。

11/15

Telegram 中文社区中,关于 NAI Leak 的 Colab 笔记本 收到了 DMCA 通知。

https://lumendatabase.org/notices/29484955

https://lumendatabase.org/notices/29484957

再次说明:Aidraw Wiki 不分发设计版权争议的 Cpkt 文件

11/12

Stable-Diffusion 中文模型

11/11

  • Pull#4563 在 ngrok 中添加用户名和密码
Allows specifying the user of ngrok by username and password using the : --ngrok authtoken:username:password
and keep old args for not using username and password only use authtoken : --ngrok authtoken

11/10

  • Add username and password in ngrok https://github.com/AUTOMATIC1111/stable-diffusion-webui/pull/4563

  • 添加对 SSL/TLS 的支持(提供 Gradio TLS 选项) https://github.com/AUTOMATIC1111/stable-diffusion-webui/pull/4320

11/9

  • 许可问题

https://github.com/AUTOMATIC1111/stable-diffusion-webui/pull/4222

11/8

  • Colossal-AI: A Unified Deep Learning System for Big Model Era 不明所以的项目 https://github.com/hpcaitech/ColossalAI

11/7

  • DreamBooth WebUI 插件

https://github.com/d8ahazard/sd_dreambooth_extension

  • 有插件中出现了广告

https://www.reddit.com/r/StableDiffusion/comments/ynshup/ads_are_starting_to_appear_in_our_foss/

11/6

  • 新的采样高阶算法

DPM-Solver (and the improved version DPM-Solver++) is a fast dedicated high-order solver for diffusion ODEs with the convergence order guarantee.

Add support for the new DPM-Solver++ samplers added to k-diffusion

dpm-solver

论文 https://arxiv.org/abs/2211.01095

exp

Test From Here

生成过程中使用了本地训练的超网络

exp

Test From Here

DPM-Solver++ 只需 15 到 20 个步骤即可实现出色的样本质量,尤其是 2M 和 2M Karras。从 15 步开始,所有步数的结果都非常详细,而且速度很快。

  • 新的模型

eDiffi:具有专家降噪器集合的文本到图像扩散模型 https://deepimagination.cc/eDiffi/

  • 来自 DreamBooth 的一位原始作者:停止使用 SKS 作为初始化词

https://www.reddit.com/r/StableDiffusion/comments/yju5ks/from_one_of_the_original_dreambooth_authors_stop/

  • AI 艺术走红赚钱:一位 AI 艺术家的自白

https://www.reddit.com/r/StableDiffusion/comments/yh8j0a/ai_art_is_popular_and_makes_money_confessions_of/

11/5

WebUi 发布 tokenizer 插件,可以查看分词情况。

11/3

  • 发现了一个很好用,很实用的工具。

画作焊接

  • 2

经过测试,我发现 emoji 真的很好用。对于场景效果总是有惊喜。

masterpiece,best quality,1girl,
,light blue hair,solo,(anime coloring:1.1),
(🌻☀️🌈:1.2),hug Sunflower,

lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, bad feet

11/2

为 Krita 插件等添加自定义后端 API

https://github.com/Interpause/auto-sd-paint-ext

这个 PR 中,WebUi 修复了 IMG2IMG 处理后不释放 RAM 的问题

11/1

disable access to extension stuff for non-local servers

https://github.com/AUTOMATIC1111/stable-diffusion-webui/commit/dc7425a56e7a014cbfa3b3d44ad2321e519fe378

社区反映:共享链接可能会导致风险,攻击者可以访问系统上的所有文件。

10/30

这次提交中 ,WebUi 添加了 allow skip current image in progress api ,跳过当前流程的 Api 方法。

这次合并 中,WebUi 添加了原生的进度 Api

10/29

讨论 有人认为,通过在 Windows 设置上禁用硬件加速 GPU 调度,WebUi 性能提高了大约 10-50%

10/27

文档增加了 API 内容

10/26

中文翻译上线

法语翻译上线

土耳其翻译上线

WebUi 在 这次提交 中将 override_settings 添加到 API

这次提交 后,img2img 使用了手机照片的 EXIF 方向。

WebUi 在 这次提交 中添加了权重初始化和更多激活函数。

WebUi 在 这次提交 中允许了在 --medvram 下创建 embedding 的情况。

Hint:will send cond model to GPU if lowvram/medvram is active

10/25

集成 Tag 工具/支持超网络的 Web 开源项目说他们缺人。

此次提交 中,从 --use-cpu 中删除了 BSRGAN ,将 SwinIR 添加到 --use-cpu 并修复 MPS 上的 upscalers

你可以在 这里 找到 BSRGAN ,下载的模型放到 esrgan 文件夹就可以使用。

#3505 之后超网络训练不稳定 ,问题

10/24

Colab 称昨天的封号是 错误的滥用判定

WebUi 移除了图像浏览器 ,转换为 插件

10/23 更新

这次提交 中,WebUi 增加了日本语翻译。

这次提交 中,WebUi 增加了设置锁定启动参数。

parser.add_argument("--freeze-settings", action='store_true', help="disable editing settings", default=False)

有网友称,最近发布的的 Stable Diffusion 1.5 偏向 三次元 一些。

WebUi 增加了俄语翻译,添加了 img2img API。

这次请求 中,WebUi 更新了 ESRGAN 架构和模型以支持所有 ESRGAN 模型。

Colab 开始反滥用,协议 禁止穿透。但是有人指出 Colab 并没有计划封禁 SD,确认误封。

Colab 的 协议 不允许利用多个帐号绕过访问权限或资源使用情况限制。

有人反映 某度好像会封锁 NAI 的模型。

10/22 更新

这次提交 中,仓库移除了美学权重。

这项功能已经被转为 插件

10/21 更新

Implementation of Stable Diffusion with Aesthetic Gradients 美学权重

https://github.com/AUTOMATIC1111/stable-diffusion-webui/pull/2585

10/20 更新

激活函数

https://github.com/AUTOMATIC1111/stable-diffusion-webui/pull/3199

SD v1.5

https://huggingface.co/runwayml/stable-diffusion-v1-5

10/19 更新

各种模型链接正在失效,有余力可以分流备链。

10/14 更新

Rce 漏洞曝光,但是新版本中得到修复,请为实例设置密码。

10/13 更新

automatic1111 的 repo 从 r/stablediffusion 的固定指南中删除

10/12 更新

StabilityAI 从现在开始只发布 SFW 模型,from Here

10/11 更新

新版本 Webui 增加了 Eta noise seed delta ,设为 31337 后会贴近 NAI 官方

现在可以训练 Hypernetworks

10/10 更新

测试发现,新版本 WebUi 优化显存占用 (20xx—> 10xx),关闭浏览器和 TG 的硬件加速后,即使是 4GB 的 RTX2050 也可以启动 --medvram 模式!而且很快。

Q & A

背景故事

NovelAI 是一个使用 AI 生成故事文本和 通过描述文字生成图片 的服务,而 Stable Diffusion 是由 Stability AI 发布的透过文字等生成图片的模型。

开发者 AUTOMATIC 是 Stable-Diffusion-Webui 的主要开发者:此项目可以用于在使用 Stable Diffusion 等模型时调整参数,极大地方便了尤其是没有计算机背景或 AI/ML 背景的模型用户。

前几日 NovelAI 称其部分软件和源码泄露。在模型泄露后, AUTOMATIC 在 Webui 项目中添加了对 Hypernetwork 模型的支持,使得此项目可以和泄露模型共用。

此 Reddit 贴称, Stability AI 创始人 Emad Mostaque 谴责 AUTOMATIC 此行为,并称后者窃取了代码;

AUTOMATIC 则称自己没有窃取代码,并解释说他编写的代码是基于很久以前已经完成的研究和开发,并且是开源的。

有问题的函数于 2021 年 12 月 21 日在 此处 发布,并称反倒是 NovelAI 使用了自己的代码 (https://imgur.com/a/Z2QsOEw)。 Stable Diffusion 社群管理员后又要求 AUTOMATIC 移除项目中的 Hypernetwork 支持,称 NovelAI 核心开发者认为相关代码必然与泄露源码有联系; 但被以代码原创且 Hypernetwork 并非泄露模型独创 的理由回绝。 而后, AUTOMATIC 被从 Stable Diffusion 的(Slack?)社群服务器中封禁。

来自 https://rentry.org/sd-tldr


最后更新: December 5, 2023 09:48:06
创建日期: October 13, 2022 10:24:49