扩散器 · PyPI · Python 包索引

PyTorch和JAX中最先进的扩散技术。

这些详情尚未由PyPI验证

项目链接

主页

元数据

许可证： Apache软件许可证（Apache 2.0许可证）
作者： Hugging Face团队（过去和未来）及所有贡献者（https://github.com/huggingface/diffusers/graphs/contributors）
标签 deep, learning, diffusion, jax, pytorch, stable, diffusion, audioldm
需求： Python >=3.8.0
提供额外功能： dev, docs, flax, quality, test, torch, training

项目描述

🤗 Diffusers 是用于生成图像、音频甚至分子 3D 结构的顶尖预训练扩散模型的首选库。无论您是在寻找简单的推理解决方案还是训练自己的扩散模型，🤗 Diffusers 都是一个模块化工具箱，支持这两者。我们的库设计注重实用性胜于性能、简单易用以及可定制性胜于抽象。

🤗 Diffusers 提供三个核心组件

顶尖的扩散管道，只需几行代码即可进行推理。
可互换的噪声调度器，用于不同的扩散速度和输出质量。
预训练的模型，可以作为构建块使用，并与调度器结合，创建您自己的端到端扩散系统。

安装

我们建议您从 PyPI 或 Conda 在虚拟环境中安装 🤗 Diffusers。有关安装 PyTorch 和 Flax 的更多详细信息，请参阅它们的官方文档。

PyTorch

使用 pip（官方包）

pip install --upgrade diffusers[torch]

使用 conda（由社区维护）

conda install -c conda-forge diffusers

Flax

使用 pip（官方包）

pip install --upgrade diffusers[flax]

Apple Silicon（M1/M2）支持

请参阅如何在 Apple Silicon 上使用 Stable Diffusion 指南。

快速入门

使用 🤗 Diffusers 生成输出非常简单。要从文本生成图像，请使用 from_pretrained 方法加载任何预训练的扩散模型（浏览 Hub 中的 30,000+ 个检查点）

from diffusers import DiffusionPipeline
import torch

pipeline = DiffusionPipeline.from_pretrained("runwayml/stable-diffusion-v1-5", torch_dtype=torch.float16)
pipeline.to("cuda")
pipeline("An image of a squirrel in Picasso style").images[0]

您还可以深入研究模型和调度器工具箱，构建自己的扩散系统

from diffusers import DDPMScheduler, UNet2DModel
from PIL import Image
import torch

scheduler = DDPMScheduler.from_pretrained("google/ddpm-cat-256")
model = UNet2DModel.from_pretrained("google/ddpm-cat-256").to("cuda")
scheduler.set_timesteps(50)

sample_size = model.config.sample_size
noise = torch.randn((1, 3, sample_size, sample_size), device="cuda")
input = noise

for t in scheduler.timesteps:
    with torch.no_grad():
        noisy_residual = model(input, t).sample
        prev_noisy_sample = scheduler.step(noisy_residual, t, input).prev_sample
        input = prev_noisy_sample

image = (input / 2 + 0.5).clamp(0, 1)
image = image.cpu().permute(0, 2, 3, 1).numpy()[0]
image = Image.fromarray((image * 255).round().astype("uint8"))
image

查看快速入门，今天开始您的扩散之旅！

如何导航文档

文档	我可以学到什么？
教程	这是一门基础速成课程，用于学习如何使用库的最重要功能，例如使用模型和调度器构建自己的扩散系统，以及训练自己的扩散模型。
加载	如何加载和配置库的所有组件（管道、模型和调度器）的指南，以及如何使用不同的调度器。
推理管道	如何使用管道执行不同推理任务的指南，批量生成、控制生成输出和随机性，以及如何向库贡献管道。
优化	如何优化您的扩散模型以运行更快并消耗更少内存的指南。
训练	如何使用不同的训练技术训练扩散模型以执行不同任务的指南。

贡献

我们热爱开源社区的贡献！如果您想为这个库做出贡献，请查看我们的贡献指南。您可以查看问题以找到您想解决的问题。

查看好的首次问题以获取一般贡献机会
查看新模型/流水线以贡献令人兴奋的新扩散模型/扩散流水线
查看新调度器

此外，在我们公共Discord频道中打招呼 👋 。我们讨论有关扩散模型的最新趋势，互相帮助贡献、个人项目或只是闲逛 ☕。

任务	流水线	🤗 中心
无条件图像生成	DDPM	google/ddpm-ema-church-256
文本到图像	稳定扩散文本到图像	runwayml/stable-diffusion-v1-5
文本到图像	unCLIP	kakaobrain/karlo-v1-alpha
文本到图像	DeepFloyd IF	DeepFloyd/IF-I-XL-v1.0
文本到图像	Kandinsky	kandinsky-community/kandinsky-2-2-decoder
文本引导的图像到图像	ControlNet	lllyasviel/sd-controlnet-canny
文本引导的图像到图像	InstructPix2Pix	timbrooks/instruct-pix2pix
文本引导的图像到图像	稳定扩散图像到图像	runwayml/stable-diffusion-v1-5
文本引导的图像修复	稳定扩散修复	runwayml/stable-diffusion-inpainting
图像变化	稳定扩散图像变化	lambdalabs/sd-image-variations-diffusers
超分辨率	稳定扩散升级	stabilityai/stable-diffusion-x4-upscaler
超分辨率	稳定扩散潜在升级	stabilityai/sd-x2-latent-upscaler

使用 🧨 Diffusers 的热门库

感谢您使用我们 ❤️。

鸣谢

此库具体化了许多不同作者先前的工作，没有他们的出色研究和实现，这是不可能的。我们特别感谢以下实现，这些实现帮助我们在开发中取得了进步，没有它们，API 可能无法像今天这样精致：

@CompVis 的潜在扩散模型库，可在此处获取
@hojonathanho 的原始 DDPM 实现，可在此处获取，以及 @pesser 通过 PyTorch 实现的非常有用的翻译，可在此处获取
@ermongroup 的 DDIM 实现，可在此处获取
@yang-song 的 Score-VE 和 Score-VP 实现，可在此处获取

我们还要感谢 @heejkoo 为扩散模型论文、代码和资源提供的非常有用的概述，可在此处获取，以及 @crowsonkb 和 @rromb 提供的有用讨论和见解。

引用

@misc{von-platen-etal-2022-diffusers,
  author = {Patrick von Platen and Suraj Patil and Anton Lozhkov and Pedro Cuenca and Nathan Lambert and Kashif Rasul and Mishig Davaadorj and Dhruv Nair and Sayak Paul and William Berman and Yiyi Xu and Steven Liu and Thomas Wolf},
  title = {Diffusers: State-of-the-art diffusion models},
  year = {2022},
  publisher = {GitHub},
  journal = {GitHub repository},
  howpublished = {\url{https://github.com/huggingface/diffusers}}
}

哈希值 for diffusers-0.30.3.tar.gz

diffusers-0.30.3.tar.gz的哈希值
算法	哈希摘要
SHA256	`67c5eb25d5b50bf0742624ef43fe0f6d1e1604f64aad3e8558469cbe89ecf72f`
MD5	`fe93142b23fa2a5dd2b44ea21609e9bf`
BLAKE2b-256	`dea9a53a3d0c0a277a5002aa1e625d0e651b2957f901438052d8d47a97703883`

哈希值 for diffusers-0.30.3-py3-none-any.whl

diffusers-0.30.3-py3-none-any.whl的哈希值
算法	哈希摘要
SHA256	`1b70209e4d2c61223b96a7e13bc4d70869c8b0b68f54a35ce3a67fcf813edeee`
MD5	`b9cadb4df1b78181bc0841e2d1d2139c`
BLAKE2b-256	`d11c2ad4e336fe8d83865810f32717a6b38ece3e90c2acc441cfadb5ce950eda`

diffusers 0.30.3

导航

已验证详情

维护者

未验证详情

项目链接

元数据

分类器

项目描述

安装

PyTorch

Flax

Apple Silicon（M1/M2）支持

快速入门

如何导航文档

贡献

热门任务 & 流水线

使用 🧨 Diffusers 的热门库

鸣谢

引用

项目详情

已验证详情

维护者

未验证详情

项目链接

元数据

分类器

发布历史发布通知 | RSS 源

下载文件

源分发

构建分发

diffusers 0.30.3

导航

已验证详情

维护者

未验证详情

项目链接

元数据

分类器

项目描述

安装

PyTorch

Flax

Apple Silicon（M1/M2）支持

快速入门

如何导航文档

贡献

热门任务 & 流水线

使用 🧨 Diffusers 的热门库

鸣谢

引用

项目详情

已验证详情

维护者

未验证详情

项目链接

元数据

分类器

发布历史 发布通知 | RSS 源

下载文件

源分发

构建分发

发布历史发布通知 | RSS 源