controlnet的辅助模型

这些详情尚未由PyPI验证

项目链接

主页

项目描述

ControlNet辅助模型

这是一个PyPi可安装的包，包含lllyasviel的ControlNet标注器

代码是从https://github.com/lllyasviel/ControlNet/tree/main/annotator中的相应文件夹复制粘贴的，并连接到🤗 Hub。

所有荣誉和版权归https://github.com/lllyasviel 所有。

安装

pip install -U controlnet-aux

为了支持依赖于MMDetection、MMCV和MMPose的DWPose

pip install -U openmim
mim install mmengine
mim install "mmcv>=2.0.1"
mim install "mmdet>=3.1.0"
mim install "mmpose>=1.1.0"

用法

您可以使用处理器类，以下代码可以加载每个辅助模型

import requests
from PIL import Image
from io import BytesIO

from controlnet_aux.processor import Processor

# load image
url = "https://hugging-face.cn/lllyasviel/sd-controlnet-openpose/resolve/main/images/pose.png"

response = requests.get(url)
img = Image.open(BytesIO(response.content)).convert("RGB").resize((512, 512))

# load processor from processor_id
# options are:
# ["canny", "depth_leres", "depth_leres++", "depth_midas", "depth_zoe", "lineart_anime",
#  "lineart_coarse", "lineart_realistic", "mediapipe_face", "mlsd", "normal_bae", "normal_midas",
#  "openpose", "openpose_face", "openpose_faceonly", "openpose_full", "openpose_hand",
#  "scribble_hed, "scribble_pidinet", "shuffle", "softedge_hed", "softedge_hedsafe",
#  "softedge_pidinet", "softedge_pidsafe", "dwpose"]
processor_id = 'scribble_hed'
processor = Processor(processor_id)

processed_image = processor(img, to_pil=True)

可以通过以下方式导入和实例化来单独加载每个模型

from PIL import Image
import requests
from io import BytesIO
from controlnet_aux import HEDdetector, MidasDetector, MLSDdetector, OpenposeDetector, PidiNetDetector, NormalBaeDetector, LineartDetector, LineartAnimeDetector, CannyDetector, ContentShuffleDetector, ZoeDetector, MediapipeFaceDetector, SamDetector, LeresDetector, DWposeDetector

# load image
url = "https://hugging-face.cn/lllyasviel/sd-controlnet-openpose/resolve/main/images/pose.png"

response = requests.get(url)
img = Image.open(BytesIO(response.content)).convert("RGB").resize((512, 512))

# load checkpoints
hed = HEDdetector.from_pretrained("lllyasviel/Annotators")
midas = MidasDetector.from_pretrained("lllyasviel/Annotators")
mlsd = MLSDdetector.from_pretrained("lllyasviel/Annotators")
open_pose = OpenposeDetector.from_pretrained("lllyasviel/Annotators")
pidi = PidiNetDetector.from_pretrained("lllyasviel/Annotators")
normal_bae = NormalBaeDetector.from_pretrained("lllyasviel/Annotators")
lineart = LineartDetector.from_pretrained("lllyasviel/Annotators")
lineart_anime = LineartAnimeDetector.from_pretrained("lllyasviel/Annotators")
zoe = ZoeDetector.from_pretrained("lllyasviel/Annotators")
sam = SamDetector.from_pretrained("ybelkada/segment-anything", subfolder="checkpoints")
mobile_sam = SamDetector.from_pretrained("dhkim2810/MobileSAM", model_type="vit_t", filename="mobile_sam.pt")
leres = LeresDetector.from_pretrained("lllyasviel/Annotators")
teed = TEEDdetector.from_pretrained("fal-ai/teed", filename="5_model.pth")
anyline = AnylineDetector.from_pretrained(
    "TheMistoAI/MistoLine", filename="MTEED.pth", subfolder="Anyline"
)

# specify configs, ckpts and device, or it will be downloaded automatically and use cpu by default
# det_config: ./src/controlnet_aux/dwpose/yolox_config/yolox_l_8xb8-300e_coco.py
# det_ckpt: https://download.openmmlab.com/mmdetection/v2.0/yolox/yolox_l_8x8_300e_coco/yolox_l_8x8_300e_coco_20211126_140236-d3bd2b23.pth
# pose_config: ./src/controlnet_aux/dwpose/dwpose_config/dwpose-l_384x288.py
# pose_ckpt: https://hugging-face.cn/wanghaofan/dw-ll_ucoco_384/resolve/main/dw-ll_ucoco_384.pth
import torch
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
dwpose = DWposeDetector(det_config=det_config, det_ckpt=det_ckpt, pose_config=pose_config, pose_ckpt=pose_ckpt, device=device)

# instantiate
canny = CannyDetector()
content = ContentShuffleDetector()
face_detector = MediapipeFaceDetector()
lineart_standard = LineartStandardDetector()


# process
processed_image_hed = hed(img)
processed_image_midas = midas(img)
processed_image_mlsd = mlsd(img)
processed_image_open_pose = open_pose(img, hand_and_face=True)
processed_image_pidi = pidi(img, safe=True)
processed_image_normal_bae = normal_bae(img)
processed_image_lineart = lineart(img, coarse=True)
processed_image_lineart_anime = lineart_anime(img)
processed_image_zoe = zoe(img)
processed_image_sam = sam(img)
processed_image_leres = leres(img)
processed_image_teed = teed(img, detect_resolution=1024)
processed_image_anyline = anyline(img, detect_resolution=1280)

processed_image_canny = canny(img)
processed_image_content = content(img)
processed_image_mediapipe_face = face_detector(img)
processed_image_dwpose = dwpose(img)
processed_image_lineart_standard = lineart_standard(img, detect_resolution=1024)

图像分辨率

为了保持图像的宽高比，需要使用detect_resolution、image_resolution和图像尺寸的64的倍数。

项目详情

这些详情尚未由PyPI验证

项目链接

主页

发布历史发布通知 | RSS 源

本版本

0.0.9

2024年5月23日

0.0.8

2024年4月12日

0.0.7

2023年9月5日

0.0.6

2023年6月27日

0.0.5

2023年5月26日

0.0.4

2023年5月22日

0.0.3

2023年4月14日

0.0.2

2023年4月11日

0.0.1

2023年3月2日

下载文件

下载您平台对应的文件。如果您不确定该选择哪个，请了解有关安装包的更多信息。

源代码分发

controlnet_aux-0.0.9.tar.gz (208.6 kB 查看哈希值)

上传时间 2024年5月23日 源代码

构建分发

controlnet_aux-0.0.9-py3-none-any.whl (282.4 kB 查看哈希值)

上传时间 2024年5月23日 Python 3

controlnet_aux-0.0.9.tar.gz 的哈希值

controlnet_aux-0.0.9.tar.gz 的哈希值
算法	哈希摘要
SHA256	`6c28352e6fe9b3324d6b1288d94d1c2586c6e2fc9f58df9e47297ea6a86fd560`
MD5	`969f7fb18e88990812f1342174938768`
BLAKE2b-256	`20b6bc4c5dcab45233e07452c8a9d30cd1d30b7c92b5ea96f7ceca8816cd6078`

controlnet_aux-0.0.9-py3-none-any.whl 的哈希值

controlnet_aux-0.0.9-py3-none-any.whl 的哈希值
算法	哈希摘要
SHA256	`c0401e0f1992562889f15865ede34c0e9b7fbc432aed2d19f7de461a524cc9d8`
MD5	`e6b15035c7ae27266480d9ea6ace485c`
BLAKE2b-256	`9a2e3688dea6d9f22ec152fb931c15329c45df4f87078862fadc1fff0064abd4`

controlnet-aux 0.0.9

导航

验证详情

维护者

未经验证的详情

项目链接

元数据

分类器

项目描述

ControlNet辅助模型

安装

用法

图像分辨率

项目详情

验证详情

维护者

未经验证的详情

项目链接

元数据

分类器

发布历史发布通知 | RSS 源

下载文件

源代码分发

构建分发

controlnet-aux 0.0.9

导航

验证详情

维护者

未经验证的详情

项目链接

元数据

分类器

项目描述

ControlNet辅助模型

安装

用法

图像分辨率

项目详情

验证详情

维护者

未经验证的详情

项目链接

元数据

分类器

发布历史 发布通知 | RSS 源

下载文件

源代码分发

构建分发

发布历史发布通知 | RSS 源