onnx-extended · PyPI · Python 包索引

扩展onnx参考实现和onnxruntime支持的算子列表，或在C++中实现更快的版本。

这些详情尚未由PyPI验证

项目链接

项目描述

onnx-extended: onnx和onnxruntime的扩展

https://dev.azure.com/xavierdupre3/onnx-extended/_apis/build/status/sdpython.onnx-extended

https://badge.fury.io/py/onnx-extended.svg

https://img.shields.io/badge/code%20style-black-000000.svg

onnx-extended 扩展了 onnx 参考实现和 onnxruntime 支持的操作符列表，或者使用 C++ 实现更快版本的函数。文档请参阅 onnx-extended。源代码可在 github/onnx-extended 上找到。

使用现有操作符的 C++ 实现

import timeit
import numpy as np
from onnx import TensorProto
from onnx.helper import (
    make_graph,
    make_model,
    make_node,
    make_opsetid,
    make_tensor_value_info,
)
from onnx.reference import ReferenceEvaluator
from onnxruntime import InferenceSession
from onnx_extended.ext_test_case import measure_time
from onnx_extended.reference import CReferenceEvaluator


X = make_tensor_value_info("X", TensorProto.FLOAT, [None, None, None, None])
Y = make_tensor_value_info("Y", TensorProto.FLOAT, [None, None, None, None])
B = make_tensor_value_info("B", TensorProto.FLOAT, [None, None, None, None])
W = make_tensor_value_info("W", TensorProto.FLOAT, [None, None, None, None])
node = make_node(
    "Conv",
    ["X", "W", "B"],
    ["Y"],
    pads=[1, 1, 1, 1],
    dilations=[1, 1],
    strides=[2, 2],
)
graph = make_graph([node], "g", [X, W, B], [Y])
onnx_model = make_model(graph, opset_imports=[make_opsetid("", 16)])

sH, sW = 64, 64
X = np.arange(sW * sH).reshape((1, 1, sH, sW)).astype(np.float32)
W = np.ones((1, 1, 3, 3), dtype=np.float32)
B = np.array([[[[0]]]], dtype=np.float32)

sess1 = ReferenceEvaluator(onnx_model)
sess2 = CReferenceEvaluator(onnx_model)  # 100 times faster

expected = sess1.run(None, {"X": X, "W": W, "B": B})[0]
got = sess2.run(None, {"X": X, "W": W, "B": B})[0]
diff = np.abs(expected - got).max()
print(f"difference: {diff}")

f1 = lambda: sess1.run(None, {"X": X, "W": W, "B": B})[0]
f2 = lambda: sess2.run(None, {"X": X, "W": W, "B": B})[0]
print("onnx:", timeit.timeit(f1, globals=globals(), number=5))
print("onnx-extended:", timeit.timeit(f2, globals=globals(), number=5))

difference: 0.0
onnx: 0.024006774998269975
onnx-extended: 0.0002316169993719086

使用 CUDA、openmp、eigen、onnxruntime 编译

该软件包还包含一些示例，说明如何使用 C++ 函数（pybind11、cython）以及 openmp 和 eigen（带或不带 CUDA）进行编译。它还展示了如何在 C++ 中为 onnxruntime 创建自定义操作符。

在 pypi/onnx-extended 上发布的版本仅适用于 CPU。需要手动编译才能启用使用 CUDA 的代码。如果找到 CUDA，则构建将自动链接 CUDA。如果没有，某些扩展可能不可用。

python setup.py build_ext --inplace
# pip install -e .

可以使用特定的 CUDA 版本

python setup.py build_ext --inplace --cuda-version=11.8
# or (not working yet)
# pip install -e . --config-settings="--cuda-version=11.8"
# pip install -e . --global-option="--cuda-version=11.8"
export USE_CUDA=11.8
pip install -e .

NVTX 可以通过以下命令启用

python setup.py build_ext --inplace --use_nvtx 1
# or (not working yet)
# pip install -e . --config-settings="--use_nvtx=1"
pip install -e . --global-option "--use_nvtx=1"

onnxruntime 的实验性 cython 绑定

Python onnxruntime 软件包依赖于 pybind11 来公开其功能。 onnx-extended 尝试在 onnxruntime 的 C/C++ API 周围构建一个 cython 包装器。cython 依赖于 Python C API，并且比 pybind11 快。当 onnxruntime 用于小型图和张量时，这种差异可能很大。

为 onnxruntime 定制内核

onnxruntime 提供了一个 API，用于为现有或新的 onnx 操作符添加自定义实现。以下是一个 CPU 的示例。

from onnxruntime import InferenceSession, SessionOptions
from onnx_extended.ortops.optim.cpu import get_ort_ext_libs

r = get_ort_ext_libs()
opts = SessionOptions()
if r is not None:
    opts.register_custom_ops_library(r[0])

sess_cus = InferenceSession(
    onx_modified.SerializeToString(), opts, providers=["CPUExecutionProvider"]
)

项目详情

这些详情尚未由PyPI验证

项目链接

发布历史发布通知 | RSS 源

本版本

0.3.0

2024 年 9 月 19 日

0.2.4

2024 年 1 月 3 日

0.2.3

2023 年 10 月 13 日

0.2.2

2023 年 9 月 28 日

0.2.1

2023 年 9 月 25 日

0.2.0

2023 年 9 月 24 日

0.1.0

2023 年 3 月 25 日

下载文件

下载适合您平台的文件。如果您不确定选择哪个，请了解更多关于安装包的信息。

源代码分发

onnx_extended-0.3.0.tar.gz (14.7 MB 查看哈希值)

上传时间 2024 年 9 月 19 日 源代码

构建分发

onnx_extended-0.3.0-cp311-cp311-win_amd64.whl (67.1 MB 查看哈希值)

上传时间 2024 年 9 月 19 日 CPython 3.11 Windows x86-64

onnx_extended-0.3.0-cp311-cp311-manylinux_2_28_x86_64.whl (25.8 MB 查看哈希值)

上传时间 2024 年 9 月 19 日 CPython 3.11 manylinux: glibc 2.28+ x86-64

onnx_extended-0.3.0-cp310-cp310-win_amd64.whl (67.0 MB 查看哈希值)

上传时间 2024 年 9 月 19 日 CPython 3.10 Windows x86-64

onnx_extended-0.3.0-cp310-cp310-manylinux_2_28_x86_64.whl (25.7 MB 查看哈希值)

上传于 2024年9月19日 CPython 3.10 manylinux: glibc 2.28+ x86-64

哈希值为 onnx_extended-0.3.0.tar.gz

onnx_extended-0.3.0.tar.gz 的哈希值
算法	哈希摘要
SHA256	`add7f769b7b5d6590a807ec40a4abdb192ee4e2899222480f5182699fb34bb19`
MD5	`015587a58c5a311292051390e63b0da0`
BLAKE2b-256	`cb7dcd45358a907c8cd6de3db91e8881e1d5915292ffbdf3365705e0e5b48960`

哈希值为 onnx_extended-0.3.0-cp311-cp311-win_amd64.whl

onnx_extended-0.3.0-cp311-cp311-win_amd64.whl 的哈希值
算法	哈希摘要
SHA256	`6c30631cb7b71919e4bd7437ef8fe13215ffbb362ed7883d93af8541f520032f`
MD5	`e67d328d89374fc12fc3dfbf71e51158`
BLAKE2b-256	`1301b9db129a7b9e2b36d7f82648bac2cc633835420c596f4685c591e8faefe4`

哈希值为 onnx_extended-0.3.0-cp311-cp311-manylinux_2_28_x86_64.whl

onnx_extended-0.3.0-cp311-cp311-manylinux_2_28_x86_64.whl 的哈希值
算法	哈希摘要
SHA256	`cc6b0d22fccc6e0657c25d8e11a40f4383ffae88854ca9d0caab043ab03fb6d8`
MD5	`69df873540a5f4949045820c65319c7f`
BLAKE2b-256	`d3c817f8012bb2acbeb350f257ba9b60b1c521d360c8a79c4e07210018c9c55d`

哈希值为 onnx_extended-0.3.0-cp310-cp310-win_amd64.whl

onnx_extended-0.3.0-cp310-cp310-win_amd64.whl 的哈希值
算法	哈希摘要
SHA256	`8ddb75ef99f7fc795be4ab7b717f78dd5455df6c54605865e9dec69799632f3d`
MD5	`76cb02339547e2402c72dc16617de9a1`
BLAKE2b-256	`58112e6738f7529e0056fe3d45cfa53ce701fae2e11f4a96793e3993e9a3d0f8`

哈希值为 onnx_extended-0.3.0-cp310-cp310-manylinux_2_28_x86_64.whl

onnx_extended-0.3.0-cp310-cp310-manylinux_2_28_x86_64.whl 的哈希值
算法	哈希摘要
SHA256	`a4929cf2469bf54e414466bf012ff5b57d6526321682cecde64ce900944ae9d4`
MD5	`e527dc0da4b8639ca736a8dca8e68411`
BLAKE2b-256	`b92d5fc4e338e47513f5c23a867611e984148b5c8be52f349ba1f77381c08e13`

onnx-extended 0.3.0

导航

已验证详情

维护者

未验证详情

项目链接

元数据

分类器

项目描述

onnx-extended: onnx和onnxruntime的扩展

使用现有操作符的 C++ 实现

使用 CUDA、openmp、eigen、onnxruntime 编译

onnxruntime 的实验性 cython 绑定

为 onnxruntime 定制内核

项目详情

已验证详情

维护者

未验证详情

项目链接

元数据

分类器

发布历史发布通知 | RSS 源

下载文件

源代码分发

构建分发

onnx-extended 0.3.0

导航

已验证详情

维护者

未验证详情

项目链接

元数据

分类器

项目描述

onnx-extended: onnx和onnxruntime的扩展

使用现有操作符的 C++ 实现

使用 CUDA、openmp、eigen、onnxruntime 编译

onnxruntime 的实验性 cython 绑定

为 onnxruntime 定制内核

项目详情

已验证详情

维护者

未验证详情

项目链接

元数据

分类器

发布历史 发布通知 | RSS 源

下载文件

源代码分发

构建分发

发布历史发布通知 | RSS 源