NVIDIA cuTENSOR
项目描述
cuTENSOR 是一个用于张量原语的高性能CUDA库。
主要特性
广泛的混合精度支持
FP64输入与FP32计算。
FP32输入与FP16、BF16或TF32计算。
复数与实数运算。
共轭(不进行转置)支持。
支持高达64维度的张量。
任意数据布局。
可简单序列化的数据结构。
主要计算例程
直接(即,无转置)张量 contraction。
张量 reduction(包括部分 reduction)。
逐元素张量操作
支持各种激活函数。
任意张量排列。
不同数据类型之间的转换。
文档
请参阅https://docs.nvda.net.cn/cuda/cutensor/index.html以获取 cuTENSOR 文档。
项目详情
关闭
散列 for cutensor-1.6.0.3-py3-none-manylinux2014_x86_64.whl
算法 | 散列摘要 | |
---|---|---|
SHA256 | 03aa002df808785f879ca42511d41d61a997946ec553fb208a8c34bcd0ed143a |
|
MD5 | 2c3feb83b64d506392450ebc95ae6f23 |
|
BLAKE2b-256 | b3d774e39dc3c13d6350c609e7b691de69ecc844b4f4723e1f95786f1f19e032 |
关闭
散列 for cutensor-1.6.0.3-py3-none-manylinux2014_aarch64.whl
算法 | 散列摘要 | |
---|---|---|
SHA256 | ab01a8712e9dc064898ba287d9357dcb5c2ba7c052995594492d5919c56d3e44 |
|
MD5 | 4e5c582ef8ef8e6b1cae17c7ffb98de9 |
|
BLAKE2b-256 | a9975bf36d3340fe8ae4e433afba219fde48d5f7cbbe6dbde7312f29c742ef0b |