跳转到主要内容

NVIDIA cuTENSOR

项目描述

cuTENSOR 是一个用于张量原语的高性能CUDA库。

主要特性

  • 广泛的混合精度支持

    • FP64输入与FP32计算。

    • FP32输入与FP16、BF16或TF32计算。

    • 复数与实数运算。

    • 共轭(不进行转置)支持。

  • 支持高达64维度的张量。

  • 任意数据布局。

  • 可简单序列化的数据结构。

  • 主要计算例程

    • 直接(即,无转置)张量 contraction。

    • 张量 reduction(包括部分 reduction)。

    • 逐元素张量操作

      • 支持各种激活函数。

      • 任意张量排列。

      • 不同数据类型之间的转换。

文档

请参阅https://docs.nvda.net.cn/cuda/cutensor/index.html以获取 cuTENSOR 文档。

项目详情


下载文件

下载您平台上的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源代码分发

此版本没有可用的源代码分发文件。请参阅生成分发存档的教程。

编译分发

cutensor-1.6.0.3-py3-none-manylinux2014_x86_64.whl (283.8 MB 查看散列)

上传时间 Python 3

cutensor-1.6.0.3-py3-none-manylinux2014_aarch64.whl (214.3 MB 查看散列)

上传时间 Python 3

支持者

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页面