高性能深度学习推理库
项目描述
NVIDIA TensorRT是一个SDK,用于实现高性能机器学习推理。它旨在与TensorFlow、PyTorch和MXNet等训练框架协同工作。它专注于在NVIDIA硬件上快速高效地运行已训练的网络。
重要: 这是TensorRT的特别版本,仅与TensorRT-LLM一起工作。如果您不使用TensorRT-LLM,请勿升级到此版本。
要安装,请执行以下操作
pip install tensorrt --extra-index-url https://pypi.nvidia.com
或将索引URL添加到(空格分隔的)PIP_EXTRA_INDEX_URL环境变量中
export PIP_EXTRA_INDEX_URL='https://pypi.nvidia.com'
pip install tensorrt
如果额外的索引URL不包含https://pypi.nvidia.com
,则将运行带有正确硬编码额外索引URL的嵌套pip install
。