cuDF - GPU Dataframe
项目描述
cuDF - GPU DataFrames
📢 cuDF现在可以作为无需代码更改的pandas加速器!了解更多信息,请参阅这里!
cuDF(发音为“KOO-dee-eff”)是一个用于加载数据、连接、聚合、过滤和其他数据操作的GPU DataFrame库。cuDF利用libcudf,一个快速的C++/CUDA DataFrame库和Apache Arrow列格式,以提供GPU加速的pandas API。
您可以直接导入cudf
并像使用pandas
一样使用它
import cudf
tips_df = cudf.read_csv("https://github.com/plotly/datasets/raw/master/tips.csv")
tips_df["tip_percentage"] = tips_df["tip"] / tips_df["total_bill"] * 100
# display average tip by dining party size
print(tips_df.groupby("size").tip_percentage.mean())
或者,您可以使用cuDF作为无需代码更改的pandas加速器,使用cudf.pandas
。 cudf.pandas
支持100%的pandas API,利用cuDF进行支持的操作,并在需要时回退到pandas
%load_ext cudf.pandas # pandas operations now use the GPU!
import pandas as pd
tips_df = pd.read_csv("https://github.com/plotly/datasets/raw/master/tips.csv")
tips_df["tip_percentage"] = tips_df["tip"] / tips_df["total_bill"] * 100
# display average tip by dining party size
print(tips_df.groupby("size").tip_percentage.mean())
资源
- 立即尝试cudf.pandas:在Google Colab上的免费GPU实例上探索
cudf.pandas
! - 安装:安装cuDF和其他RAPIDS库的说明。
- cudf (Python) 文档
- libcudf (C++/CUDA) 文档
- RAPIDS社区:获取帮助,贡献,并协作。
请参阅RAPIDS安装页面获取有关安装cuDF和其他RAPIDS包的最新信息和命令。
安装
CUDA/GPU要求
- CUDA 11.2+
- NVIDIA驱动程序 450.80.02+
- Volta架构或更高(计算能力 >=7.0)
Pip
cuDF可以通过从NVIDIA Python包索引使用pip
进行安装。请确保根据您环境中可用的CUDA主要版本选择合适的cuDF包
对于CUDA 11.x
pip install --extra-index-url=https://pypi.nvidia.com cudf-cu11
对于CUDA 12.x
pip install --extra-index-url=https://pypi.nvidia.com cudf-cu12
Conda
cuDF可以使用conda(通过miniconda或完整的Anaconda发行版)从rapidsai
通道安装
conda install -c rapidsai -c conda-forge -c nvidia \
cudf=24.08 python=3.11 cuda-version=12.5
我们还提供了从最新开发分支的HEAD构建的夜间Conda包。
注意:cuDF仅支持Linux,以及Python 3.9及以后的版本。
有关更多操作系统和版本信息,请参阅RAPIDS安装指南。
从源码构建/安装
请参阅构建说明。
贡献
请参阅我们关于如何为cuDF做出贡献的指南。
项目详情
关闭
cudf_cu12-24.8.3.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 6cf29cb1e96759c033cef9c06f7b1ecec658cbf517b75c14ac821d2159023e32 |
|
MD5 | 2c29fa91f3fa56eb2d1bb94526ce8ec7 |
|
BLAKE2b-256 | 74c6a3505edfe76cf431e7bcfdcfccfc687064346a8095842d57fe362564f20b |