未提供项目描述
项目描述
plateau
平坦文件,平坦土地
plateau
是一个Python库,用于管理(创建、读取、更新、删除)大量表格数据。它将数据存储为数据集,并以pandas DataFrame的形式向用户呈现。数据集是一组具有相同模式的文件集合,位于blob存储中。plateau使用元数据定义来有效地处理这些数据集。为了分布式访问和处理数据集,plateau提供了一个 Dask 接口。
将分布在不同文件中的数据存储在blob存储(S3、ABS、GCS等)中,允许快速、成本效益和高度可扩展的数据基础设施。仅将数据存储在对象存储中的缺点是存储本身提供的保证很少,甚至没有,超出了单个文件的一致性。特别是,它们无法保证数据集的一致性。如果我们要求数据集始终保持一致状态,我们需要跟踪数据集的状态。plateau使我们免于手动执行此操作。
plateau.io
模块提供了创建和修改这些数据集的构建块。plateau处理I/O,跟踪数据集分区并透明地选择数据子集。
安装
最新发布版本的安装程序可在Python软件包索引和conda-forge上找到。
# Install with pip
pip install plateau
# Install with conda/micromamba, optionally add conda-forge as a source
# conda config --add channels conda-forge
conda install plateau
micromamba install plateau
项目详情
下载文件
下载适合您平台的文件。如果您不确定该选择哪个,请了解更多关于安装软件包的信息。
源代码分发
plateau-4.4.0.tar.gz (857.1 kB 查看哈希值)
构建分发
plateau-4.4.0-py3-none-any.whl (136.3 kB 查看哈希值)
关闭
plateau-4.4.0.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 75aac62514720a68abd0cc8a5581f93b04ecaccafd5e85f099a2fe6837bcb232 |
|
MD5 | 9116f1f4260ab793ad2c2b640b6cc956 |
|
BLAKE2b-256 | 7b6567aff418f22a569845ec879e059c358314fd0b5f186326ff7ea45c4e47f4 |
关闭
plateau-4.4.0-py3-none-any.whl的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 7d42f70f39171e5015ac06ff840e1bd874cd0ce23aa99bdd063973217c6fdb69 |
|
MD5 | f7ca413e736b2773eebb0df7d52443a7 |
|
BLAKE2b-256 | 1b0dde9712827436783a8d6cef0c0a1221e502b8f214fab9f9ca296702ea1ff4 |