读取和写入以StarTable格式存储的数据;并将表数据存储在内存中,作为Pandas数据框架以便于操作。
项目描述
pdtable
Python包`pdtable`提供读取、写入和操作StarTable数据的接口。
文档
pdtable文档可在pdtable.readthedocs.io找到。
示例
演示:查看pdtable_demo笔记本或,如果您不喜欢Jupyter笔记本,还有笔记本的配对脚本。
安装
pdtable可在pypi.org获得
pip install pdtable
和conda-forge
conda install pdtable -c conda-forge
数据和元数据:存储和访问
表格块以 TableDataFrame
对象的形式存储,它继承自 pandas.DataFrame
,但包含额外的、隐藏的元数据。这些隐藏的元数据包含所有不适合经典 Pandas 数据框对象的信息,例如表格目的地、列单位、表格来源等。
可以使用 Pandas API 访问和操作 TableDataFrame
对象,就像操作普通 Pandas 数据框对象一样,具有所有这些便利性。
隐藏在 TableDataFrame
元数据中的 StarTable 特定元数据原则上可以直接访问;然而,提供了一个更直观的接口,即通过一个 Table
面板对象,它是对 TableDataFrame
的轻量级包装。此外,Table
也支持一些有限的数据操作,但更容易支持 StarTable 特定元数据;例如,在添加新列时可以轻松指定列单位。
I/O
提供 CSV 和 Excel 的读取器和写入器,既可以作为文件也可以作为流。解析效率高,默认情况下宽容,但可以轻松定制。
读取也可以在早期进行过滤,以便只解析特定类型的块或具有特定名称的表格。这在仅读取大型文件或流中的少数几个表格时可以显著减少读取时间。
指令块由读取器解析,并向客户端代码提供特定于应用的解释。
还支持从 JSON 导入和导出。
项目详情
下载文件
下载适合您平台的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。