数据构建工具
项目描述
make for your data.
数据操作自动化工具。
灵感来源于Open Refine。
数据构建的一般原则是
低门槛
易于安装
易于理解
可扩展
数据构建可用于以下场景
记录您的infoviz项目中的数据转换
以声明式方式自动化数据处理
安装
安装数据构建
$ pip install databuild
快速入门
有关更多详细信息,请参阅扩展文档。
$ data-build.py buildfile.json
buildfile.yaml 包含要执行的数据操作列表。将其视为电子表格的脚本。
一个构建文件的示例可能是
- operation: sheets.import_data
description: Importing data from csv file
params:
sheet: dataset1
format: csv
filename: dataset1.csv
skip_last_lines: 1
- operation: columns.add_column
description: Calculate the gender ratio
params:
sheet: dataset1
name: Gender Ratio
expression:
language: python
content: "return float(row['Totale Maschi']) / float(row['Totale Femmine'])"
- operation: sheets.export_data
description: save the data
params:
sheet: dataset1
format: csv
filename: dataset2.csv
也支持JSON构建文件。数据构建将根据扩展名猜测类型。
许可协议
在BSD 3条款许可下。