跳转到主要内容

数据构建工具

项目描述

make for your data.

数据操作自动化工具。

灵感来源于Open Refine。

数据构建的一般原则是

  • 低门槛

  • 易于安装

  • 易于理解

  • 可扩展

数据构建可用于以下场景

  • 记录您的infoviz项目中的数据转换

  • 以声明式方式自动化数据处理

安装

安装数据构建

$ pip install databuild

快速入门

有关更多详细信息,请参阅扩展文档

$ data-build.py buildfile.json

buildfile.yaml 包含要执行的数据操作列表。将其视为电子表格的脚本。

一个构建文件的示例可能是

- operation: sheets.import_data
  description: Importing data from csv file
  params:
    sheet: dataset1
    format: csv
    filename: dataset1.csv
    skip_last_lines: 1
- operation: columns.add_column
  description: Calculate the gender ratio
  params:
    sheet: dataset1
    name: Gender Ratio
    expression:
      language: python
      content: "return float(row['Totale Maschi']) / float(row['Totale Femmine'])"
- operation: sheets.export_data
  description: save the data
  params:
    sheet: dataset1
    format: csv
    filename: dataset2.csv

也支持JSON构建文件。数据构建将根据扩展名猜测类型。

许可协议

在BSD 3条款许可下。

项目详情


下载文件

下载适用于您的平台文件。如果您不确定选择哪个,请了解更多关于安装软件包的信息。

源代码发行版

databuild-0.0.10.tar.gz (17.3 kB 查看哈希值)

上传时间:

支持者