跳转到主要内容

验证pandas对象,如DataFrame和Series。

项目描述

https://travis-ci.org/c-bata/pandas-validator.svg?branch=master https://badge.fury.io/py/pandas_validator.svg Documentation Status

验证pandas对象,如DataFrame和Series。可以定义类似django表单类的验证器。

为什么在pandas数据整理中会出现bug

当我们使用pandas整理数据时,我们经常使用DataFrameDataFrame非常强大且易于处理。但是,DataFrame没有其模式,因此它可以接受不规则值而不会意识到这一点。我们被这些值所困惑,并影响了数据整理的结果。

pandas-schema提供了验证DataFrameSeries对象并生成工厂数据的函数。

概述

import pandas as pd
import pandas_validator as pv

class SampleDataFrameValidator(pv.DataFrameValidator):
    row_num = 5
    column_num = 2
    label1 = pv.IntegerColumnValidator('label1', min_value=0, max_value=10)
    label2 = pv.FloatColumnValidator('label2', min_value=0, max_value=10)

validator = SampleDataFrameValidator()

df = pd.DataFrame({'label1': [0, 1, 2, 3, 4], 'label2': [5.0, 6.0, 7.0, 8.0, 9.0]})
validator.is_valid(df)  # True.

df = pd.DataFrame({'label1': [11, 12, 13, 14, 15], 'label2': [5.0, 6.0, 7.0, 8.0, 9.0]})
validator.is_valid(df)  # False.

df = pd.DataFrame({'label1': [0, 1, 2], 'label2': [5.0, 6.0, 7.0]})
validator.is_valid(df)  # False

入门指南

要求

  • 支持Python版本:2.7,3.4,3.5,3.6

  • 支持pandas版本:0.18,0.19

安装

$ pip install pandas_validator

用法

请参阅以下由ipython notebook编写的演示。

许可证

本软件根据MIT许可证授权。

资源

变更记录

0.5.0 (2017-01-06)

  • 添加LambdaColumnValidator

  • 添加IndexValidator

  • .validate(df)方法已弃用。请使用.is_valid(df, raise_exception=True)

0.4.0 (2015-10-28)

  • 热修复:无法包含源文件

0.3.2 (2015-10-28)

  • 支持Python 2.7,3.2,3.3,3.4,3.5

  • 支持pandas 0.14,0.15,0.16,0.17

0.3.1 (2015-10-28)

  • 更新支持的Python版本

  • 更新依赖库版本

0.3.0 (2015-07-15)

  • 关键bug修复

0.2.0 (2015-05-24)

  • 支持字符类型验证

  • flake8测试

0.1.0 (2015-05-22)

初始版本。

  • 支持整数序列验证器

  • 支持浮点序列验证器

  • 支持DataFrame验证器

  • 在python2.7和python 3.4上测试

0.0.0 (2015-05-17)

创建此项目。

项目详情


下载文件

下载适用于您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源代码分发

pandas_validator-0.5.0.tar.gz (7.1 kB 查看哈希值)

上传时间 源代码

构建分发

pandas_validator-0.5.0-py3-none-any.whl (11.1 kB 查看哈希值)

上传时间 Python 3

支持