验证pandas对象,如DataFrame和Series。
项目描述
验证pandas对象,如DataFrame和Series。可以定义类似django表单类的验证器。
为什么在pandas数据整理中会出现bug
当我们使用pandas整理数据时,我们经常使用DataFrame。DataFrame非常强大且易于处理。但是,DataFrame没有其模式,因此它可以接受不规则值而不会意识到这一点。我们被这些值所困惑,并影响了数据整理的结果。
pandas-schema提供了验证DataFrame或Series对象并生成工厂数据的函数。
概述
import pandas as pd
import pandas_validator as pv
class SampleDataFrameValidator(pv.DataFrameValidator):
row_num = 5
column_num = 2
label1 = pv.IntegerColumnValidator('label1', min_value=0, max_value=10)
label2 = pv.FloatColumnValidator('label2', min_value=0, max_value=10)
validator = SampleDataFrameValidator()
df = pd.DataFrame({'label1': [0, 1, 2, 3, 4], 'label2': [5.0, 6.0, 7.0, 8.0, 9.0]})
validator.is_valid(df) # True.
df = pd.DataFrame({'label1': [11, 12, 13, 14, 15], 'label2': [5.0, 6.0, 7.0, 8.0, 9.0]})
validator.is_valid(df) # False.
df = pd.DataFrame({'label1': [0, 1, 2], 'label2': [5.0, 6.0, 7.0]})
validator.is_valid(df) # False
入门指南
要求
支持Python版本:2.7,3.4,3.5,3.6
支持pandas版本:0.18,0.19
安装
$ pip install pandas_validator
用法
请参阅以下由ipython notebook编写的演示。
许可证
本软件根据MIT许可证授权。
资源
变更记录
0.5.0 (2017-01-06)
添加LambdaColumnValidator
添加IndexValidator
.validate(df)方法已弃用。请使用.is_valid(df, raise_exception=True)
0.4.0 (2015-10-28)
热修复:无法包含源文件
0.3.2 (2015-10-28)
支持Python 2.7,3.2,3.3,3.4,3.5
支持pandas 0.14,0.15,0.16,0.17
0.3.1 (2015-10-28)
更新支持的Python版本
更新依赖库版本
0.3.0 (2015-07-15)
关键bug修复
0.2.0 (2015-05-24)
支持字符类型验证
flake8测试
0.1.0 (2015-05-22)
初始版本。
支持整数序列验证器
支持浮点序列验证器
支持DataFrame验证器
在python2.7和python 3.4上测试
0.0.0 (2015-05-17)
创建此项目。
项目详情
下载文件
下载适用于您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。
源代码分发
pandas_validator-0.5.0.tar.gz (7.1 kB 查看哈希值)
构建分发
pandas_validator-0.5.0-py3-none-any.whl (11.1 kB 查看哈希值)