(B)rowser (O)f (A)rbitrary Data - 一个Python数据浏览器。
项目描述
(B)rowser (O)f (A)rbitrary Data - 一个Python数据浏览器。目标是创建一个简单工具,让科学家/数据挖掘者在一个简单环境中浏览和绘制各种数据源。
它是一个库,也是一组工具。
重点主要放在基于pandas的表格样对象上。
概念
uri - boadata试图支持odo URIs
数据对象 - 基本数据类型的包装器(即odo.resource,但带有包装器)
数据树 - 可浏览的,可以包含节点(一些节点可以是数据对象)
数据转换 - 之间不同对象类型
视图 - 数据对象的视觉表示
可执行文件
运行command –help以查看完整选项列表
boadescribe <uri> - 显示数据对象的基本信息(在命令行中)
boatree <uri> - 列出数据树中的节点
boaplot <uri> <colx> <coly> - 两列的散点图(colx,y可以是像x**2, sqrt(y+2*exp(-x))等的表达式)
boahist <uri> <col> - 列表的直方图
boadata [<uri>] - 带有树的完整GUI
boatable <uri> - 显示数据对象的表格表示(GUI)
boacat <uri> - 打印数据对象的表格表示(命令行)
boaconvert <from+> <to> - 将一个数据源转换为另一个
boaview <uri> - 显示包含数据对象所有可用视图的选项卡窗口
状态
(慢速)开发中
需求
PyQt4(将变为可选/可由PySide/PyQt5替换)
pandas
numpy
numexpr
click
tabulate
blinker(可能将被删除)
h5py(可选)
sqlalchemy(可选)
pyqtgraph(将被删除)
matplotlib(将变为可选)
bokeh(将作为matplotlib的可选替代方案)
seaborn
pandas_profiling(可选 - 数据框摘要)
datadotworld(可选 - 用于他们的数据集)
Python 3.6+
支持的格式和来源
文件系统树
HDF5
CSV(包括网页链接)
基于SQLAlchemy的SQL(sqlite支持)
pydataset数据集
seaborn数据集
MATLAB .fig文件
data.world数据集/表(可以导入pandas数据框)
支持的GUI视图
表格
直方图
散点/线图
文本视图
摘要(来自pandas_profiling)
项目详情
boadata-0.3.14.tar.gz的散列值
算法 | 散列摘要 | |
---|---|---|
SHA256 | 5e05647c8cefe2ab078cad37086b3afb47e731c36285fe7b1cff807fb0e6a8ab |
|
MD5 | 6105878e05cf4ba9b01612e2e668c4b2 |
|
BLAKE2b-256 | 52262d7487a380b65724a61c4abd300a2d191b0759debdb17de12a3538f208e9 |