跳转到主要内容

(B)rowser (O)f (A)rbitrary Data - 一个Python数据浏览器。

项目描述

(B)rowser (O)f (A)rbitrary Data - 一个Python数据浏览器。目标是创建一个简单工具,让科学家/数据挖掘者在一个简单环境中浏览和绘制各种数据源。

它是一个库,也是一组工具。

重点主要放在基于pandas的表格样对象上。

概念

  • uri - boadata试图支持odo URIs

  • 数据对象 - 基本数据类型的包装器(即odo.resource,但带有包装器)

  • 数据树 - 可浏览的,可以包含节点(一些节点可以是数据对象)

  • 数据转换 - 之间不同对象类型

  • 视图 - 数据对象的视觉表示

可执行文件

运行command –help以查看完整选项列表

  • boadescribe <uri> - 显示数据对象的基本信息(在命令行中)

  • boatree <uri> - 列出数据树中的节点

  • boaplot <uri> <colx> <coly> - 两列的散点图(colx,y可以是像x**2, sqrt(y+2*exp(-x))等的表达式)

  • boahist <uri> <col> - 列表的直方图

  • boadata [<uri>] - 带有树的完整GUI

  • boatable <uri> - 显示数据对象的表格表示(GUI)

  • boacat <uri> - 打印数据对象的表格表示(命令行)

  • boaconvert <from+> <to> - 将一个数据源转换为另一个

  • boaview <uri> - 显示包含数据对象所有可用视图的选项卡窗口

状态

  • (慢速)开发中

需求

  • PyQt4(将变为可选/可由PySide/PyQt5替换)

  • pandas

  • numpy

  • numexpr

  • click

  • tabulate

  • blinker(可能将被删除)

  • h5py(可选)

  • sqlalchemy(可选)

  • pyqtgraph(将被删除)

  • matplotlib(将变为可选)

  • bokeh(将作为matplotlib的可选替代方案)

  • seaborn

  • pandas_profiling(可选 - 数据框摘要)

  • datadotworld(可选 - 用于他们的数据集)

  • Python 3.6+

支持的格式和来源

  • 文件系统树

  • HDF5

  • CSV(包括网页链接)

  • 基于SQLAlchemy的SQL(sqlite支持)

  • pydataset数据集

  • seaborn数据集

  • MATLAB .fig文件

  • data.world数据集/表(可以导入pandas数据框)

支持的GUI视图

  • 表格

  • 直方图

  • 散点/线图

  • 文本视图

  • 摘要(来自pandas_profiling)

项目详情


下载文件

下载适用于您的平台的文件。如果您不确定要选择哪个,请了解更多关于安装软件包的信息。

源分布

boadata-0.3.14.tar.gz (44.3 kB 查看散列值

上传时间

支持者

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误记录 StatusPage StatusPage 状态页面