跳转到主要内容

Jupyter Notebook扩展,通过集成DataTables JS来利用pandas DataFrames。

项目描述

Jupyter DataTables

Jupyter Notebook扩展,通过集成DataTables JS来利用pandas DataFrames。


关于

数据科学家以及许多开发人员每天都会使用 pd.DataFrame 来解释和处理数据。在我的典型工作流程中。常见的流程是显示dataframe,查看数据模式,然后生成多个图表来检查数据的分布,以获得更清晰的视图,也许在表中搜索一些数据等...

如果那些分布图是标准DataFrame的一部分,并且我们能够通过最小努力快速搜索表格,那会怎么样?如果它是默认表示形式呢?

jupyter-datatables使用jupyter-require来绘制表格。


安装

pip install jupyter-datatables

使用

import numpy as np
import pandas as pd

from jupyter_datatables import init_datatables_mode

init_datatables_mode()

就这样,您的默认pandas表示现在将使用Jupyter DataTables!

df = pd.DataFrame(np.abs(np.random.randn(50, 5)), columns=list(string.ascii_uppercase[:5]))

Jupyter Datatables table representation


在大多数情况下,您不需要过多担心数据的大小。Jupyter DataTables 根据置信区间(默认为0.95)和误差范围计算所需的样本大小,并将其向上取整到最高“智能”值。

例如,对于包含100,000个样本的数据,给定0.975的置信区间和0.02的误差范围,Jupyter DataTables会计算需要3044个样本,并将其向上取整到4000

Jupyter Datatables long table sample size

附加说明

样本大小:100,000个中的4,000个


我们也可以轻松处理宽表。

df = pd.DataFrame(np.abs(np.random.randn(50, 20)), columns=list(string.ascii_uppercase[:20]))

Jupyter Datatables wide table representation


从0.3.0版本开始,支持交互式工具提示

Jupyter Datatables wide table representation

还支持自定义索引,包括日期类型

dft = pd.DataFrame({'A': np.random.rand(5),
                    'B': [1, 1, 3, 2, 1],
                    'C': 'This is a very long sentence that should automatically be trimmed',
                    'D': [pd.Timestamp('20010101'), pd.Timestamp('20010102'), pd.Timestamp('20010103'), pd.Timestamp('20010104'), pd.Timestamp('20010105')],
                    'E': pd.Series([1.0] * 5).astype('float32'),
                    'F': [False, True, False, False, True],
                   })

dft.D = dft.D.apply(pd.to_datetime)
dft.set_index('D', inplace=True)

Jupyter Datatables wide table representation



当前状态和未来计划

查看我们的项目板,在那里我们跟踪Jupyter工具的问题和待办事项!


作者:Marek Cermak macermak@redhat.com,@AICoE

项目详情


下载文件

下载您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源代码分发

jupyter-datatables-0.3.9.tar.gz (6.3 MB 查看哈希值)

上传时间 源代码

构建分发

jupyter_datatables-0.3.9-py2.py3-none-any.whl (21.7 kB 查看哈希值)

上传时间 Python 2 Python 3

由...

AWSAWS云计算和安全赞助商DatadogDatadog监控FastlyFastlyCDNGoogleGoogle下载分析MicrosoftMicrosoftPSF赞助商PingdomPingdom监控SentrySentry错误日志StatusPageStatusPage状态页面