跳转到主要内容

Pandas DataFrame的自然语言处理支持。

项目描述

Pandas DataFrame的自然语言处理支持。

Documentation Status

Pandas Text Extensions添加了扩展类型到Pandas DataFrame,用于表示自然语言数据,以及一个用于处理这些扩展类型的函数库。

功能

SpanArray:用于文本span的Pandas扩展类型

  • 将功能与文档的特定区域连接
  • 可视化NLP应用程序的内部数据
  • 分析模型准确性
  • 组合多个模型的输出

TensorArray:用于张量的Pandas扩展类型

  • 在Pandas序列中表示BERT嵌入
  • 将logits和其他特征向量存储在Pandas序列中
  • 将整个时间序列存储在Pandas序列的每个单元格中

Pandas的前端用于流行的NLP工具包

文档

有关如何使用库的示例,请参阅此目录中的notebooks。

API文档可在https://text-extensions-for-pandas.readthedocs.io/en/latest/找到。

源代码

Text Extensions for Pandas 的源代码可在以下位置获取:https://github.com/CODAIT/text-extensions-for-pandas

我们欢迎代码和文档的贡献!有关贡献信息,请参阅README 文件

项目详情


下载文件

下载适用于您平台的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源分发

text_extensions_for_pandas-0.2.1.tar.gz (165.1 kB 查看哈希)

上传时间

构建分发

text_extensions_for_pandas-0.2.1-py3-none-any.whl (201.8 kB 查看哈希)

上传时间 Python 3

由以下支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误记录 StatusPage StatusPage 状态页面