Pandas DataFrame的自然语言处理支持。
项目描述
Pandas DataFrame的自然语言处理支持。
Pandas Text Extensions添加了扩展类型到Pandas DataFrame,用于表示自然语言数据,以及一个用于处理这些扩展类型的函数库。
功能
SpanArray:用于文本span的Pandas扩展类型
- 将功能与文档的特定区域连接
- 可视化NLP应用程序的内部数据
- 分析模型准确性
- 组合多个模型的输出
TensorArray:用于张量的Pandas扩展类型
- 在Pandas序列中表示BERT嵌入
- 将logits和其他特征向量存储在Pandas序列中
- 将整个时间序列存储在Pandas序列的每个单元格中
Pandas的前端用于流行的NLP工具包
文档
有关如何使用库的示例,请参阅此目录中的notebooks。
API文档可在https://text-extensions-for-pandas.readthedocs.io/en/latest/找到。
源代码
Text Extensions for Pandas 的源代码可在以下位置获取:https://github.com/CODAIT/text-extensions-for-pandas。
我们欢迎代码和文档的贡献!有关贡献信息,请参阅README 文件。
项目详情
下载文件
下载适用于您平台的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。
源分发
text_extensions_for_pandas-0.2.1.tar.gz (165.1 kB 查看哈希)
构建分发
关闭
text_extensions_for_pandas-0.2.1.tar.gz 的哈希
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 3726eb3bb086e8a404cdd3aa6998418bbbf7bc1e7186b56c73ee4af8c592f27d |
|
MD5 | 193d73e7b4ab3a4b1d35cff64bcc62f0 |
|
BLAKE2b-256 | a98fdcfe2783c8e5d7fc369272ddeed805e7bc5e5dcbf021366d5261ac1cad7d |
关闭
text_extensions_for_pandas-0.2.1-py3-none-any.whl 的哈希
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 1bed2efb03d3e780dc2f903100a5c5d452e9605fc205a7b9cd916c5735275281 |
|
MD5 | bb7127bdd6696814190658c386a814d1 |
|
BLAKE2b-256 | 4843dfeeb996c414dbe11e02b5d7dc8d4f3b2e1567279f12b1c4986af7a05278 |