10个项目
smart-open
用于流式传输大文件(S3、HDFS、GCS、Azure Blob Storage、gzip、bz2...)的实用工具。
gensim
Python快速向量空间建模框架。
csvinsight
大型CSV文件快速简单摘要。
sqlitedict
Python的持久化字典,由sqlite3和pickle支持,线程安全。
bounter
大型数据集的计数器。
koshka
具有自动补全功能的网络上的GNU cat。
datawelder
将大型数据帧连接起来。
pygeons
地理查询变得简单。
kutuzov
从Python源代码中的Sphinx注释中提取类型注解。
gzipi
支持随机访问的gzip文件索引工具。