搜索数据表。
项目描述
当我们搜索普通书面文件时,我们将单词输入搜索引擎并得到一页页的单词。
如果我们能将电子表格输入搜索引擎并得到电子表格会怎样?结果顺序将由各种专业统计确定;就像我们使用PageRank来查找相关超文本文档一样,我们可以开发其他帮助我们查找相关电子表格的统计方法。更多信息请点击这里
索引
要索引新的电子表格,运行此命令。
, --index [csv file]
例如,
, --index /home/tlevine/Math Scores 2009 Copy (1).csv \ http://opendata.comune.bari.it/storage/f/2013-09-02T163858/2012_comune_assessori.csv
索引过程的缓存存储在~/.目录中。
默认情况下,已索引的CSV文件将被跳过;要再次索引相同的CSV文件,请使用--force或-f选项。
, --index --force [csv file]
一旦您已经索引了一组CSV文件,您就可以搜索了。
, [csv file]
您将看到一系列数据表作为结果。
$ , 'Math Scores 2009.csv' /home/tlevine/math-scores-2010-gender.csv /home/tlevine/Math Scores 2009.csv /home/tlevine/Math Scores 2009 Copy (1).csv /home/tlevine/math-scores-2009-ethnicity.csv http://opendata.comune.bari.it/storage/f/2013-09-02T163858/2012_comune_assessori.csv mysql://bob:password@localhost/schools
待办事项
添加非精确列匹配,以便可以进行更多匹配。
存储值的分布(collections.Counter对象)而不是仅存储不同的值(set对象),以便我可以运行更有趣的比较。
在数据库中存储表的预览或将它从缓存中加载,以便网页界面可以显示预览。
项目详情
关闭
commasearch-0.0.3.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 0acbb776bce8a31c5dd55c3f8b79aadff76336778710cf34c3f248872134e4d1 |
|
MD5 | 4381eb40a7ae11e14cab138fddcf6b72 |
|
BLAKE2b-256 | f9a705e44ce79a21031234fc3aff18e2ffcfa62fe996378abe1694c8f9bdbd1c |