跳转到主要内容

搜索数据表。

项目描述

当我们搜索普通书面文件时,我们将单词输入搜索引擎并得到一页页的单词。

如果我们能将电子表格输入搜索引擎并得到电子表格会怎样?结果顺序将由各种专业统计确定;就像我们使用PageRank来查找相关超文本文档一样,我们可以开发其他帮助我们查找相关电子表格的统计方法。更多信息请点击这里

索引

要索引新的电子表格,运行此命令。

, --index [csv file]

例如,

, --index /home/tlevine/Math Scores 2009 Copy (1).csv \
  http://opendata.comune.bari.it/storage/f/2013-09-02T163858/2012_comune_assessori.csv

索引过程的缓存存储在~/.目录中。

默认情况下,已索引的CSV文件将被跳过;要再次索引相同的CSV文件,请使用--force-f选项。

, --index --force [csv file]

一旦您已经索引了一组CSV文件,您就可以搜索了。

, [csv file]

您将看到一系列数据表作为结果。

$ , 'Math Scores 2009.csv'
/home/tlevine/math-scores-2010-gender.csv
/home/tlevine/Math Scores 2009.csv
/home/tlevine/Math Scores 2009 Copy (1).csv
/home/tlevine/math-scores-2009-ethnicity.csv
http://opendata.comune.bari.it/storage/f/2013-09-02T163858/2012_comune_assessori.csv
mysql://bob:password@localhost/schools

待办事项

  • 添加非精确列匹配,以便可以进行更多匹配。

  • 存储值的分布(collections.Counter对象)而不是仅存储不同的值(set对象),以便我可以运行更有趣的比较。

  • 在数据库中存储表的预览或将它从缓存中加载,以便网页界面可以显示预览。

项目详情


下载文件

下载适合您平台的文件。如果您不确定该选择哪个,请了解更多关于安装包的信息。

源代码分发

commasearch-0.0.3.tar.gz (5.2 kB 查看哈希值)

上传时间 源代码

由以下组织支持