EEK,一个[网络]蜘蛛。
项目描述
EEK是一个以CSV格式输出网站元数据的网络爬虫。
安装
$ pip install eek
使用
用法:eek [-h] [–graph] [–delay SECONDS] [–grep PATTERN] [-i] URL
eek递归地爬取网站,并以CSV格式输出每个页面的元数据。
positional arguments: URL The base URL to start the crawl optional arguments: -h, --help show this help message and exit --graph output a graphviz digraph of links instead of CSV metadata --delay SECONDS Time, in seconds, to wait in between fetches. Defaults to 0. --grep PATTERN Print urls containing PATTERN (a python regular expression). -i, --ignore-case Ignore case. Only valid with --grep
示例
eek http://example.com/
要将输出保存到文件,请使用重定向
eek http://example.com/ > ~/some_file.csv
要减慢爬取速度,请使用--delay=[seconds]
项目详情
关闭
eek-1.0.2.tar.gz的散列
算法 | 散列摘要 | |
---|---|---|
SHA256 | 6e8532e0fbbdbf555c4ac7589d10bad78351d9ea9f8e421004997c3cb7dce198 |
|
MD5 | 4d0a795c358e3269b5add8613bb8e020 |
|
BLAKE2b-256 | 77a5fb62b6a3d85972018ebef8525016634a8559a7af5094a3c2186c27926ee1 |