跳转到主要内容

基于Scrapy的具有用户界面的网络爬虫

项目描述

Arachnado

Arachnado是一个用于爬取特定网站的工具。它提供了一个基于Tornado的HTTP API和一个基于Scrapy的爬虫的Web UI。

许可为MIT。

安装

Arachnado需要Python 2.7。要安装Arachnado,请使用pip

pip install arachnado

要安装支持MongoDB的Arachnado,请使用以下命令

pip install arachnado[mongo]

运行

要启动Arachnado,请执行arachnado命令

arachnado

然后访问http://0.0.0.0:8888(或配置的任何URL)。

要查看可用的命令行选项,请使用

arachnado –help

Arachnado可以使用配置文件进行配置。将其放置在常见位置之一(‘/etc/arachnado.conf’,‘~/.config/arachnado.conf’或‘~/.arachnado.conf’)或当启动服务器时传递文件名作为参数

arachnado --config ./my-config.conf

有关可用选项,请参阅https://github.com/TeamHG-Memex/arachnado/blob/master/arachnado/settings/defaults.conf

开发

要构建 Arachnado 静态资产,需要 node.js 和 npm。使用 npm 安装所有 JavaScript 依赖,从代码库根目录运行以下命令:

npm install

然后重新构建静态文件(我们使用 Webpack

npm run build

或在开发期间每次更改时自动构建静态文件

npm run watch

变更

0.2 (2015-08-07)

初始发布。

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。

源代码分发

arachnado-0.2.tar.gz (140.0 kB 查看哈希)

上传时间 源代码

构建分发

arachnado-0.2-py2-none-any.whl (156.3 kB 查看哈希)

上传时间 Python 2