法国广告网站leboncoin.fr的Python爬虫/邮件器
项目描述
这是一个简单的Python爬虫,用于法国广告网站leboncoin.fr,它会给您发送您感兴趣的最新广告。
概述 & 动机
我开发这个小工具有两个原因
懒惰:我不想每天去网站手动搜索东西,
速度:我想快速收到一些广告以便尽快联系卖家。
用法
安装项目
$ pip install leboncrevard
您可以使用以下环境变量设置配置(必须有一个支持STARTTLS的SMTP服务器,Gmail就可以)
$ export LBC_SMTP_USER="user" $ export LBC_SMTP_PASS="pass" $ export LBC_SMTP_SERVER="smtp.gmail.com:587" $ export LBC_JOB_FILE="jobs.csv" $ export LBC_DELETE_FILE="delete.csv"
填写由LBC_JOB_FILE定义的“作业文件”(请参见下面的语法),默认是jobs.csv
运行应用程序
$ leboncrevard &>> leboncrevard.log
这两个文件中的条目应如下所示
"Title","http://www.leboncoin.fr/voitures/offres/pays_de_la_loire/occasions/?f=a&th=1&q=fuego",60,your.mail@yourprovider.com
数字字段是您想要在爬虫会话之间设置的时间间隔(以分钟为单位)。您可以添加新条目,脚本会定期解析文件并将它们添加。您还可以通过将作业从“作业文件”移动到“删除文件”来删除作业(删除作业时,忽略间隔和收件人,删除所有实例)。
脚本将创建使用作业名称命名的csv文件,以存储已发送广告的历史记录。
限制和错误
似乎运行得相当好,但我可能没有预见或通过使用触发的错误。请随时打开问题并提交拉取请求。
免责声明
常规事项,我不是专业的Python开发者,这是为我个人使用制作的。请自行承担使用风险。
项目详情
关闭
leboncrevard-0.1.1.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 44cdaaa43b45fc0513fd3f7c01793f435f544bb84bb1ac88ce99572f235d682f |
|
MD5 | 5973fb4dc4510ed02b8290e4e7d62f91 |
|
BLAKE2b-256 | 5782d922cbae18164cd47a344c9557b24e5b835c8199c8711e8e44db5450002b |