跳转到主要内容

法国广告网站leboncoin.fr的Python爬虫/邮件器

项目描述

这是一个简单的Python爬虫,用于法国广告网站leboncoin.fr,它会给您发送您感兴趣的最新广告。

概述 & 动机

我开发这个小工具有两个原因

  • 懒惰:我不想每天去网站手动搜索东西,

  • 速度:我想快速收到一些广告以便尽快联系卖家。

用法

  • 安装项目

    $ pip install leboncrevard
  • 您可以使用以下环境变量设置配置(必须有一个支持STARTTLS的SMTP服务器,Gmail就可以)

    $ export LBC_SMTP_USER="user"
    $ export LBC_SMTP_PASS="pass"
    $ export LBC_SMTP_SERVER="smtp.gmail.com:587"
    $ export LBC_JOB_FILE="jobs.csv"
    $ export LBC_DELETE_FILE="delete.csv"
  • 填写由LBC_JOB_FILE定义的“作业文件”(请参见下面的语法),默认是jobs.csv

  • 运行应用程序

    $ leboncrevard &>> leboncrevard.log

这两个文件中的条目应如下所示

"Title","http://www.leboncoin.fr/voitures/offres/pays_de_la_loire/occasions/?f=a&th=1&q=fuego",60,your.mail@yourprovider.com

数字字段是您想要在爬虫会话之间设置的时间间隔(以分钟为单位)。您可以添加新条目,脚本会定期解析文件并将它们添加。您还可以通过将作业从“作业文件”移动到“删除文件”来删除作业(删除作业时,忽略间隔和收件人,删除所有实例)。

脚本将创建使用作业名称命名的csv文件,以存储已发送广告的历史记录。

限制和错误

似乎运行得相当好,但我可能没有预见或通过使用触发的错误。请随时打开问题并提交拉取请求。

免责声明

常规事项,我不是专业的Python开发者,这是为我个人使用制作的。请自行承担使用风险。

项目详情


下载文件

下载您平台对应的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。

源代码分发

leboncrevard-0.1.1.tar.gz (5.2 kB 查看哈希值)

上传时间 源代码

支持