跳转到主要内容

从命令行存档推文

项目描述

twarc

twarc是一个通过Twitter API收集和存档Twitter JSON数据的命令行工具和Python库。它为处理较老的v1.1 API和较新的v2 API及学术访问(分别)提供了独立的命令(twarc和twarc2)。它还拥有一个用于处理收集到的数据的插件生态系统。

请参阅twarc文档以运行命令:使用v1.1 API的twarc2twarc1。如果您不确定使用哪一个,建议从twarc2开始,因为v1.1 API计划退役。

安装

如果您已安装Python,您可以从终端(如“开始”菜单中可用的Windows命令提示符或OSX终端应用程序)安装twarc。

pip3 install twarc

安装完成后,您应该能够使用twarc和twarc2命令行工具,或者将其作为Python库使用 - 请参阅此处的示例。

其他工具

Twarc专门为处理Twitter API进行存档和研究数字痕迹数据而构建。它不是一个通用的Twitter API库。虽然主要用途是学术,但它同样适用于“标准”v2 API和“高级”v1.1 API。

有关不同语言的通用Twitter库列表,请参阅Twitter文档。对于Python,TwitterAPItweepy都是最新版本且维护良好。它们也支持v2 API,并且与expansions一起使用的数据格式可能不同于twarc。Twitter还提供v2学术访问搜索v1.1高级搜索的参考实现,具体可在此处找到。此脚本的v2版本与twarc兼容。

对于R语言,有academictwitteR。与twarc不同,它专注于查询Twitter学术研究产品v2 API端点。如果您使用twarc-csv将数据导出为CSV格式,twarc收集的数据可以导入到R中作为数据框进行分析。

获取帮助

查看教程开始使用,或跟随介绍twarc的录制流。您还可以在资源中找到其他链接。如果您遇到问题,请自由地在Twarc仓库Twitter开发者论坛上发帖。

项目详情


发布历史 发布通知 | RSS源

下载文件

下载适用于您平台的文件。如果您不确定选择哪一个,请了解有关安装包的更多信息。

源分发

twarc-2.14.0.tar.gz (57.8 kB 查看散列值)

上传时间

构建分发

twarc-2.14.0-py3-none-any.whl (60.2 kB 查看散列值)

上传时间 Python 3

支持者

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页面