从命令行存档推文
项目描述
twarc
twarc是一个通过Twitter API收集和存档Twitter JSON数据的命令行工具和Python库。它为处理较老的v1.1 API和较新的v2 API及学术访问(分别)提供了独立的命令(twarc和twarc2)。它还拥有一个用于处理收集到的数据的插件生态系统。
请参阅twarc
文档以运行命令:使用v1.1 API的twarc2和twarc1。如果您不确定使用哪一个,建议从twarc2开始,因为v1.1 API计划退役。
安装
如果您已安装Python,您可以从终端(如“开始”菜单中可用的Windows命令提示符或OSX终端应用程序)安装twarc。
pip3 install twarc
安装完成后,您应该能够使用twarc和twarc2命令行工具,或者将其作为Python库使用 - 请参阅此处的示例。
其他工具
Twarc专门为处理Twitter API进行存档和研究数字痕迹数据而构建。它不是一个通用的Twitter API库。虽然主要用途是学术,但它同样适用于“标准”v2 API和“高级”v1.1 API。
有关不同语言的通用Twitter库列表,请参阅Twitter文档。对于Python,TwitterAPI和tweepy都是最新版本且维护良好。它们也支持v2 API,并且与expansions一起使用的数据格式可能不同于twarc。Twitter还提供v2学术访问搜索和v1.1高级搜索的参考实现,具体可在此处找到。此脚本的v2版本与twarc兼容。
对于R语言,有academictwitteR。与twarc不同,它专注于查询Twitter学术研究产品v2 API端点。如果您使用twarc-csv将数据导出为CSV格式,twarc收集的数据可以导入到R中作为数据框进行分析。
获取帮助
查看教程开始使用,或跟随介绍twarc的录制流。您还可以在资源中找到其他链接。如果您遇到问题,请自由地在Twarc仓库或Twitter开发者论坛上发帖。
项目详情
下载文件
下载适用于您平台的文件。如果您不确定选择哪一个,请了解有关安装包的更多信息。