跳转到主要内容

解短Twitter存档中的URL

项目描述

twitter-archive-unshorten

Twitter的存档下载包含了缩短的t.co URL,而不是您推文中的原始URL。如果Twitter永远消失,t.co服务器将无法响应用户请求。

twitter-archive-unshorten是一个小的Python程序,将检查存档下载中的所有JavaScript文件,并将t.co短URL重写为原始完整URL形式。这意味着在Twitter消失后,您存档的推文的上下文将更有意义。如果您需要查找这些URL,您可以在互联网档案馆中进行查找,如果它们不再可用。如果您只有短URL,这将不可能实现。

安装

$ pip3 install twitter-archive-unshorten

运行

  1. 解压您的Twitter存档zip文件。
  2. 打开终端窗口并运行:twitter-archive-unshorten /path/to/your/archive/directory/

这可能需要一些时间,具体取决于您有多少条推文。完成后,您应该能够打开存档并与其交互,而无需t.co URL。

使用的短URL到长URL的映射已保存到您的存档目录中的data/shorturls.json

测试

如果您想进一步开发,您可以运行现有的测试

$ pip3 install pytest
$ pytest test.py

项目详情


下载文件

下载适合您平台文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源分布

twitter_archive_unshorten-0.0.10.tar.gz (4.5 kB 查看哈希值)

上传时间 源码

构建分发

twitter_archive_unshorten-0.0.10-py3-none-any.whl (5.2 kB 查看哈希值)

上传时间 Python 3

由以下支持