解短Twitter存档中的URL
项目描述
twitter-archive-unshorten
Twitter的存档下载包含了缩短的t.co
URL,而不是您推文中的原始URL。如果Twitter永远消失,t.co
服务器将无法响应用户请求。
twitter-archive-unshorten
是一个小的Python程序,将检查存档下载中的所有JavaScript文件,并将t.co
短URL重写为原始完整URL形式。这意味着在Twitter消失后,您存档的推文的上下文将更有意义。如果您需要查找这些URL,您可以在互联网档案馆中进行查找,如果它们不再可用。如果您只有短URL,这将不可能实现。
安装
$ pip3 install twitter-archive-unshorten
运行
- 解压您的Twitter存档zip文件。
- 打开终端窗口并运行:
twitter-archive-unshorten /path/to/your/archive/directory/
这可能需要一些时间,具体取决于您有多少条推文。完成后,您应该能够打开存档并与其交互,而无需t.co
URL。
使用的短URL到长URL的映射已保存到您的存档目录中的data/shorturls.json
。
测试
如果您想进一步开发,您可以运行现有的测试
$ pip3 install pytest
$ pytest test.py
项目详情
关闭
twitter_archive_unshorten-0.0.10.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 48aebf116b1e8ff57f584d286caa7af38ad33e51ae82a2158588b67f3a807023 |
|
MD5 | e1e9b85811699ea8ecf80726c1a7fb4f |
|
BLAKE2b-256 | 03ae98dd4d1f2ea99a0c9c9ce3b923ed9fdcd8ca6fb86b0dff6f3c5a5ab4f6a3 |
关闭
twitter_archive_unshorten-0.0.10-py3-none-any.whl的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 15d9ed41a76cf60b6a2df67f62a3984d3934da56594b341e0433168c45e0caf3 |
|
MD5 | cd685026601b15081cfdb2fa90fad6b2 |
|
BLAKE2b-256 | 687d6c4cd1d069d8ca1417713f3cbac4ec748137b15a4314af4c6b6ab00ea156 |