创建包含从Hacker News抓取数据的SQLite数据库
项目描述
hacker-news-to-sqlite
创建一个包含从Hacker News获取的数据的SQLite数据库。
如何安装
$ pip install hacker-news-to-sqlite
使用方法
$ hacker-news-to-sqlite user hacker-news.db your-username
Importing items: 37%|███████████ | 845/2297 [05:09<11:02, 2.19it/s]
将您所有的Hacker News提交和评论导入名为hacker-news.db
的SQLite数据库。
$ hacker-news-to-sqlite trees hacker-news.db 22640038 22643218
获取包含任何内容ID的完整评论树。
使用Datasette浏览您的数据
您可以使用Datasette来浏览您的数据。按照以下方式安装Datasette
$ pip install datasette
现在像这样运行它针对您的hacker-news.db
文件
$ datasette hacker-news.db
访问https://localhost:8001/
以搜索和探索您的数据。
您可以使用datasette-render-timestamps和datasette-render-html插件来改进您数据的显示。按照以下方式安装它们
$ pip install datasette-render-timestamps datasette-render-html
现在将以下配置保存到名为metadata.json
的文件中
{
"databases": {
"hacker-news": {
"tables": {
"items": {
"plugins": {
"datasette-render-html": {
"columns": [
"text"
]
},
"datasette-render-timestamps": {
"columns": [
"time"
]
}
}
},
"users": {
"plugins": {
"datasette-render-timestamps": {
"columns": [
"created"
]
}
}
}
}
}
}
}
像这样运行Datasette
$ datasette -m metadata.json hacker-news.db
时间戳列现在将渲染为可读日期,并且您帖子中的任何HTML都将显示为渲染的HTML。
项目详情
关闭
hacker-news-to-sqlite-0.4.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | efcf4290ed2ea216004a2590bebb84954fc667a193301f7eae2eb8d2515769a2 |
|
MD5 | e2003fc212a477d7c63f8a97c05ba9e6 |
|
BLAKE2b-256 | 885882302c7d9e7d29fb5860d778b3d50294bf70d9ff109a562b900700ca4f13 |
关闭
hacker_news_to_sqlite-0.4-py3-none-any.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 779dce2993c8de7fd5f31a3e2f033807f89b0113b0a018410537c711e3c4ab9c |
|
MD5 | 8b334ee510dd9e129423416494f2b895 |
|
BLAKE2b-256 | 89d77c4aab56f27a0d465442f41b27074814bdd6f7b75f6c47fe3f5cb93b9ba1 |