跳转到主要内容

使用Open Graph元数据、HTML元数据以及一系列后备方案从HTML页面提取元数据

项目描述

HTMLmetadata

使用Open Graph元数据、HTML元数据以及一系列后备方案从HTML页面提取元数据

灵感来源于 https://metascraper.js.org

安装

pip install htmlmetadata

使用

您可以直接调用模块来使用它。

python -m htmlmetadata http://schema.org/docs/about.html                                                                            
{
  "request": {
    "url": "http://schema.org/docs/about.html"
  },
  "summary": {
    "description": "Schema.org is a set of extensible schemas that enables webmasters to embed\n    structured data on their web pages for use by search engines and other applications.",
    "title": "about page - schema.org",
    "language": "en"
  }
}

或在您的代码中直接使用它。

from htmlmetadata import extract_metadata

data = extract_metadata("http://schema.org/docs/about.html")

项目详情


下载文件

下载适用于您的平台的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。

源分布

htmlmetadata-1.1.zip (8.4 kB 查看哈希值)

上传时间

构建分布

htmlmetadata-1.1-py2.py3-none-any.whl (5.4 kB 查看哈希值)

上传时间 Python 2 Python 3

由以下支持