Skip to main content
2025 Python Packaging Survey is now live!  Take the survey now

将 html链接, html文件 或 html文本 转换成 epub文件,并自动添加封面.

Project description

html2epub

修改介绍

原项目已经较为成熟 Html2Epub ,此次更改是为了满足自身需求,主要是取消 html string 的清洗:

  • html string 通过 create_chapter_from_string 的参数 strict 控制,False 表示不清洗
  • xml string中如果包含<title>封面</title>或者<title>cover</title>,则应该自动生成 epub 文件的封面
  • 关于替换静态资源,做的改进是图片的名称由uuid改为md5(url)

简介

原项目为python2项目 pypub , 此为python3项目, 并进行了些许修改.

将 html链接, html文件 或 html文本 转换成 epub文件.

tips

关于epub文件的格式可以参考 EPUB - Wikipedia.

快速使用

import html2epub

epub = xml2epub.Epub('My First Epub')
chapter = xml2epub.create_chapter_from_url('https://en.wikipedia.org/wiki/EPUB')
epub.add_chapter(chapter)
epub.create_epub('OUTPUT_DIRECTORY')

参考文献

  1. wcember/pypub: Python library to programatically create epub files.
  2. EPUB - Wikipedia.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page