HTML中的排版替换
项目描述
Tipi
====
Tipi用于HTML中的排版替换。
状态:激活
--------------
正在积极开发和维护。
.. image:: https://travis-ci.org/honzajavorek/tipi.png?branch=master
:target: https://travis-ci.org/honzajavorek/tipi
.. image:: https://coveralls.io/repos/honzajavorek/tipi/badge.png?branch=master
:target: https://coveralls.io/r/honzajavorek/tipi?branch=master
.. image:: https://pypip.in/v/tipi/badge.png
:target: http://pypi.python.org/pypi/tipi/
.. image:: https://pypip.in/d/tipi/badge.png
:target: http://pypi.python.org/pypi/tipi/
此项目的想法
-------------------------
- 输入是HTML代码,输出是经过排版更改(实体、空格、引号等)的相同HTML代码。
- “你不能用正则表达式解析HTML。<http://stackoverflow.com/a/1732454/325365>”_
- Python中最好的HTML解析器和*标记化器*是`lxml <http://lxml.de/>`_。
- 世界上有比英语更多的语言。每种语言都有不同的排版规则。
安装
------------
简单:
$ pip install tipi
快速入门
----------
tipi的使用非常直接
.. code-block:: python
>>> from tipi import tipi
>>> html = '<p>"Zavolej mi na číslo <strong class="tel">765-876-888</strong>," řekla, a zmizela...</p>'
>>> html = tipi(html, lang='cs')
>>> html
'<p>\u201eZavolej mi na \u010d\xed\xadslo <strong class="tel">765\u2013876\u2013888</strong>,\u201c \u0159ekla, a\xa0zmizela\u2026</p>'
>>> print html
<p>„Zavolej mi na číslo <strong class="tel">765–876–888</strong>,“ řekla, a zmizela…</p>
请注意,tipi是为与HTML一起工作而设计的。如果您需要对纯文本进行替换,请先对其进行转义
.. code-block:: python
>>> fron tipi import tipi
>>> tipi('b -> c') # 这仅是一种巧合!
u'b → c'
>>> tipi('a <- b -> c')
u'a c'
>>> import cgi
>>> html = cgi.escape(u'a <- b -> c')
>>> html
u'a <- b -> c'
>>> tipi(html)
u'a ← b → c'
功能
--------
- 多语言支持。
- 单引号和双引号的语言敏感替换。
- 省略号、破折号、不可中断空格等...
- 箭头(--> 转换为 → )、尺寸(12 × 30)。
- 符号(商标、注册、版权、EUR等)...
替代方案
------------
- `Typogrify <https://github.com/mintchaos/typogrify>`_ - 仅支持英语,在 `smartypants <http://web.chad.org/projects/smartypants.py/>`_ 之上添加样式标记
- `cstypo <https://github.com/yetty/cstypo>`_ - 仅支持捷克语,与HTML结合不佳
计划
-----
- 从 `Typogrify <http://static.mintchaos.com/projects/typogrify/>`_ 中获取灵感?
- 从 `Dero's <http://typografie.dero.name/typografie-entity.php>`_ 和 `Typomil's <http://typomil.com/typografie-na-webu/znakove-entity.htm>`_ 字体指南中获取一些灵感。
- 从 `Liteera.cz <http://www.liteera.cz/>`_) (`源 <https://is.muni.cz/auth/th/172528/fi_b?info=1;zpet=%2Fauth%2Fvyhledavani%2F%3Fsearch%3Djakub%20fiala%26start%3D1>`_).
- 可能也可以从 `这里 <http://www.webtvorba.cz/web/typografie-na-webu.html>`_ 获取一些灵感。
许可证: MIT
------------
© 2013-2014 Jan Javorek <mail@honzajavorek.cz>
本作品许可在 `MIT许可证 <https://en.wikipedia.org/wiki/MIT_License>`_ 下。
====
Tipi用于HTML中的排版替换。
状态:激活
--------------
正在积极开发和维护。
.. image:: https://travis-ci.org/honzajavorek/tipi.png?branch=master
:target: https://travis-ci.org/honzajavorek/tipi
.. image:: https://coveralls.io/repos/honzajavorek/tipi/badge.png?branch=master
:target: https://coveralls.io/r/honzajavorek/tipi?branch=master
.. image:: https://pypip.in/v/tipi/badge.png
:target: http://pypi.python.org/pypi/tipi/
.. image:: https://pypip.in/d/tipi/badge.png
:target: http://pypi.python.org/pypi/tipi/
此项目的想法
-------------------------
- 输入是HTML代码,输出是经过排版更改(实体、空格、引号等)的相同HTML代码。
- “你不能用正则表达式解析HTML。<http://stackoverflow.com/a/1732454/325365>”_
- Python中最好的HTML解析器和*标记化器*是`lxml <http://lxml.de/>`_。
- 世界上有比英语更多的语言。每种语言都有不同的排版规则。
安装
------------
简单:
$ pip install tipi
快速入门
----------
tipi的使用非常直接
.. code-block:: python
>>> from tipi import tipi
>>> html = '<p>"Zavolej mi na číslo <strong class="tel">765-876-888</strong>," řekla, a zmizela...</p>'
>>> html = tipi(html, lang='cs')
>>> html
'<p>\u201eZavolej mi na \u010d\xed\xadslo <strong class="tel">765\u2013876\u2013888</strong>,\u201c \u0159ekla, a\xa0zmizela\u2026</p>'
>>> print html
<p>„Zavolej mi na číslo <strong class="tel">765–876–888</strong>,“ řekla, a zmizela…</p>
请注意,tipi是为与HTML一起工作而设计的。如果您需要对纯文本进行替换,请先对其进行转义
.. code-block:: python
>>> fron tipi import tipi
>>> tipi('b -> c') # 这仅是一种巧合!
u'b → c'
>>> tipi('a <- b -> c')
u'a c'
>>> import cgi
>>> html = cgi.escape(u'a <- b -> c')
>>> html
u'a <- b -> c'
>>> tipi(html)
u'a ← b → c'
功能
--------
- 多语言支持。
- 单引号和双引号的语言敏感替换。
- 省略号、破折号、不可中断空格等...
- 箭头(--> 转换为 → )、尺寸(12 × 30)。
- 符号(商标、注册、版权、EUR等)...
替代方案
------------
- `Typogrify <https://github.com/mintchaos/typogrify>`_ - 仅支持英语,在 `smartypants <http://web.chad.org/projects/smartypants.py/>`_ 之上添加样式标记
- `cstypo <https://github.com/yetty/cstypo>`_ - 仅支持捷克语,与HTML结合不佳
计划
-----
- 从 `Typogrify <http://static.mintchaos.com/projects/typogrify/>`_ 中获取灵感?
- 从 `Dero's <http://typografie.dero.name/typografie-entity.php>`_ 和 `Typomil's <http://typomil.com/typografie-na-webu/znakove-entity.htm>`_ 字体指南中获取一些灵感。
- 从 `Liteera.cz <http://www.liteera.cz/>`_) (`源 <https://is.muni.cz/auth/th/172528/fi_b?info=1;zpet=%2Fauth%2Fvyhledavani%2F%3Fsearch%3Djakub%20fiala%26start%3D1>`_).
- 可能也可以从 `这里 <http://www.webtvorba.cz/web/typografie-na-webu.html>`_ 获取一些灵感。
许可证: MIT
------------
© 2013-2014 Jan Javorek <mail@honzajavorek.cz>
本作品许可在 `MIT许可证 <https://en.wikipedia.org/wiki/MIT_License>`_ 下。
项目详情
关闭
tipi-0.0.4.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | a80a38ad7f8e18321e0456b40a24a82db64d338f7ed2100d10637892ba63cb03 |
|
MD5 | 618c6a534c83ace98a5c07d50b5a23af |
|
BLAKE2b-256 | 53f22e53b18ef06d890f8fdab4bce4ca29c921022e37cd34a45e80fe07b8b14b |