音节平假名简单反转库
项目描述
概述
pykakasi 是一个Python自然语言处理(NLP)库,用于将平假名、片假名和汉字(日语文本)转写为罗马字(拉丁/罗马字母)。它可以处理NFC形式的字符。
其算法基于用C语言编写的 kakasi 库。
安装(从 PyPI): pip install pykakasi
安装(从 conda-forge): conda install -c conda-forge pykakasi
支持的Python版本
pykakasi支持Python 3.8、3.9、3.10、3.11、3.12、3.13和pypy3
用法
将日语文本转写为音节、平假名和罗马字
import pykakasi
kks = pykakasi.kakasi()
text = "かな漢字"
result = kks.convert(text)
for item in result:
print("{}: kana '{}', hiragana '{}', romaji: '{}'".format(item['orig'], item['kana'], item['hira'], item['hepburn']))
かな: kana 'カナ', hiragana: 'かな', romaji: 'kana'
漢字: kana 'カンジ', hiragana: 'かんじ', romaji: 'kanji'
以下是一个输出类似于注音模式的示例。
import pykakasi
kks = pykakasi.kakasi()
text = "かな漢字交じり文"
result = kks.convert(text)
for item in result:
print("{}[{}] ".format(item['orig'], item['hepburn'].capitalize()), end='')
print()
かな[Kana] 漢字[Kanji] 交じり[Majiri] 文[Bun]
版权和许可证
- PyKakasi:
版权(C)2010-2024 Hiroshi Miura和贡献者(见AUTHORS)
- KAKASI字典:
版权(C)2010-2021 Hiroshi Miura和贡献者(见AUTHORS)
版权(C)1992 1993 1994 Hironobu Takahashi, Masahiko Sato, Yukiyoshi Kameyama, Miki Inooka, Akihiko Sasaki, Dai Ando, Junichi Okukawa, Katsushi Sato 和 Nobuhiro Yamagishi
- UniDic:
版权(c)2011-2021,UniDic 合作联盟
版权所有。
Unidic 以 GPL2、LGPL2.1 或 3 条款 BSD 许可证之一发布。(见 src/data/unidic/BSD.txt)PyKakasi 以 GPL3+ 许可重新许可 unidic 的一部分。
本程序是自由软件:您可以按照自由软件基金会发布的 GNU 通用公共许可证的条款重新分发和/或修改本程序,许可证版本为 3 或(根据您的选择)任何后续版本。
本程序的分发是基于希望它是有用的,但没有任何保证;甚至没有关于适销性或特定用途适用性的暗示性保证。有关详细信息,请参阅 GNU 通用公共许可证。
您应该已随本程序收到 GNU 通用公共许可证的一份副本。如果没有,请参阅 <https://gnu.ac.cn/licenses/>。
项目详情
下载文件
下载适合您平台的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。