跳转到主要内容

音节平假名简单反转库

项目描述

概述

Documentation Status PyPI version https://raw.githubusercontent.com/vshymanskyy/StandWithUkraine/main/badges/StandWithUkraine.svg

pykakasi 是一个Python自然语言处理(NLP)库,用于将平假名、片假名和汉字(日语文本)转写为罗马字(拉丁/罗马字母)。它可以处理NFC形式的字符。

其算法基于用C语言编写的 kakasi 库。

支持的Python版本

  • pykakasi支持Python 3.8、3.9、3.10、3.11、3.12、3.13和pypy3

用法

将日语文本转写为音节、平假名和罗马字

import pykakasi
kks = pykakasi.kakasi()
text = "かな漢字"
result = kks.convert(text)
for item in result:
    print("{}: kana '{}', hiragana '{}', romaji: '{}'".format(item['orig'], item['kana'], item['hira'], item['hepburn']))

かな: kana 'カナ', hiragana: 'かな', romaji: 'kana'
漢字: kana 'カンジ', hiragana: 'かんじ', romaji: 'kanji'

以下是一个输出类似于注音模式的示例。

import pykakasi
kks = pykakasi.kakasi()
text = "かな漢字交じり文"
result = kks.convert(text)
for item in result:
    print("{}[{}] ".format(item['orig'], item['hepburn'].capitalize()), end='')
print()

かな[Kana] 漢字[Kanji] 交じり[Majiri] [Bun]

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。

源代码分发

pykakasi-2.3.0.tar.gz (21.8 MB 查看哈希值)

上传时间 源代码

构建分发

pykakasi-2.3.0-py3-none-any.whl (2.4 MB 查看哈希值)

上传于 Python 3

由以下支持