跳转到主要内容

罗马字转换器

项目描述

Open in Streamlit Current PyPI packages

cutlet

cutlet by Irasutoya

Cutlet是一个将日语转换为罗马字的工具。查看交互式演示!还可以查看文档原始博客文章

无需用英语编写问题。

功能

  • 支持修改后的HepburnKunreisikiNihonsiki系统
  • 为个别映射自定义覆盖
  • 为特定单词自定义覆盖
  • 内置异常列表(东京,大阪等)
  • 当UniDic中有外国拼写时使用外国拼写
  • 专有名词首字母大写
  • URL生成使用的slug模式

不支持的功能

  • 传统的Hepburn n-to-m:新桥
  • 重音符号或倒置符号:东京,东京
  • 护照Hepburn:佐藤(但你可以使用异常)
  • 连字符单词
  • 通常不支持传统的Hepburn

内部,cutlet使用fugashi,因此你可以使用与正常分词相同的字典。

安装

Cutlet可以通过pip常规安装。

pip install cutlet

请注意,如果您没有安装MeCab字典,您也必须安装一个。如果您是刚开始,unidic-lite是一个不错的选择。

pip install unidic-lite

使用方法

包含了一个命令行脚本来进行快速测试。只需使用cutlet,标准输入的每一行将被视为一个句子。您可以指定要使用的系统(hepburnkunreinipponnihon)作为第一个参数。

$ cutlet
ローマ字変換プログラム作ってみた。
Roma ji henkan program tsukutte mita.

在代码中

import cutlet
katsu = cutlet.Cutlet()
katsu.romaji("カツカレーは美味しい")
# => 'Cutlet curry wa oishii'

# you can print a slug suitable for urls
katsu.slug("カツカレーは美味しい")
# => 'cutlet-curry-wa-oishii'

# You can disable using foreign spelling too
katsu.use_foreign_spelling = False
katsu.romaji("カツカレーは美味しい")
# => 'Katsu karee wa oishii'

# kunreisiki, nihonsiki work too
katu = cutlet.Cutlet('kunrei')
katu.romaji("富士山")
# => 'Huzi yama'

# comparison
nkatu = cutlet.Cutlet('nihon')

sent = "彼女は王への手紙を読み上げた。"
katsu.romaji(sent)
# => 'Kanojo wa ou e no tegami wo yomiageta.'
katu.romaji(sent)
# => 'Kanozyo wa ou e no tegami o yomiageta.'
nkatu.romaji(sent)
# => 'Kanozyo ha ou he no tegami wo yomiageta.'

替代品

  • kakasi:历史重要,但自2014年以来没有更新。
  • pykakasi:自包含,它自己进行分词并使用自己的字典。
  • kuroshiro:基于JavaScript。
  • kana:基于Go。

项目详情


下载文件

下载适合您平台的应用程序文件。如果您不确定选择哪一个,请了解有关安装包的更多信息。

源分布

cutlet-0.4.0.tar.gz (412.3 kB 查看哈希值)

上传时间

由以下支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页