罗马字转换器
项目描述
cutlet
Cutlet是一个将日语转换为罗马字的工具。查看交互式演示!还可以查看文档和原始博客文章。
无需用英语编写问题。
功能
- 支持修改后的Hepburn,Kunreisiki,Nihonsiki系统
- 为个别映射自定义覆盖
- 为特定单词自定义覆盖
- 内置异常列表(东京,大阪等)
- 当UniDic中有外国拼写时使用外国拼写
- 专有名词首字母大写
- URL生成使用的slug模式
不支持的功能
- 传统的Hepburn n-to-m:新桥
- 重音符号或倒置符号:东京,东京
- 护照Hepburn:佐藤(但你可以使用异常)
- 连字符单词
- 通常不支持传统的Hepburn
内部,cutlet使用fugashi,因此你可以使用与正常分词相同的字典。
安装
Cutlet可以通过pip常规安装。
pip install cutlet
请注意,如果您没有安装MeCab字典,您也必须安装一个。如果您是刚开始,unidic-lite是一个不错的选择。
pip install unidic-lite
使用方法
包含了一个命令行脚本来进行快速测试。只需使用cutlet
,标准输入的每一行将被视为一个句子。您可以指定要使用的系统(hepburn
,kunrei
,nippon
或nihon
)作为第一个参数。
$ cutlet
ローマ字変換プログラム作ってみた。
Roma ji henkan program tsukutte mita.
在代码中
import cutlet
katsu = cutlet.Cutlet()
katsu.romaji("カツカレーは美味しい")
# => 'Cutlet curry wa oishii'
# you can print a slug suitable for urls
katsu.slug("カツカレーは美味しい")
# => 'cutlet-curry-wa-oishii'
# You can disable using foreign spelling too
katsu.use_foreign_spelling = False
katsu.romaji("カツカレーは美味しい")
# => 'Katsu karee wa oishii'
# kunreisiki, nihonsiki work too
katu = cutlet.Cutlet('kunrei')
katu.romaji("富士山")
# => 'Huzi yama'
# comparison
nkatu = cutlet.Cutlet('nihon')
sent = "彼女は王への手紙を読み上げた。"
katsu.romaji(sent)
# => 'Kanojo wa ou e no tegami wo yomiageta.'
katu.romaji(sent)
# => 'Kanozyo wa ou e no tegami o yomiageta.'
nkatu.romaji(sent)
# => 'Kanozyo ha ou he no tegami wo yomiageta.'
替代品
项目详情
关闭
cutlet-0.4.0.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 9abc50b2c36aabc0c863b7a0fd6a3a651dc372e056f0914d83e76ac2612f3626 |
|
MD5 | 05b6bafcf558259e0185f1947a3b177e |
|
BLAKE2b-256 | 618c53a5937d102b6be60ace23565cc845e0c0f91f053c42584e495bb817a0c0 |