繁体中文和简体中文之间的转换
项目描述
Open Chinese Convert 开放中文转换
介绍
Open Chinese Convert (OpenCC, 开放中文转换) 是一个开源项目,用于繁体中文、简体中文和日本汉字(新字体)之间的转换。它支持字符级和短语级转换,字符变体转换以及中国大陆、台湾和香港之间的地区惯用语转换。这不是普通话和粤语等之间的翻译工具。
中文简繁转换开源项目,支持词汇级别的转换、异体字转换和地区习惯用词转换(中国大陆、台湾、香港、日本新字体)。不提供普通话与粤语等的转换。
讨论(Telegram):https://t.me/open_chinese_convert
特点
- 严格区分“一简对多繁”和“一简对多异”。
- 完全兼容异体字,可以实现动态替换。
- 严格审查一简对多繁词条,原则为“能分则不合”。
- 支持中国大陆、台湾、香港异体字和地区习惯用词转换,如“里”、“里”、“鼠标”、“滑鼠”。
- 词库和函数库完全分离,可以自由修改、导入、扩展。
安装
见 下载。
使用
在线演示 线上转换展示
警告:这不是一个API。如果您以编程方式调用,将会被封禁。
命令行
opencc --helpopencc_dict --helpopencc_phrase_extract --help
Node.js
const OpenCC = require('opencc');
const opencc = new OpenCC('s2t.json');
opencc.convertPromise("汉字").then(converted => {
console.log(converted); // 漢字
});
请参见demo.js。
C++ 文档 文档
https://byvoid.github.io/OpenCC/
其他(非官方)
- Swift (iOS): SwiftyOpenCC
- Java: opencc4j
- Android: android-opencc
- PHP: opencc4php
- Python (重实现): opencc-python
- Python (C++ 绑定): opencc-python
- WebAssembly: wasm-opencc
配置文件 配置文件
默认配置文件
s2t.json简体中文到繁体中文 简体到繁体t2s.json繁体中文到简体中文 繁体到简体s2tw.json简体中文到繁体中文(台湾标准) 简体到台湾正体tw2s.json台湾正体中文到简体中文 臺灣正體到簡體s2hk.json简体中文到繁体中文(香港标准) 简体到香港繁體(香港小學學習字詞表標準)hk2s.json香港繁体中文(香港标准)到简体中文 香港繁體(香港小學學習字詞表標準)到簡體s2twp.json简体中文到繁体中文(台湾标准)并转换为台湾常用词汇 简体到繁體(臺灣正體標準)並轉換爲臺灣常用詞彙tw2sp.json台湾正体中文到简体中文并转换为大陆常用词汇 繁體(臺灣正體標準)到簡體並轉換爲中國大陸常用詞彙t2tw.json繁体中文(OpenCC 标准)到台湾正体中文 繁體(OpenCC 標準)到臺灣正體t2hk.json繁体中文(OpenCC 标准)到香港繁体中文 繁體(OpenCC 標準)到香港繁體(香港小學學習字詞表標準)t2jp.json繁体中文(OpenCC 标准,旧字体)到日文新字體 繁體(OpenCC 標準,舊字體)到日文新字體jp2t.json日文新字體到繁体中文(OpenCC 标准,旧字体) 日文新字體到繁體(OpenCC 標準,舊字體)
编译 编译
使用 CMake 编译
Linux(需要 g++ 4.6)和 Mac OS X(需要 clang 3.2)
make
Windows Visual Studio
cmake -S. -Bbuild -DCMAKE_INSTALL_PREFIX:PATH=.
cmake --build build --config Release --target install
测试 测试
make test
基准测试 基准测试
make benchmark
示例结果(来自 Travis CI)
1: ------------------------------------------------------------------
1: Benchmark Time CPU Iterations
1: ------------------------------------------------------------------
1: BM_Initialization/s2t 27325410 ns 27337754 ns 26
1: BM_Initialization/t2s 1427929 ns 1428890 ns 492
1: BM_Initialization/s2tw 26888809 ns 26900500 ns 26
1: BM_Initialization/s2twp 27286513 ns 27297972 ns 25
1: BM_Initialization/tw2s 1442091 ns 1442939 ns 475
1: BM_Initialization/tw2sp 1737702 ns 1738815 ns 398
1: BM_Initialization/s2hk 27070874 ns 27081523 ns 26
1: BM_Initialization/hk2s 1515165 ns 1516135 ns 466
1: BM_Initialization/t2jp 147005 ns 146864 ns 4850
1: BM_Initialization/jp2t 246554 ns 246479 ns 2859
1: BM_Convert 531 ms 531 ms 1
1/1 Test #1: performance ...................... Passed 11.52 sec
使用 OpenCC 的项目 项目
许可协议 许可协议
Apache License 2.0
第三方库 第三方库
- darts-clone BSD License
- marisa-trie BSD License
- tclap MIT License
- rapidjson MIT License
- Google Test BSD License
所有这些库都是静态链接的。
变更历史 版本历史
链接 相关链接
- 详细介绍 介绍 https://github.com/BYVoid/OpenCC/wiki/%E7%B7%A3%E7%94%B1
- 现代汉语常用简繁一对应义辨析表 http://ytenx.org/byohlyuk/KienxPyan
贡献者 贡献者
- BYVoid
- 佛振
- Peng Huang
- LI Daobing
- Kefu Chai
- Kan-Ru Chen
- Ma Xiaojun
- Jiang Jiang
- Ruey-Cheng Chen
- Paul Meng
- Lawrence Lau
- 瑾昀
- 內木一郎
- Marguerite Su
- Brian White
- Qijiang Fan
- LEOYoon-Tsaw
- Steven Yao
- Pellaeon Lin
- stony
- steelywing
- 吕旭东
- Weng Xuetian
- Ma Tao
- Heinz Wiesinger
- J.W
- Amo Wu
- Mark Tsai
- Zhe Wang
- sgqy
- Qichuan (Sean) ZHANG
- Flandre Scarlet
- 宋辰文
- iwater
- Xpol Wan
- Weihang Lo
- Cychih
- kyleskimo
- Ryuan Choi
- Tony Able
- Xiao Liang
请更新此列表,如果您对 OpenCC 有贡献。
项目详情
关闭
哈希值 for opencc_py-1.1.0-py2.py3-none-manylinux1_x86_64.whl
| 算法 | 哈希摘要 | |
|---|---|---|
| SHA256 | a7f94c5b05268d08ce68a34b616f27e01512204a75dff63ba039de14a4585ccc |
|
| MD5 | 07b88623b426b8b4694e103e5b19159a |
|
| BLAKE2b-256 | e8b9b346c9d06477c13c5018f97358b9299d3266afcb8cd420f6e6bc6b9fa0bc |
关闭
哈希值 for opencc_py-1.1.0-py2.py3-none-macosx_10_9_x86_64.whl
| 算法 | 哈希摘要 | |
|---|---|---|
| SHA256 | bb260f1cf5fb0c89eda5fc61327f2ee2779d4540484c3bc825156f4905f954bb |
|
| MD5 | d3897f5bbd352bcb1091fffdb5a62d27 |
|
| BLAKE2b-256 | 6894dbb0de73f1843d453d63ac2328def6293a17bc712b08c88bcaa014ed70f7 |