繁体中文和简体中文之间的转换
项目描述
Open Chinese Convert 开放中文转换
介绍
Open Chinese Convert (OpenCC, 开放中文转换) 是一个开源项目,用于繁体中文、简体中文和日本汉字(新字体)之间的转换。它支持字符级和短语级转换,字符变体转换以及中国大陆、台湾和香港之间的地区惯用语转换。这不是普通话和粤语等之间的翻译工具。
中文简繁转换开源项目,支持词汇级别的转换、异体字转换和地区习惯用词转换(中国大陆、台湾、香港、日本新字体)。不提供普通话与粤语等的转换。
讨论(Telegram):https://t.me/open_chinese_convert
特点
- 严格区分“一简对多繁”和“一简对多异”。
- 完全兼容异体字,可以实现动态替换。
- 严格审查一简对多繁词条,原则为“能分则不合”。
- 支持中国大陆、台湾、香港异体字和地区习惯用词转换,如“里”、“里”、“鼠标”、“滑鼠”。
- 词库和函数库完全分离,可以自由修改、导入、扩展。
安装
见 下载。
使用
在线演示 线上转换展示
警告:这不是一个API。如果您以编程方式调用,将会被封禁。
命令行
opencc --help
opencc_dict --help
opencc_phrase_extract --help
Node.js
const OpenCC = require('opencc');
const opencc = new OpenCC('s2t.json');
opencc.convertPromise("汉字").then(converted => {
console.log(converted); // 漢字
});
请参见demo.js。
C++ 文档 文档
https://byvoid.github.io/OpenCC/
其他(非官方)
- Swift (iOS): SwiftyOpenCC
- Java: opencc4j
- Android: android-opencc
- PHP: opencc4php
- Python (重实现): opencc-python
- Python (C++ 绑定): opencc-python
- WebAssembly: wasm-opencc
配置文件 配置文件
默认配置文件
s2t.json
简体中文到繁体中文 简体到繁体t2s.json
繁体中文到简体中文 繁体到简体s2tw.json
简体中文到繁体中文(台湾标准) 简体到台湾正体tw2s.json
台湾正体中文到简体中文 臺灣正體到簡體s2hk.json
简体中文到繁体中文(香港标准) 简体到香港繁體(香港小學學習字詞表標準)hk2s.json
香港繁体中文(香港标准)到简体中文 香港繁體(香港小學學習字詞表標準)到簡體s2twp.json
简体中文到繁体中文(台湾标准)并转换为台湾常用词汇 简体到繁體(臺灣正體標準)並轉換爲臺灣常用詞彙tw2sp.json
台湾正体中文到简体中文并转换为大陆常用词汇 繁體(臺灣正體標準)到簡體並轉換爲中國大陸常用詞彙t2tw.json
繁体中文(OpenCC 标准)到台湾正体中文 繁體(OpenCC 標準)到臺灣正體t2hk.json
繁体中文(OpenCC 标准)到香港繁体中文 繁體(OpenCC 標準)到香港繁體(香港小學學習字詞表標準)t2jp.json
繁体中文(OpenCC 标准,旧字体)到日文新字體 繁體(OpenCC 標準,舊字體)到日文新字體jp2t.json
日文新字體到繁体中文(OpenCC 标准,旧字体) 日文新字體到繁體(OpenCC 標準,舊字體)
编译 编译
使用 CMake 编译
Linux(需要 g++ 4.6)和 Mac OS X(需要 clang 3.2)
make
Windows Visual Studio
cmake -S. -Bbuild -DCMAKE_INSTALL_PREFIX:PATH=.
cmake --build build --config Release --target install
测试 测试
make test
基准测试 基准测试
make benchmark
示例结果(来自 Travis CI)
1: ------------------------------------------------------------------
1: Benchmark Time CPU Iterations
1: ------------------------------------------------------------------
1: BM_Initialization/s2t 27325410 ns 27337754 ns 26
1: BM_Initialization/t2s 1427929 ns 1428890 ns 492
1: BM_Initialization/s2tw 26888809 ns 26900500 ns 26
1: BM_Initialization/s2twp 27286513 ns 27297972 ns 25
1: BM_Initialization/tw2s 1442091 ns 1442939 ns 475
1: BM_Initialization/tw2sp 1737702 ns 1738815 ns 398
1: BM_Initialization/s2hk 27070874 ns 27081523 ns 26
1: BM_Initialization/hk2s 1515165 ns 1516135 ns 466
1: BM_Initialization/t2jp 147005 ns 146864 ns 4850
1: BM_Initialization/jp2t 246554 ns 246479 ns 2859
1: BM_Convert 531 ms 531 ms 1
1/1 Test #1: performance ...................... Passed 11.52 sec
使用 OpenCC 的项目 项目
许可协议 许可协议
Apache License 2.0
第三方库 第三方库
- darts-clone BSD License
- marisa-trie BSD License
- tclap MIT License
- rapidjson MIT License
- Google Test BSD License
所有这些库都是静态链接的。
变更历史 版本历史
链接 相关链接
- 详细介绍 介绍 https://github.com/BYVoid/OpenCC/wiki/%E7%B7%A3%E7%94%B1
- 现代汉语常用简繁一对应义辨析表 http://ytenx.org/byohlyuk/KienxPyan
贡献者 贡献者
- BYVoid
- 佛振
- Peng Huang
- LI Daobing
- Kefu Chai
- Kan-Ru Chen
- Ma Xiaojun
- Jiang Jiang
- Ruey-Cheng Chen
- Paul Meng
- Lawrence Lau
- 瑾昀
- 內木一郎
- Marguerite Su
- Brian White
- Qijiang Fan
- LEOYoon-Tsaw
- Steven Yao
- Pellaeon Lin
- stony
- steelywing
- 吕旭东
- Weng Xuetian
- Ma Tao
- Heinz Wiesinger
- J.W
- Amo Wu
- Mark Tsai
- Zhe Wang
- sgqy
- Qichuan (Sean) ZHANG
- Flandre Scarlet
- 宋辰文
- iwater
- Xpol Wan
- Weihang Lo
- Cychih
- kyleskimo
- Ryuan Choi
- Tony Able
- Xiao Liang
请更新此列表,如果您对 OpenCC 有贡献。
项目详情
关闭
哈希值 for opencc_py-1.1.0-py2.py3-none-manylinux1_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | a7f94c5b05268d08ce68a34b616f27e01512204a75dff63ba039de14a4585ccc |
|
MD5 | 07b88623b426b8b4694e103e5b19159a |
|
BLAKE2b-256 | e8b9b346c9d06477c13c5018f97358b9299d3266afcb8cd420f6e6bc6b9fa0bc |
关闭
哈希值 for opencc_py-1.1.0-py2.py3-none-macosx_10_9_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | bb260f1cf5fb0c89eda5fc61327f2ee2779d4540484c3bc825156f4905f954bb |
|
MD5 | d3897f5bbd352bcb1091fffdb5a62d27 |
|
BLAKE2b-256 | 6894dbb0de73f1843d453d63ac2328def6293a17bc712b08c88bcaa014ed70f7 |