繁体中文和简体中文之间的转换
项目描述
Open Chinese Convert 开放中文转换
介绍 介紹
Open Chinese Convert (OpenCC, 开放中文转换) 是一个开源项目,用于繁体中文、简体中文和日本汉字(新字体)之间的转换。它支持字符级和短语级转换、字符变体转换以及中国大陆、台湾和香港之间的地区方言转换。这不是普通话和粤语等之间的翻译工具。
中文简繁转换开源项目,支持词汇级别的转换、异体字转换和地区习惯用词转换(中国大陆、台湾、香港、日本新字体)。不提供普通话与粤语等的转换。
讨论 (Telegram): https://t.me/open_chinese_convert
特点 特點
- 严格区分「一简对多繁」和「一简对多异」。
- 完全兼容异体字,可以实现动态替换。
- 严格审校一简对多繁词条,原则为「能分则不合」。
- 支持中国大陆、台湾、香港异体字和地区习惯用词转换,如「里」「裏」、「鼠标」「滑鼠」。
- 词库和函数库完全分离,可以自由修改、导入、扩展。
安装
包管理器
预编译
使用
在线转换展示
警告:这不是一个API。 如果您以编程方式调用,您将被禁止使用。
Node.js
npm npm install opencc
JavaScript
const OpenCC = require('opencc');
const converter = new OpenCC('s2t.json');
converter.convertPromise("汉字").then(converted => {
console.log(converted); // 漢字
});
TypeScript
import { OpenCC } from 'opencc';
async function main() {
const converter: OpenCC = new OpenCC('s2t.json');
const result: string = await converter.convertPromise('汉字');
console.log(result);
}
请参阅 demo.js 和 ts-demo.ts。
Python
pip install opencc
(Windows, Linux, Mac)
import opencc
converter = opencc.OpenCC('s2t.json')
converter.convert('汉字') # 漢字
C++
#include "opencc.h"
int main() {
const opencc::SimpleConverter converter("s2t.json");
converter.Convert("汉字"); // 漢字
return 0;
}
C
#include "opencc.h"
int main() {
opencc_t opencc = opencc_open("s2t.json");
const char* input = "汉字";
char* converted = opencc_convert_utf8(opencc, input, strlen(input)); // 漢字
opencc_convert_utf8_free(converted);
opencc_close(opencc);
return 0;
}
文档: https://byvoid.github.io/OpenCC/
命令行
opencc --help
opencc_dict --help
opencc_phrase_extract --help
其他(非官方)
- Swift (iOS): SwiftyOpenCC
- iOSOpenCC (pod): iOSOpenCC
- Java: opencc4j
- Android: android-opencc
- PHP: opencc4php
- 纯JavaScript: opencc-js
- WebAssembly: wasm-opencc
- 浏览器插件: opencc-extension
- Go (纯): OpenCC for Go
- Dart (原生资源): opencc-dart
配置文件
默认配置文件
s2t.json
简体到繁体t2s.json
繁体到简体s2tw.json
简体到繁体(台湾标准)tw2s.json
台湾正体到简体s2hk.json
简体到繁体(香港变体)hk2s.json
香港繁体到简体s2twp.json
简体到繁体(台湾标准)并转换台湾常用词汇tw2sp.json
繁体(台湾正体标准)到简体并转换中国大陆常用词汇t2tw.json
繁体(OpenCC 标准)到台湾正体hk2t.json
香港繁体到繁体(OpenCC 标准)t2hk.json
繁体(OpenCC 标准)到香港繁体t2jp.json
繁体(OpenCC 标准,旧字体)到日文新字体jp2t.json
日文新字体到繁体(OpenCC 标准,旧字体)tw2t.json
台湾正体到繁体(OpenCC 标准)
编译
使用CMake编译
Linux & Mac OS X
g++ 4.6+ 或 clang 3.2+ 是必需的。
make
Windows Visual Studio
build.cmd
使用Bazel编译
bazel build //:opencc
bazel test --test_output=all //src/... //data/... //test/...
测试
Linux & Mac OS X
make test
Windows Visual Studio
test.cmd
基准测试
make benchmark
示例结果(来自Github CI)
1: ------------------------------------------------------------------
1: Benchmark Time CPU Iterations
1: ------------------------------------------------------------------
1: BM_Initialization/hk2s 1.56 ms 1.56 ms 442
1: BM_Initialization/hk2t 0.144 ms 0.144 ms 4878
1: BM_Initialization/jp2t 0.260 ms 0.260 ms 2604
1: BM_Initialization/s2hk 23.8 ms 23.8 ms 29
1: BM_Initialization/s2t 25.6 ms 25.6 ms 28
1: BM_Initialization/s2tw 24.0 ms 23.9 ms 30
1: BM_Initialization/s2twp 24.6 ms 24.6 ms 28
1: BM_Initialization/t2hk 0.052 ms 0.052 ms 12897
1: BM_Initialization/t2jp 0.141 ms 0.141 ms 5012
1: BM_Initialization/t2s 1.30 ms 1.30 ms 540
1: BM_Initialization/tw2s 1.39 ms 1.39 ms 529
1: BM_Initialization/tw2sp 1.69 ms 1.69 ms 426
1: BM_Initialization/tw2t 0.089 ms 0.089 ms 7707
1: BM_Convert2M 582 ms 582 ms 1
1: BM_Convert/100 1.07 ms 1.07 ms 636
1: BM_Convert/1000 11.0 ms 11.0 ms 67
1: BM_Convert/10000 113 ms 113 ms 6
1: BM_Convert/100000 1176 ms 1176 ms 1
使用 OpenCC 的项目
如果您使用 OpenCC,请更新。
许可协议
Apache License 2.0
第三方库
- darts-clone BSD许可证
- marisa-trie BSD许可证
- tclap MIT许可证
- rapidjson MIT许可证
- Google Test BSD许可证
所有这些库默认情况下都是静态链接的。
变更历史
相关链接
- 详细介绍 https://github.com/BYVoid/OpenCC/wiki/%E7%B7%A3%E7%94%B1
- 现代汉语常用简繁一對多字義辨析表 http://ytenx.org/byohlyuk/KienxPyan
贡献者
- BYVoid
- 佛振
- 彭黄
- 李道宾
- 柴科付
- 陈冠如
- 马晓军
- 姜姜
- 陈瑞城
- 孟保罗
- 刘子明
- 瑾昀
- 内木一郎
- 苏玛格丽特
- 布莱恩·怀特
- 范奇江
- LEOYoon-Tsaw
- 姚 Steven
- 林佩隆
- stony
- steelywing
- 吕旭东
- 翁雪天
- 马涛
- 海因茨·魏斯inger
- J.W
- 吴阿莫
- 蔡马克
- 王哲
- sgqy
- 张启川(Sean)张
- 弗朗德·斯卡雷特
- 宋晨文
- iwater
- 万Xpol
- 罗伟恒
- 蔡志宏
- 凯尔斯基莫
- 崔瑞元
- Prcuvu
- 托尼·艾布尔
- 梁晓
如果您为OpenCC做出了贡献,请随时更新此列表。
项目详情
关闭
哈希值 for OpenCC-1.1.9-cp312-cp312-manylinux2014_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 1c5d1489bdaf9dc2865f0ea30eb565093253e73c1868d9c19554c8a044b545d4 |
|
MD5 | 24892edc62df89650fc85ec7f8d9b0af |
|
BLAKE2b-256 | 23f0ddd3522a142ebb66b30c7d30509de940979c2fb30a9edbf417fdfc37278d |
关闭
哈希值 for OpenCC-1.1.9-cp312-cp312-macosx_10_9_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 48bc3e37942b91a9cf51f525631792f79378e5332bdba9e10c05f6e7fe9036ca |
|
MD5 | c4a71f80ff58345c9b4feb368921e755 |
|
BLAKE2b-256 | 8c58d1f270e9d329d4f4f7c1963f9700aa9c9d6f0c5042c641005da6369b4c8e |
关闭
哈希值 for OpenCC-1.1.9-cp311-cp311-manylinux2014_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 64994c68796d93cdba42f37e0c073fb8ed6f9d6707232be0ba84f24dc5a36bbb |
|
MD5 | 0330b3723023df66ee4980e27ca8f1ce |
|
BLAKE2b-256 | bb074eef5a5c43221470af3a9e12fce024c5b9451618c4307c7980c2d6e298b3 |
关闭
哈希值 for OpenCC-1.1.9-cp311-cp311-macosx_10_9_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 3fb7c84f7c182cb5208e7bc1c104b817a3ca1a8fe111d4d19816be0d6e1ab396 |
|
MD5 | 485e79ea970d10f03528c7ed8b5d3a80 |
|
BLAKE2b-256 | 648991796feec4bbfd7539a0f773f2c9bc83c0138bcb585d94114099bcfa7bf6 |
关闭
哈希值 for OpenCC-1.1.9-cp310-cp310-manylinux2014_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 92769f9a60301574c73096f9ab8a9060fe0d13a9f8266735d82a2a3a92adbd26 |
|
MD5 | 4eb3c8b8a167552af296f4cb37f141ac |
|
BLAKE2b-256 | 48dd9cf7897483f530a174b626e06d1ff3b0d074541547f84b2e221755311ea6 |
关闭
哈希值 for OpenCC-1.1.9-cp310-cp310-macosx_10_9_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | a33941dd4cb67457e6f44dfe36dddc30a602363a4f6a29b41d79b062b332c094 |
|
MD5 | ed52785174a96e839d25cacc4bd2f682 |
|
BLAKE2b-256 | dfd0e17c4251f7981d5b5f5b6250e6a282170b57fe4a188b8966c1978c16fb5b |
关闭
哈希值 for OpenCC-1.1.9-cp39-cp39-manylinux2014_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 436c43e0855b4f9c9e4fd1191e8ac638e9d9f2c7e2d5753952e6e31aa231d36c |
|
MD5 | 6195a51fea5208915e62a5658ce01fb9 |
|
BLAKE2b-256 | 3d246db1dcee505f0a35974bcfb67e199198081b594358ed54af51c2109d1b6f |
关闭
哈希值 for OpenCC-1.1.9-cp39-cp39-macosx_10_9_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 4d66473405c2e360ef346fe1625f201f3f3c4adbb16d5c1c7749a150ae42d875 |
|
MD5 | 661eb4e9832e457e0f1b4fb34697a6da |
|
BLAKE2b-256 | d0d1561ff2934cefdd61367d5f1c8fade111e943a2636526aac72155815b74db |
关闭
哈希值 for OpenCC-1.1.9-cp38-cp38-manylinux2014_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | c6d5f9756ed08e67de36c53dc4d8f0bdc72889d6f57a8fc4d8b073d99c58d4dc |
|
MD5 | 13b08f898c962dc35cb2980a6b741e1e |
|
BLAKE2b-256 | eae43076b834fa58e6b946b25f0e7079d343776f6c5ab6312a2d722090dce207 |
关闭
哈希值 for OpenCC-1.1.9-cp38-cp38-macosx_10_9_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | f4267b66ed6e656b5d8199f94e9673950ac39d49ebaf0e7927330801f06f038f |
|
MD5 | e154f00b0a76ffd2d884f4d317e9a96a |
|
BLAKE2b-256 | 12957ad360f2d1baa498bceb329c7ab92829409893b2c60f1844b75d2c32b406 |