跳转到主要内容

繁体中文和简体中文之间的转换

项目描述

Open Chinese Convert 开放中文转换

Travis AppVeyor Python package

介绍

OpenCC

Open Chinese Convert (OpenCC, 开放中文转换) 是一个开源项目,用于繁体中文、简体中文和日本汉字(新字体)之间的转换。它支持字符级和短语级转换,字符变体转换以及中国大陆、台湾和香港之间的地区惯用语转换。这不是普通话和粤语等之间的翻译工具。

中文简繁转换开源项目,支持词汇级别的转换、异体字转换和地区习惯用词转换(中国大陆、台湾、香港、日本新字体)。不提供普通话与粤语等的转换。

讨论(Telegram):https://t.me/open_chinese_convert

特点

  • 严格区分“一简对多繁”和“一简对多异”。
  • 完全兼容异体字,可以实现动态替换。
  • 严格审查一简对多繁词条,原则为“能分则不合”。
  • 支持中国大陆、台湾、香港异体字和地区习惯用词转换,如“里”、“里”、“鼠标”、“滑鼠”。
  • 词库和函数库完全分离,可以自由修改、导入、扩展。

安装

下载

使用

在线演示 线上转换展示

警告:这不是一个API。如果您以编程方式调用,将会被封禁。

https://opencc.byvoid.com/

命令行

  • opencc --help
  • opencc_dict --help
  • opencc_phrase_extract --help

Node.js

const OpenCC = require('opencc');
const opencc = new OpenCC('s2t.json');
opencc.convertPromise("汉字").then(converted => {
  console.log(converted);  // 漢字
});

请参见demo.js

C++ 文档 文档

https://byvoid.github.io/OpenCC/

其他(非官方)

配置文件 配置文件

默认配置文件

  • s2t.json 简体中文到繁体中文 简体到繁体
  • t2s.json 繁体中文到简体中文 繁体到简体
  • s2tw.json 简体中文到繁体中文(台湾标准) 简体到台湾正体
  • tw2s.json 台湾正体中文到简体中文 臺灣正體到簡體
  • s2hk.json 简体中文到繁体中文(香港标准) 简体到香港繁體(香港小學學習字詞表標準)
  • hk2s.json 香港繁体中文(香港标准)到简体中文 香港繁體(香港小學學習字詞表標準)到簡體
  • s2twp.json 简体中文到繁体中文(台湾标准)并转换为台湾常用词汇 简体到繁體(臺灣正體標準)並轉換爲臺灣常用詞彙
  • tw2sp.json 台湾正体中文到简体中文并转换为大陆常用词汇 繁體(臺灣正體標準)到簡體並轉換爲中國大陸常用詞彙
  • t2tw.json 繁体中文(OpenCC 标准)到台湾正体中文 繁體(OpenCC 標準)到臺灣正體
  • t2hk.json 繁体中文(OpenCC 标准)到香港繁体中文 繁體(OpenCC 標準)到香港繁體(香港小學學習字詞表標準)
  • t2jp.json 繁体中文(OpenCC 标准,旧字体)到日文新字體 繁體(OpenCC 標準,舊字體)到日文新字體
  • jp2t.json 日文新字體到繁体中文(OpenCC 标准,旧字体) 日文新字體到繁體(OpenCC 標準,舊字體)

编译 编译

使用 CMake 编译

Linux(需要 g++ 4.6)和 Mac OS X(需要 clang 3.2)

make

Windows Visual Studio

cmake -S. -Bbuild -DCMAKE_INSTALL_PREFIX:PATH=.
cmake --build build --config Release --target install

测试 测试

make test

基准测试 基准测试

make benchmark

示例结果(来自 Travis CI)

1: ------------------------------------------------------------------
1: Benchmark                        Time             CPU   Iterations
1: ------------------------------------------------------------------
1: BM_Initialization/s2t     27325410 ns     27337754 ns           26
1: BM_Initialization/t2s      1427929 ns      1428890 ns          492
1: BM_Initialization/s2tw    26888809 ns     26900500 ns           26
1: BM_Initialization/s2twp   27286513 ns     27297972 ns           25
1: BM_Initialization/tw2s     1442091 ns      1442939 ns          475
1: BM_Initialization/tw2sp    1737702 ns      1738815 ns          398
1: BM_Initialization/s2hk    27070874 ns     27081523 ns           26
1: BM_Initialization/hk2s     1515165 ns      1516135 ns          466
1: BM_Initialization/t2jp      147005 ns       146864 ns         4850
1: BM_Initialization/jp2t      246554 ns       246479 ns         2859
1: BM_Convert                     531 ms          531 ms            1
1/1 Test #1: performance ......................   Passed   11.52 sec

使用 OpenCC 的项目 项目

许可协议 许可协议

Apache License 2.0

第三方库 第三方库

所有这些库都是静态链接的。

变更历史 版本历史

链接 相关链接

贡献者 贡献者

请更新此列表,如果您对 OpenCC 有贡献。

项目详情


下载文件

下载适用于您的平台的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源代码分发

此版本没有提供源代码分发文件。请参阅生成分发存档的教程

构建分发

opencc_py-1.1.0-py2.py3-none-manylinux1_x86_64.whl (1.3 MB 查看哈希值)

上传时间 Python 2 Python 3

opencc_py-1.1.0-py2.py3-none-macosx_10_9_x86_64.whl (1.1 MB 查看哈希值)

上传时间 Python 2 Python 3 macOS 10.9+ x86-64

由支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误记录 StatusPage StatusPage 状态页面