使用正则表达式基于维基百科的RegExTypoFix修复文本中的错误
项目描述
Topy(“typo”的谐音)是一个Python脚本,用于修复文本中的错误,使用的是维基百科RegExTypoFix项目开发的规则集。Topy包含默认的英文规则集,其他规则集可以手动下载。
Topy与Python 3.6-3.9兼容。
使用pip安装它的最简单方法是
pip install topy
用法
Usage: topy [options] FILES/DIRS... Options: -h, --help show this help message and exit -q, --quiet silence information messages -a, --apply overwrite files in place -r FILE, --rules=FILE specify custom ruleset file to use -d RULE, --disable=RULE disable rules by name --color=WHEN, --colour=WHEN colorize the output; WHEN can be 'never', 'always', or 'auto'
例如,如果您想将topy集成到CI管道中,您可以这样做
sh -c "git ls-files | xargs topy --quiet --apply --; git --no-pager diff --exit-code"
上面的行将检查git跟踪的所有文件,并应用修复。如果应用了任何更改,则命令将失败。如果没有要应用的更改,则命令返回成功。
资源
变更日志
1.1.0 (2021-02-03)
添加了输出颜色。感谢Brian de Buiteach (@debuiteb) (#25)
移除了Python 3.5的支持,以便允许使用更新的语法(#25)
1.0.1 (2021-01-30)
更新了捆绑的规则集(#29)
现在正式支持并测试了Python 3.9(#27)
将测试从travis-ci.org迁移到travis-ci.com(#28)
1.0.0 (2020-09-08)
更新了捆绑的规则集(#23)
移除了Python 2.x和<3.5的兼容性代码 (#22)
修复了Travis CI配置 (#21)
0.3.0 (2020-06-02)
注意:这是最后一个支持Python 2.7的版本。
更新了捆绑的规则集(感谢Oscar Caballero)
添加了–disable选项来禁用单个规则(感谢Oscar Caballero)
修复了替换字符串包含$符号时的行为(感谢Oscar Caballero)
当安装了lxml时,优先使用更快的lxml解析器。lxml现在是一个可选依赖项(感谢Oscar Caballero)
添加了Python 3.7支持,弃用了Python 3.3和3.4。
0.2.2 (2016-12-16)
更新了捆绑的规则集
官方添加Python 3.6支持
0.2.1 (2016-07-15)
更新了捆绑的规则集
更新正则表达式依赖项版本以避免 regex问题#216
官方添加Python 3.5支持
0.2.0 (2015-09-09)
在Python 2中修复了多个与Unicode相关的问题
可以安全地处理无效Unicode的文件名
更新了捆绑的规则集
修复了使用库时的一些警告
0.1.0 (2014-08-24)
首次公开发布
贡献
代码风格
通常遵循Python PEP-8编码风格,除了行长度可以扩展到120个字符。
具有人类意义的字符串使用双引号("),否则使用单引号(')。如有疑问,请勿担心。
代码应与Python 2和3兼容,最好不使用特定版本的条件语句。
使用python setup.py test运行测试套件。
将您的更改作为GitHub上的拉取请求提交。
许可证
Topy软件根据MIT许可证授权(见LICENSE.txt)
捆绑的retf.txt文件,由Wikipedia的贡献者从Wikipedia AutoWikiBrowser/Typos复制,根据CC-BY-SA授权。有关作者信息,请参阅Wikipedia页面。
项目详情
下载文件
下载适用于您平台文件的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。
源分布
构建分布
topy-1.1.0.tar.gz的散列
算法 | 散列摘要 | |
---|---|---|
SHA256 | aa8e40f82dd212d7c739c267cc9c308285759ab556bdb1b6bfb12573d337433d |
|
MD5 | 8b923f349f3f5be1e1b3179893e54de3 |
|
BLAKE2b-256 | 6045c3a61d32a6fd2d0873351a40e52743e634e4d327f2a8e7b662c9d6b4ddf8 |
topy-1.1.0-py3.9.egg的散列
算法 | 散列摘要 | |
---|---|---|
SHA256 | 64541452338a397f678df998d4ae097d35781b96ba2506901851f2b18761a86a |
|
MD5 | 644433634c63f850d6db7452d785114c |
|
BLAKE2b-256 | 2e6214938dcc378fa6240a20ee3cc26f7de3a9066478d0f7dfe85f6f97a6333d |