检测乱码字符串。
项目描述
Gibberish Detector
这是基于https://github.com/rrenaud/Gibberish-Detector,并进行了适配,使其成为一个Python3模块。
示例
快速入门:
$ gibberish-detector train examples/big.txt > big.model
$ gibberish-detector detect --model big.model --string "ertrjiloifdfyyoiu"
True
训练大型语料库:
$ gibberish-detector train $(ls examples) > generic.model
交互式检测:
$ gibberish-detector detect --model big.model --interactive
Entering interactive mode. Press ctrl+d to quit.
Input text: superman
False (2.375)
Input text: ertrjiloifdfyyoiu
True (4.154)
安装
pip install gibberish-detector
用法
$ gibberish-detector -h
usage: gibberish-detector [-h] [--version] {train,detect} ...
positional arguments:
{train,detect}
train Trains a model to be used for gibberish detection.
detect Uses a trained model to identify gibberish strings.
optional arguments:
-h, --help show this help message and exit
--version Display version information.
您也可以将其作为导入的模块使用
>>> from gibberish_detector import detector
>>> Detector = detector.create_from_model('big.model')
>>> print(Detector.is_gibberish('ertrjiloifdfyyoiu'))
True
项目详情
下载文件
下载适合您平台的文件。如果您不确定选择哪个,请了解有关安装软件包的更多信息。
源代码分发
gibberish_detector-0.1.1.tar.gz (6.6 kB 查看哈希值)
构建分发
关闭
gibberish_detector-0.1.1.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 26264782f6d16f90ef03b209e255ec50ef6de6d258404b4b4cd468ebc069758c |
|
MD5 | 5530437ec2df968a06ffc87faa82cde0 |
|
BLAKE2b-256 | f624a5c518032bdb704128ee96f26ac20d9bc60ac32bb71bf3af0424ab287ac1 |