从名字中获取性别。
项目描述
本包使用了Jorg Michael(描述此处)程序“gender”的底层数据。其使用非常简单
>>> import gender_guesser.detector as gender >>> d = gender.Detector() >>> print(d.get_gender(u"Bob")) male >>> print(d.get_gender(u"Sally")) female >>> print(d.get_gender(u"Pauley")) # should be androgynous andy
结果将为未知(找不到名字)、andy(中性)、男性、女性、大部分男性或大部分女性之一。andy和unknown之间的区别在于前者发现其成为男性与成为女性的概率相同,而后者表示该名字未在数据库中找到。
完全支持I18N
>>> print(d.get_gender(u"\xc1lfr\xfan")) # u"Álfrún" female
此外,您可以优先考虑特定国家
>>> print(d.get_gender(u"Jamie")) mostly_female >>> print(d.get_gender(u"Jamie", u'great_britain')) mostly_male
此外,您可以创建一个不区分大小写的检测器(默认是区分大小写的)
>>> d = gender.Detector(case_sensitive=False) >>> print(d.get_gender(u"sally")) female >>> print(d.get_gender(u"Sally")) female
尽量避免创建多个Detectors,因为每个创建都需要读取数据文件。
许可证
生成器代码以GPLv3许可证分发。数据文件nam_dict.txt以GNU自由文档许可证发布。
变更日志
0.3.0 (2016-07-02)
删除了unknown_value初始化选项,因为它可以通过包装器轻松实现。
当名字找不到时返回unknown,当它对男性和女性都有效时返回andy。
将README示例作为doctests测试。
修复了在将数据文件转换为UTF-8后由于行长度变化导致的非iso886-15名称的性别检测错误。参见#gh2。感谢@miquelcamprodon。
0.2.0 (2015-12-06)
将线插入 tox 以在 Python 2 和 Python 3 中进行测试。
Python 2 和 3 兼容性。
删除过时的字符映射代码。
有关早期版本,请参阅 sexmachine。
鸣谢
这是由 Ferhat Elmas 开发的 SexMachine 包的一个分支。它被创建出来,以便能够发布一个兼容 Python 3 的版本到 PyPI,并且能够在不打扰原作者的情况下添加一些改进。
项目详情
下载文件
下载适用于您平台的文件。如果您不确定选择哪个,请了解有关 安装包 的更多信息。
源代码分发
gender-guesser-0.4.0.tar.gz (337.2 kB 查看哈希值)
构建分发
gender_guesser-0.4.0-py2.py3-none-any.whl (379.3 kB 查看哈希值)
关闭
gender-guesser-0.4.0.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 1591c14592805ca7da06a46d5f7202511f7cb87547049a68dfccbeedb879f31b |
|
MD5 | 32f5cf52eeacf4462cc552c55cf6c031 |
|
BLAKE2b-256 | a8dc69939b7af56b7adf3aa2736771b7c3e7191f7cd36fbc80b0727570c275fa |
关闭
gender-guesser-0.4.0-py2.py3-none-any.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 7cb01ce5d8d43b94573498bc02c959b622872abd399622ca67d1b73ba6e7e222 |
|
MD5 | 9f1e052c464a9583788df7ad901def59 |
|
BLAKE2b-256 | 13fb3f2aac40cd2421e164cab1668e0ca10685fcf896bd6b3671088f8aab356e |