跳转到主要内容

从名字中获取性别。

项目描述

https://travis-ci.org/lead-ratings/gender-guesser.svg?branch=master

本包使用了Jorg Michael(描述此处)程序“gender”的底层数据。其使用非常简单

>>> import gender_guesser.detector as gender
>>> d = gender.Detector()
>>> print(d.get_gender(u"Bob"))
male
>>> print(d.get_gender(u"Sally"))
female
>>> print(d.get_gender(u"Pauley")) # should be androgynous
andy

结果将为未知(找不到名字)、andy(中性)、男性、女性、大部分男性或大部分女性之一。andy和unknown之间的区别在于前者发现其成为男性与成为女性的概率相同,而后者表示该名字未在数据库中找到。

完全支持I18N

>>> print(d.get_gender(u"\xc1lfr\xfan"))  # u"Álfrún"
female

此外,您可以优先考虑特定国家

>>> print(d.get_gender(u"Jamie"))
mostly_female
>>> print(d.get_gender(u"Jamie", u'great_britain'))
mostly_male

此外,您可以创建一个不区分大小写的检测器(默认是区分大小写的)

>>> d = gender.Detector(case_sensitive=False)
>>> print(d.get_gender(u"sally"))
female
>>> print(d.get_gender(u"Sally"))
female

尽量避免创建多个Detectors,因为每个创建都需要读取数据文件。

许可证

生成器代码以GPLv3许可证分发。数据文件nam_dict.txt以GNU自由文档许可证发布。

变更日志

0.3.0 (2016-07-02)

  • 删除了unknown_value初始化选项,因为它可以通过包装器轻松实现。

  • 当名字找不到时返回unknown,当它对男性和女性都有效时返回andy。

  • 将README示例作为doctests测试。

  • 修复了在将数据文件转换为UTF-8后由于行长度变化导致的非iso886-15名称的性别检测错误。参见#gh2。感谢@miquelcamprodon。

0.2.0 (2015-12-06)

  • 将线插入 tox 以在 Python 2 和 Python 3 中进行测试。

  • Python 2 和 3 兼容性。

  • 删除过时的字符映射代码。

有关早期版本,请参阅 sexmachine

鸣谢

这是由 Ferhat Elmas 开发的 SexMachine 包的一个分支。它被创建出来,以便能够发布一个兼容 Python 3 的版本到 PyPI,并且能够在不打扰原作者的情况下添加一些改进。

项目详情


下载文件

下载适用于您平台的文件。如果您不确定选择哪个,请了解有关 安装包 的更多信息。

源代码分发

gender-guesser-0.4.0.tar.gz (337.2 kB 查看哈希值)

上传时间 源代码

构建分发

gender_guesser-0.4.0-py2.py3-none-any.whl (379.3 kB 查看哈希值)

上传时间 Python 2 Python 3

由以下支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误记录 StatusPage StatusPage 状态页面