跳转到主要内容

从纽约州SPARCS数据中地理编码地址

项目描述

geocode_sparcs 是一个程序,用于从纽约州 州级规划和研究合作系统(SPARCS) 中地理编码健康数据,使用本地安装的 Pelias。它也可能作为其他地区和数据集的 Pelias 包装程序有用,但至少目前,重点是 SPARCS。程序实现的多种回退逻辑和字符串处理是为了专门提高 SPARCS 的性能。

使用 pip 命令 pip install geocode_sparcs 安装 geocode_sparcs。Python 依赖项会自动安装,但您需要按照 Pelias on Docker 的说明设置 Pelias。您可以使用 提供的 Pelias 项目目录;只需确保将 DATA_DIR.env 中设置为存储所有数据的路径。使用此配置设置 Pelias 可能需要几个小时的下载数据和处理。

一旦Pelias启动,您可以使用命令 python3 -m geocode_sparcs 进行地理编码,通过标准输入传递要地理编码的地址。每个地址应是一个单独的行上的JSON对象(按JSON Lines),包含键 line1cityzip。值应全部为字符串(即使是 zip),并假定它们来自 SPARCS_LOCATION 文件中的列 PAT_ADDR_LINE1PAT_ADDR_CITYPAT_ADDR_ZIP5;还假定您已检查每个案例的 PAT_ADDR_ST 是否等于 NY。以下是一个示例(地址实际上不是来自SPARCS,因为那是受保护的医疗信息)

$ echo '{"line1": "405 East 42nd St", "city": "New York", "zip": "10017"}' >>input.txt
$ echo '{"line1": "351 Northern Blvd", "city": "Albany", "zip": "12204"}' >>input.txt
$ python3 -m geocode_sparcs <input.txt

输出也是JSON Lines格式。默认情况下,每个输入的第一个 features 结果直接从Pelias返回,不进行进一步处理。有关命令行选项,请参阅 python3 -m geocode_sparcs --help

项目详情


下载文件

下载适用于您的平台的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。

源分布

geocode_sparcs-0.2.1.tar.gz (5.6 kB 查看散列)

上传时间