从纽约州SPARCS数据中地理编码地址
项目描述
geocode_sparcs 是一个程序,用于从纽约州 州级规划和研究合作系统(SPARCS) 中地理编码健康数据,使用本地安装的 Pelias。它也可能作为其他地区和数据集的 Pelias 包装程序有用,但至少目前,重点是 SPARCS。程序实现的多种回退逻辑和字符串处理是为了专门提高 SPARCS 的性能。
使用 pip 命令 pip install geocode_sparcs 安装 geocode_sparcs。Python 依赖项会自动安装,但您需要按照 Pelias on Docker 的说明设置 Pelias。您可以使用 提供的 Pelias 项目目录;只需确保将 DATA_DIR 在 .env 中设置为存储所有数据的路径。使用此配置设置 Pelias 可能需要几个小时的下载数据和处理。
一旦Pelias启动,您可以使用命令 python3 -m geocode_sparcs 进行地理编码,通过标准输入传递要地理编码的地址。每个地址应是一个单独的行上的JSON对象(按JSON Lines),包含键 line1、city 和 zip。值应全部为字符串(即使是 zip),并假定它们来自 SPARCS_LOCATION 文件中的列 PAT_ADDR_LINE1、PAT_ADDR_CITY 和 PAT_ADDR_ZIP5;还假定您已检查每个案例的 PAT_ADDR_ST 是否等于 NY。以下是一个示例(地址实际上不是来自SPARCS,因为那是受保护的医疗信息)
$ echo '{"line1": "405 East 42nd St", "city": "New York", "zip": "10017"}' >>input.txt $ echo '{"line1": "351 Northern Blvd", "city": "Albany", "zip": "12204"}' >>input.txt $ python3 -m geocode_sparcs <input.txt
输出也是JSON Lines格式。默认情况下,每个输入的第一个 features 结果直接从Pelias返回,不进行进一步处理。有关命令行选项,请参阅 python3 -m geocode_sparcs --help。
项目详情
geocode_sparcs-0.2.1.tar.gz的散列
算法 | 散列摘要 | |
---|---|---|
SHA256 | 7edc08cb343f53df599c54f3785afcbf796cf69793de148904f671fcae310553 |
|
MD5 | 0651e5f8ceb04d9436555357e3208ffa |
|
BLAKE2b-256 | 3e5157e87800443dd90b810ae0e0407245e9a12c10c2389ede0e78dee5d40fa8 |