一个从FIDE网站导出比赛信息的包
项目描述
fideparser
fideparser是一个脚本,用于解析FIDE评分网站并导出有评分的赛事数据。
FIDE(国际象棋联合会或世界象棋联合会)是国际认可的象棋管理机构。每个月世界各地都会举办很多比赛,其中许多都有FIDE评分,并在每月1日发布。
FIDE将所有有评分的象棋赛事评分报告在线发布在http://ratings.fide.com,但它们不提供任何API或自动导出或获取该信息的方式。
因此,此脚本允许您导出所有赛事数据(基于国家和评分周期)到CSV、JSON和基于pickle的内部格式。此脚本不导出每个赛事的选手数据,但导出关于赛事的元数据:名称、开始和结束日期、形式、选手数量、仲裁者和组织者姓名等。
此脚本依赖于屏幕抓取,所以如果FIDE更改HTML,脚本将失效 :S
我打算至少每年维护此脚本一次,以便导出前一年的数据,因此我将关注FIDE网站并尝试修复错误。
请随意进行分叉并提交pull请求。如果您发现任何问题,请使用GitHub中的问题跟踪器。
依赖关系
此脚本依赖于BeautifulSoup4,这是一个非常优秀的HTML解析器,用于执行屏幕抓取任务等。脚本会自动拉取正确的BeautifulSoup4版本,因此您无需在您的机器上安装它。
安装
使用pip进行安装
$ pip install fideparser
要升级到新版本,只需再次使用pip即可
$ pip install --upgrade fideparser
使用
所有选项都在帮助文档中有说明,您可以通过运行此命令来获取帮助
$ export_fide_tournaments -h
示例
以csv格式导出2013年1月评级的西班牙锦标赛的所有数据
$ export_fide_tournaments ESP 2013-01-01 2013-january-spain.csv csv
以二进制格式导出2013年7月评级的法国锦标赛的所有数据
$ export_fide_tournaments FRA 2012-07-01 2012-july.binary binary
使用之前从法国导出的二进制文件来创建JSON文件
$ export_fide_tournaments FRA 2012-07-01 2012-july.json json --datafile 2012-july.binary
使用之前从法国导出的二进制文件来创建csv文件
$ export_fide_tournaments FRA 2012-07-01 2012-july.csv csv --datafile 2012-july.binary
如果您想导出更多裁判数据,请附加可选标志–arbiter-data
$ export_fide_tournaments ESP 2013-01-01 2013-january-spain.csv csv --arbiter-data
如果您想导出报告数据(目前仅包括锦标赛报告中参赛选手的数量),请附加可选标志–report-data
$ export_fide_tournaments ESP 2013-01-01 2013-january-spain.csv csv --report-data
还提供了一个合并CSV文件的脚本,用于合并由export_fide_tournaments脚本生成的文件。可以使用以下方式使用
$ merge_csv_files outfile.csv 2013-january-spain.csv 2012-july.csv
更改日志
1.1 (2024-09-03)
修复了FIDE网站上HTML更改的问题。[erral]
1.0.2 (2019-01-10)
增加了更多测试。[erral]
1.0.1 (2019-01-03)
使用unicodecsv库生成CSV文件。[erral]
1.0 (2019-01-03)
支持Python 3。[erral]
使用travis-ci进行最小测试设置。[erral]
0.8.1 (2019-01-03)
解析报告数据时修复了玩家数量。[erral]
0.8 (2019-01-02)
使用HTTPS协议访问FIDE网址。[erral]
使用black格式化代码。[erral]
0.7.1 (2018-01-07)
记录可选标志。[erral]
修复了没有裁判数据时的错误。[erral]
0.7 (2018-01-07)
条件导出报告数据(报告中存在的玩家数量)[erral]
条件导出裁判数据[erral]
0.6 (2018-01-06)
使用http[erral]
移除setup.cfg[erral]
0.5 (2018-01-06)
一些小的修复[erral]
0.4.1 (2014-01-01)
修复了历史记录[erral]
0.4 - (2014-01-01)
处理给定裁判在FIDE网站上没有有效信息的情况[erral]
0.3 - (2013-01-08)
避免在导出的CSV文件中重复标题[erral]
修复了裁判解析问题:之前一些组织者被错误地解析为裁判。修复了#1 [erral]
0.2 - (2013-01-06)
添加了CSV文件合并工具[erral]
改进了文档[erral]
0.1 - (2013-01-06)
初始发布[erral]
项目详情
下载文件
下载适合您平台版本的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。