跳转到主要内容

用于处理2014年NeurIPS 2.0的CMT的实用文件包。

项目描述

CMTUTILS

2014年10月28日 Neil D. Lawrence

除了pandas和标准的numpy/scipy堆栈外,该库还具有以下依赖项: lxmlopenpyxlgdatapods

pip install lxml
pip install openpyxl
pip install gdata
pip install pods

在2014年,我和Corinna Cortes是NIPS程序共同主席。Alan Saul是我们的项目经理。在这个过程中,我们编写了许多用于处理数据的脚本。我编写的脚本使用了IPython笔记本(现在是Project Jupyter)和pandas。我总是希望总结这项工作,以便其他人可以从中受益。这同样也是总结像NIPS这样的主要会议程序主席职责的良好文档。

2021年5月,我将用于笔记本的实用文件分离成一个独立的Python模块。该库cmtutils用于管理提交。对于审稿人管理(首先是编写的),脚本基于SQLite中的CMT用户数据库的本地镜像。对于审稿管理,我们更多地使用了pandas,并将CMT作为审稿的中心存储库,每天导出它们。

需要通过导入和导出在CMT之间进行大量通信。一些用于CMT导出的链接可在此处找到。各种任务在会议仓库中的IPython笔记本中组织。首先编写的代码是为2014年NIPS会议编写的,但想法是基于使用CMT进行AISTATS 2012的经验和一些初步的代码(例如,导入CMT使用的XML格式的Excel版本)。

从一开始就有一种感觉,能够将信息导入和导出到谷歌表格将非常有用。考虑到这一点,我们创建了一个介于 pandas 和谷歌表格之间的接口(最初仅用于读取,后来用于更新)。这使得导入审稿人的建议和导出关于论文状态的信息到审稿人变得更加容易。该软件已经作为 Open Data Science 工具套件的一部分推出,可在此处GitHub上找到。这些笔记本也在其自己的GitHub会议软件存储库中可用。

关于代码的说明。大部分代码都是在审稿意见不断涌入或需要应对危机时“实时”编写的。分享信息通过谷歌表格的原始代码是在纽约州的卡茨基尔山脉度假期间用两天或三天编写的。大部分代码都需要重写,这是一个持续的过程,我希望其他会议主席或项目经理也能参与其中。这些代码被分享在这里,作为类似 NIPS 这样会议所需工作记录,同时也希望对其他人有用。这不是作为 Python 编程“最佳实践”的示例。有些部分我很自豪,有些则不然。然而,我认为这是一个很好的例子,说明如何在巨大的压力下使用笔记本和 Python 以及 pandas 进行“实时”数据处理。

除了安装的文件外,您还需要在您的家目录中创建一个名为 .cmt_user.cfg 的文件,并给它以下字段

# This is a user's personal configuration file for CMT
[conference]
short_name = NIPS
year = 2014
chair_email = program-chairs@nips.cc

[cmt]
export_directory = 

[gmail]
account = 
name = 
password = 

[google docs]
# Here include the spreadsheet keys of program committee and reviewer candiates
program_committee_key = 
reviewer_candidate_key =  
buddy_pair_key = 
global_results_key = 

[review data]
directory = 
file = all_reviews.pickle

项目详细信息


下载文件

下载您平台上的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。

源分发

cmtutils-0.1.2.tar.gz (32.9 kB 查看哈希值)

上传

构建分发

cmtutils-0.1.2-py2.py3-none-any.whl (31.2 kB 查看哈希值)

上传 Python 2 Python 3

支持者