一套用于与Penn-Treebank .mrg格式解析进行交互并识别句法中心词的实用工具
项目描述
mrg_utils.py 由Robert Elwell创建,德克萨斯大学奥斯汀分校语言学系 http://comp.ling.utexas.edu/relwell
许可协议为GPL
这是一个处理Penn-Treebank风格的组合解析(也称为PTB发布二中的.mrg格式)的Python类集。文件应该相当直观。
规范节点是mrg_utils.py,但mrg_document.py和node.py可能对初学者更有信息量。
这可以节省你多达一个月的编写和调试时间,并且设计为可扩展。
你可以用它来提取特征,轻松运行统计数据,并导航句法树。
此代码是从最初设计用于与斯坦福解析器风格的依赖性解析输出(Marneffe等人,2006年)、Penn语篇树库数据等接口的API构建的。如有需要,请通过发送电子邮件到robert.elwell@gmail.com向我索取代码或指导。
祝你好运,享受乐趣。