在摘要中查找 amici curiae。
项目描述
友好简介解析CSV文件中的摘要标题,并输出一个新的CSV文件,其中包含一些关于摘要的推断。摘要标题可能如下所示。
Amicus Brief, BRIEF OF L. S. LEE, INC. AMICUS CURIAE ON BEHALF OF PETITIONER, December 6, 2000, 2000 U.S. S. Ct. Briefs LEXIS 836
对于这样的标题,友好简介尝试猜测以下内容
摘要编号
amici curiae
amici curiae的立场
使用方法
使用pip安装。
pip3 install friendly_brief
并在CSV文件上运行它。该文件必须包含一个列,其中包含您关心的所有摘要标题,标题必须位于名为“brief”的列中。CSV文件可以包含您想要的任何其他内容。
friendly-brief briefs.csv
它还可以接收标准输入的CSV文件。
cat briefs.csv | friendly-brief
生成的CSV文件将写入标准输出。
工作原理
让我们讨论每个推断是如何做出的。
摘要编号
我们将第一个不间断的数字组视为摘要编号。例如,以下摘要标题以“1”开头,然后是“9”,然后是“。”。
Brief, BRIEF AMICUS CURIAE OF SOCIAL SCIENCE AND COMPARATIVE LAW SCHOLARS IN SUPPORT OF NEITHER PARTY, June 1, 2001, 2001 U.S. S. Ct. Briefs LEXIS 718
我们注意到非数字“。”后停止,并使用“19”作为摘要编号。
立场
立场是根据某些短语的存在来猜测的。有五种类型的立场,以下是它们对应的短语
- 立场 0
“Neither party”
- 立场 1
“Petitioner”, “Appellant”, 和 “Reversal”
- 立场 2
“Respondent”, “Appellee”, 和 “Affirmance”
- 立场 3
“Plaintiff”
- 立场 4
“Defendant”
程序会寻找所有这些短语的 presence。如果结果是明确的,则结果电子表格包含对应姿势的数字。
如果没有姿势短语或存在对应不同姿势的短语,则可能发生歧义。例如,我会认为包含“原告”和“被告”的简短标题是歧义的。在歧义情况下,姿势单元格将被留空。
Amici
整个过程中最混乱的部分是猜测 Amici。我甚至不知道它在做什么,但这里有一些概念。
很早的时候,日期及其之后的内容都会被移除。例如,这个
Amicus Brief,BRIEF OF SOCIAL AND ORGANIZATIONAL PSYCHOLOGISTS AS AMICI CURIAE SUPPORTING RESPONDENTS,August 13, 2012,2012 U.S. S. Ct. Briefs LEXIS 3223
变成这样。
Amicus Brief,BRIEF OF SOCIAL AND ORGANIZATIONAL PSYCHOLOGISTS AS AMICI CURIAE SUPPORTING RESPONDENTS
简报标题在逗号、分号和单词“and”等处被分割成几部分,所以我们最终得到以下内容。
Amicus Brief
BRIEF OF SOCIAL AND ORGANIZATIONAL PSYCHOLOGISTS AS AMICI CURIAE SUPPORTING RESPONDENTS
看起来不像 Amici 名称的东西会被移除。这包括“amici”、“amicus”、“supporting”、“as”和“brief”等单词,我们最终得到以下 Amici。
SOCIAL AND ORGANIZATIONAL PSYCHOLOGISTS
为了处理后缀(“INC”、“LLC”、“JR”)、非连续逗号(“first, second and third”)、奇怪的字符编码、拼写错误和其他简报标题中的其他错误,做了很多奇怪的事情。
项目详情
friendly_brief-0.0.5.tar.gz 的散列
算法 | 散列摘要 | |
---|---|---|
SHA256 | 56c8e4c6c427f8d8be47b2d85e853a5470b529ff4086d3c0e4b7608743e685ff |
|
MD5 | 99119979ec93bf353ca6495c044ce926 |
|
BLAKE2b-256 | f8a853b642f7e181b247bfb1a69c9ab465d2b4ca37fab88156a83411cb0b5f08 |