跳转到主要内容

word streamer;通过命令行和Web界面进行对话和分离式玩文本

项目描述

wordstream是一个简单的文本关联语料库及其使用工具。向语料库文本添加将基于每个单词生成从左到右的单词关联堆栈。单词(目前)定义为位于空白字符之间的位。然后可以消费语料库:给定一个单词,弹出其堆栈的顶部。

wordstream包中有两个语料库接口:wordstream和dissociate。还可以想象wordstream的其他应用。

wordstream源代码位于http://k0s.org/hg/wordstream

wordstream接口

一个用于消费和添加语料库的交互式接口。Wordstream具有命令行接口wordstream和可通过运行paster serve wordstream.ini使用的Web接口。在两种情况下,用法相同。从初始语料库开始,用户输入文本行。wordstream将消费语料库并向文本打印响应,并将用户的行添加到语料库中

dissociate接口

以emacs的M-x dissociated-press(试试看!)命名,dissociate将文档添加到语料库中,打乱语料库(每个单词的堆栈顺序),然后输出语料库自我消费的结果,随机选择单词,消费其关联,然后消费关联的关联,直到语料库为空。Dissociate具有命令行接口(安装软件并运行dissociate --help以获取用法),以及可通过paster serve dissociate.ini使用的Web接口。

应用

虽然wordstream语料库是一个简单的模型,但基本思想可以用于

  • 同义词典:通过输入语料库的同义词,词流可以作为一个同义词典程序使用。同义性可以通过词数或通过其在堆栈顶部的位置来指示。同义词典可以通过网页界面显示,以允许在写作时自动提供建议

  • 写作分析:网络上的文本量巨大。词流可以用来说明在多个网站上谈论最多的是什么以及与之相关的内容。

  • 协作小说:由于词流可以使用由与之交互而填充的集体语料库,几位作者可以同时与词流网页界面交互,每位作者都在向集体语料库提供信息,并且字面地吃着彼此的词

项目详情


下载文件

下载适合您平台的文件。如果您不确定该选择哪个,请了解有关安装包的更多信息。

源代码分发

wordstream-0.1.3.tar.gz (7.2 kB 查看哈希值)

上传时间 源代码

构建分发

wordstream-0.1.3-py3-none-any.whl (7.6 kB 查看哈希值)

上传时间 Python 3

由以下机构支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页面