跳转到主要内容

lynguine 数据导向架构接口的包。

项目描述

lynguine

Tests

codecov

《lynguine》库是一个基于DOA原则的数据管理库。它提供这些功能以支持其他库,如《lamd》和《referia》。

安装方法

%pip install lynguine

该软件由TK原理部分组成。

配置

首先 config,它由interfacecontext组成。

context定义了Context对象,用于存储有关上下文的信息,例如机器类型等。另一方面,interface定义了用于定义输入和输出的Interface对象,该对象定义了与其他“黑盒过程”的连接。

一个简短的示例

可以使用以下命令加载本地上下文。

import lynguine as ln

ctxt = ln.config.context.Context()

interface模块包含《lynguine》的关键结构。它指定了流入和流出的流,以及计算操作。每个流都以下列形式指定。

input:
  source:

可以使用计算字段进行预处理。

input:
  compute:
    field: ColumnName0
    function: computeFunction
    args:
      arg1: argument1
      arg2: argument2
    row_args:
      arg3: ColumnName1

通常数据将存储在另一个文件中(csv、excel、yaml等),但有时将数据存储在称为“data”的字段中的“local”会更方便。在下一个示例中,我们这样做来展示如何使用compute功能来增强文件。这里添加了两个字段,全名(用作索引)和今天的日期作为访问日期。

import yaml
from lynguine.config.interface import Interface
from lynguine.assess.data import CustomDataFrame

# Let's assume this is the text stored in the interface file
yaml_text = """input:
  type: local
  index: fullName
  data:
  - familyName: Xing
    givenName: Pei
  - familyName: Venkatasubramanian
    givenName: Siva
  - familyName: Paz Luiz
    givenName: Miguel
  compute:  # compute is used for preprocessing as data is loaded
  - field: fullName # the field fullName is created from this compute command
    function: render_liquid
    args: # keyword arguments to pass to the function
      template: '{{familyName | replace: " ", "-"}}_{{givenName | replace: " ", "-"}}' # The liquid template allows us to combine the names
    row_args: # arguments are taken from the same row
      givenName: givenName 
      familyName: familyName
  - field: accessDate
    function: today"""

interface = Interface(yaml.safe_load(yaml_text))

data = CustomDataFrame.from_flow(interface)
print(data)

将创建一个新的字段fullname,然后用作索引。

访问

其次,该软件使用访问、评估、地址分解。其中access用于访问数据,包括iodownloadio允许读写各种不同的文件格式,如jsonyamlmarkdowncsvxlsbibtex

download用于从网络访问资源,例如下载特定的URL。

一个简短的示例

也许您想从PMLR会议卷1《实践中的高斯过程》创建一个bibtex文件。在下面的简例中,我们使用lynguine首先下载相关URL,然后将其加载并保存为bibtex。

import lynguine

评估

评估是关于对原始数据进行处理。在assess下,lynguine提供datacomputedata模块提供了一个提供数据访问和操作能力的CustomDataFrame对象。而compute模块封装了各种预处理和处理数据的计算能力。

一个简短的示例

import lynguine

工具

util模块提供了用于数据处理的各种工具。包括:

  • dataframe用于操作数据框。
  • fake用于生成假数据。
  • files用于与文件交互。
  • html用于处理HTML。
  • liquid用于处理液体模板语言。
  • talk用于处理Neil的演讲格式。
  • tex用于处理LaTeX。
  • text用于处理文本。
  • yaml用于处理YAML。
  • misc用于其他杂项工具。

一个简短的示例

import lynguine

测试

测试存储在tests子目录中。它们使用pytest

一个简短的示例

如果您已安装poetry,可以使用以下命令运行测试:

poetry run pytest 

为什么选择lynguine?

这个名字来源于数据导向架构就像一系列数据流,就像linguine面条。在意大利语中,这个词也意味着“小舌头”,因此还有服务之间翻译的隐含意义。

项目详情


下载文件

下载适用于您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源代码分发

lynguine-0.1.1.tar.gz (494.7 kB 查看散列)

上传时间: 源代码

构建分发

lynguine-0.1.1-py3-none-any.whl (137.4 kB 查看散列)

上传时间: Python 3

支持者

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页面