此项目提供了一系列用于轻量级数据整理的工具。

这些详情尚未由PyPI验证

项目描述

datashaper

此项目提供了一系列用于轻量级数据整理的工具。

项目有两个目标

创建一个可共享的客户端/服务器模式，用于序列化整理指令
维护一个基本的整理引擎实现（基于Arquero），以及在Python中实现为Pandas

构建

您需要安装poetry Python包管理器。
运行：poetry install

用法

该项目旨在用作轻量级数据整理的库。在示例文件夹中有一个笔记本，其中提供了创建数据整理管道和读取由js实现生成的json规范的几个示例。

合并两个表的示例

from datashaper.pipeline import Pipeline
import datashaper.types as types
import pandas as pd

# id   name
# 1    bob
# 2    joe
# 3    jane
parents = pd.DataFrame({
    "id": [1, 2, 3],
    "name": ['bob', 'joe', 'jane']
})

# id   kid
# 1    billy
# 1    jill
# 2    kaden
# 2    kyle
# 3    moe
kids = pd.DataFrame({
    "id": [1, 1, 2, 2, 3],
    "kid": ['billy', 'jill', 'kaden', 'kyle', 'moe']
})

pipeline = Pipeline()

pipeline.add_dataset('parents', parents)
pipeline.add_dataset('kids', kids)

pipeline.add(Step(
    verb=Verb.join,
    input="parents",
    output="output",
    args={
        "other": "kids",
        "on":["id"]
    }
))

# id   name    kid
# 1    bob     billy
# 1    bob     jill
# 2    joe     kaden
# 2    joe     kyle
# 3    jane    moe
result = pipeline.run()

贡献

本项目欢迎贡献和建议。大多数贡献都需要您同意贡献者许可协议（CLA），声明您有权并且实际上已经授予我们使用您贡献的权利。有关详细信息，请访问 https://cla.opensource.microsoft.com。

当您提交拉取请求时，CLA 机器人会自动确定您是否需要提供 CLA，并相应地装饰 PR（例如，状态检查，评论）。只需遵循机器人提供的说明。您只需要在整个使用我们的 CLA 的所有存储库中这样做一次。

本项目已采用微软开源行为准则。有关更多信息，请参阅行为准则常见问题解答或通过 opencode@microsoft.com 联系我们，提出任何额外的问题或评论。

商标

本项目可能包含项目、产品或服务的商标或徽标。授权使用微软商标或徽标须遵守并遵循微软商标和品牌指南。在修改后的本项目中使用微软商标或徽标不得引起混淆或暗示微软赞助。任何使用第三方商标或徽标的行为均受那些第三方政策的约束。

项目详情

这些详情尚未由PyPI验证

发布历史发布通知 | RSS 源

本版本

0.0.49

2024 年 3 月 18 日

0.0.48

2024 年 3 月 18 日

0.0.47

2024 年 3 月 17 日

0.0.46

2024 年 3 月 15 日

0.0.45

2024 年 3 月 13 日

0.0.44

2024 年 3 月 11 日

0.0.43

2024 年 3 月 11 日

0.0.42

2024 年 2 月 22 日

0.0.41

2024 年 2 月 21 日

0.0.40

2024 年 2 月 21 日

0.0.39

2024 年 2 月 20 日

0.0.38

2024 年 2 月 15 日

0.0.37

2024 年 2 月 15 日

0.0.36

2024 年 2 月 15 日

0.0.35

2024 年 2 月 15 日

0.0.34

2024 年 2 月 2 日

0.0.33

2024 年 2 月 2 日

0.0.32

2024 年 2 月 2 日

0.0.31

2024 年 2 月 2 日

0.0.30

2024 年 2 月 2 日

0.0.29

2024 年 2 月 2 日

0.0.28

2024 年 2 月 1 日

0.0.27

2024 年 2 月 1 日

0.0.26

2024 年 2 月 1 日

0.0.25

2024 年 2 月 1 日

0.0.24

2024 年 1 月 25 日

0.0.23

2024 年 1 月 25 日

0.0.22

2024 年 1 月 9 日

0.0.21

2024 年 1 月 9 日

0.0.20

2024 年 1 月 9 日

0.0.19

2024 年 1 月 9 日

0.0.18

2024 年 1 月 9 日

0.0.17

2024 年 1 月 9 日

0.0.16

2024 年 1 月 9 日

0.0.15

2023 年 11 月 6 日

0.0.14

2023 年 11 月 1 日

0.0.13

2023 年 10 月 27 日

0.0.12

2023 年 10 月 25 日

0.0.11

2023 年 10 月 25 日

0.0.10

2023 年 10 月 25 日

0.0.9

2023 年 10 月 24 日

0.0.8

2023 年 10 月 24 日

0.0.7

2022 年 8 月 16 日

0.0.6

2022 年 8 月 16 日

下载文件

下载适合您平台文件。如果您不确定选择哪个，请了解有关安装包的更多信息。

源代码分发

datashaper-0.0.49.tar.gz (36.4 kB 查看散列)

上传时间 2024 年 3 月 18 日 源代码

构建分发

datashaper-0.0.49-py3-none-any.whl (72.0 kB 查看散列)

上传时间 2024 年 3 月 18 日 Python 3

datashaper-0.0.49.tar.gz 的散列

datashaper-0.0.49.tar.gz 的散列
算法	散列摘要
SHA256	`05bfba5964474a62bdd5259ec3fa0173d01e365208b6a4aff4ea0e63096a7533`
MD5	`31bcb614cd195c5278c58f2a524f3b56`
BLAKE2b-256	`e6d328663b75307748e36a026d32a6d60e0725ed054f28cc5a72fa418ac166ae`

datashaper-0.0.49-py3-none-any.whl 的散列

datashaper-0.0.49-py3-none-any.whl 的散列
算法	散列摘要
SHA256	`7f58cabacc834765595c6e04cfbbd05be6af71907e46ebc7a91d2a4add7c2643`
MD5	`2098e0cc9b3dd9fdb2c5d4ea1c674171`
BLAKE2b-256	`cbb9f5cebf0fd2ebee6449663989f275f186928c92b94d05c9503c9ccc814757`

datashaper 0.0.49

导航

验证详情

维护者

未验证详情

元数据

分类器

项目描述

datashaper

构建

用法

贡献

商标

项目详情

验证详情

维护者

未验证详情

元数据

分类器

发布历史发布通知 | RSS 源

下载文件

源代码分发

构建分发

datashaper 0.0.49

导航

验证详情

维护者

未验证详情

元数据

分类器

项目描述

datashaper

构建

用法

贡献

商标

项目详情

验证详情

维护者

未验证详情

元数据

分类器

发布历史 发布通知 | RSS 源

下载文件

源代码分发

构建分发

发布历史发布通知 | RSS 源