跳转到主要内容

结构化数据表

项目描述

hep_tables

表格实验

简介

这是原型化访问分层数据和使用其他后端处理它(如servicex等)。

作为旁注 - 这东西受到没有类型系统或类型信息的严重限制。我们需要能够区分单个项(如jet.pt())和序列(jet.tracks())。

一些笔记

  • 我们将解析器分为两个部分 - 一个用于查找与LINQ过程相关的内容,另一个处理与表达式(“/”或“>”操作)相关的内容。我们目前必须能够在它们之间来回调用。这可能不是理想的。可能有一种方法可以将它们结合起来。问题是表达式处理器必须将一切转发给另一个,反之亦然。这意味着你必须触摸它们两个。它工作,但我怀疑将来会有些混乱。

  • 我们应该如何考虑解析这些内容 - 存在数学表达式和序列表达式。我们应该仔细查看DAG,确保两者很好地分开。

  • 当用户使用新的histogram函数(来自外部的内容)时,应该有一种自动方式让本地渲染内容知道需要调用后端。目前这被硬编码到代码中。人们可以想到将其拆分 - 因为不同的后端可以实现相同的功能 - 因此一个前端(如histogram)然后所有后端都可以实现它。

  • 很明显,我们应该将每个循环项都作为元组的一部分向前移动,就这么做。这样,如果需要它们,它们就在那里,我们不必在以后返回时具有这种复杂结构来访问它们。代码将更加简单。而且渲染代码足够聪明,不会尝试渲染不需要的内容(至少在xAOD后端中是这样)。

  • 所有内容都应该有类型。我们应该使用 Sequence[xxx] 来表示序列,因此编写自己的模板类型。

  • 我们需要监控我们在序列中工作的“深度”。序列可以是嵌套的,我们 somehow需要规范化我们对此的看法。因为您必须随着深度的增加而嵌套 Select 语句。目前,在这个代码中可以深入一层或两层,这需要变得通用。

项目详情


下载文件

下载您平台上的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。

源分发

hep_tables-1.0.0.tar.gz (19.7 kB 查看哈希值)

上传时间

构建分发

hep_tables-1.0.0-py3-none-any.whl (21.4 kB 查看哈希值)

上传时间 Python 3

由以下组织支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误记录 StatusPage StatusPage 状态页面