跳转到主要内容

Microsoft Fabric的语义链接实验室

项目描述

语义链接实验室

PyPI version Read The Docs Code style: black Downloads


在ReadTheDocs上阅读文档!

语义链接实验室是一个Python库,专为在 Microsoft Fabric笔记本 中使用而设计。此库扩展了 语义链接 的功能,提供了额外的功能,以便无缝集成并与之协同工作。语义链接实验室的目标是简化技术流程,让人们能够专注于更高层次的活动,并允许机器有效地处理更适合机器的任务,而不需要人为干预。

特色场景

查看入门 辅助笔记本

如果您遇到任何问题,请 提交一个错误

如果您有关于新功能/函数的想法,请 请求一个功能

在 Fabric 笔记本中安装库

%pip install semantic-link-labs

安装完成后,运行以下代码将库导入您的笔记本

import sempy_labs as labs
from sempy_labs import migration, directlake, admin
from sempy_labs import lakehouse as lake
from sempy_labs import report as rep
from sempy_labs.tom import connect_semantic_model
from sempy_labs.report import ReportWrapper
from sempy_labs import ConnectWarehouse
from sempy_labs import ConnectLakehouse

将 semantic-link-labs 加载到自定义 Fabric 环境

确保 semantic-link-labs 库在您的 workspace/notebooks 中可用的一种更好的方法是将其作为库加载到自定义 Fabric 环境中。如果您这样做,您就无需在笔记本中每次都运行上述 '%pip install' 代码。请按照以下步骤操作。

创建自定义环境

  1. 导航到您的 Fabric 工作空间
  2. 点击 'New' -> 更多选项
  3. 在 'Data Science' 中,点击 'Environment'
  4. 命名您的环境,点击 'Create'

将 semantic-link-labs 作为库添加到环境中

  1. 在 'Public libraries' 中,点击 'Add from PyPI'
  2. 输入 'semantic-link-labs'。
  3. 点击屏幕右上角的 'Save'
  4. 点击屏幕右上角的 'Publish'
  5. 点击 'Publish All'

更新您的笔记本以使用新环境(必须等待环境完成发布

  1. 导航到您的笔记本
  2. 在笔记本顶部的导航栏中的 'Environment' 下拉菜单中选择您新创建的环境

版本历史

  • 0.8.2(2024 年 10 月 2 日)
  • 0.8.1(2024 年 10 月 2 日)
  • 0.8.0(2024 年 9 月 25 日)
  • 0.7.4(2024 年 9 月 16 日)
  • 0.7.3(2024 年 9 月 11 日)
  • 0.7.2(2024 年 8 月 30 日)
  • 0.7.1(2024 年 8 月 29 日)
  • 0.7.0(2024 年 8 月 26 日)
  • 0.6.0(2024 年 7 月 22 日)
  • 0.5.0(2024 年 7 月 2 日)
  • 0.4.2(2024 年 6 月 18 日)

Direct Lake 迁移

以下过程自动化了将导入/DirectQuery 模型迁移到新的 Direct Lake 模型的过程。第一步特别适用于使用 Power Query 执行数据转换的模型。如果您的模型不使用 Power Query,则必须将用于您的语义模型的基本表迁移到 Fabric 湖屋。

查看 Nikola Ilic 关于此主题的精彩 博客文章

查看我关于此主题的 博客文章

Direct Lake Migration Video

先决条件

  • 确保您为您的容量启用 XMLA 读写
  • 确保您在 Fabric 工作区中有一个数据湖屋
  • 启用以下设置:工作区 -> 工作区设置 -> 常规 -> 数据模型设置 -> 用户可以在 Power BI 服务中编辑数据模型

说明

  1. 下载此笔记本
  2. 确保您处于'数据工程'角色。单击工作区屏幕左下角的图标并选择'数据工程'
  3. 在您的工区中,选择'新建 -> 导入笔记本'并导入步骤 1 中的笔记本。
  4. 将您的数据湖屋添加到您的 Fabric 笔记本
  5. 按照笔记本中的说明操作。

迁移过程

[!NOTE] 如果您在 Power Query 中有逻辑,则前 4 个步骤是必需的。否则,您需要将您的语义模型源表迁移到数据湖屋表。

  1. 笔记本的第一步创建了一个 Power Query 模板 (.pqt) 文件,这有助于将 Power Query 逻辑迁移到 Dataflows Gen2。
  2. .pqt 文件创建后,从您的OneLake 文件浏览器同步文件。
  3. 导航到您的数据湖屋(这是关键!)。从您的数据湖屋,创建一个新的 Dataflows Gen2,并导入 Power Query 模板文件。从此步骤开始从您的数据湖屋将自动将所有表的目的地设置为该数据湖屋(而不是需要手动映射每个表)。
  4. 发布 Dataflow Gen2 并等待它完成在您的数据湖屋中创建 delta 湖表。
  5. 回到笔记本,下一步将创建您的新 Direct Lake 语义模型,名称由您选择,并从原始语义模型获取所有相关属性,刷新/设置您的新语义模型。

[!NOTE] 计算表也迁移到 Direct Lake(作为存储为新语义模型中模型注释的 DAX 表达式的数据表)。字段参数也按照原始语义模型中的方式迁移(作为计算表)。不迁移自动日期/时间表。必须在 Power BI Desktop 中禁用自动日期/时间,并在迁移之前创建适当的日期表。

  1. 最后,您可以轻松地将所有使用导入/DQ 语义模型的报告重新绑定到新的 Direct Lake 语义模型,只需单击一次。

完成这些步骤将执行以下操作

  • 将 Power Query 逻辑卸载到 Fabric 中的 Dataflows Gen2 内(在那里它可以维护,并且可以继续开发)。
  • Dataflows Gen2 将在您的 Fabric 数据湖屋中创建 delta 表。然后可以使用这些表用于 Direct Lake 模型。
  • 创建一个新的 Direct Lake 模式语义模型,包含所有标准表和列、计算组、度量、关系、层次结构、角色、行级安全性、视角和翻译。
  • 可行的计算表作为数据表迁移到新语义模型。Delta 表在数据湖屋中动态生成以支持 Direct Lake 模型。计算表 DAX 逻辑存储为新语义模型中的模型注释。
  • 字段参数按照原始语义模型中的方式迁移到新语义模型(作为计算表)。新语义模型中的字段参数(s)自动删除任何在字段参数中使用的计算列。
  • 不支持的对象不进行迁移(例如,计算列、使用不支持的列数据类型的关联等)。
  • 原始语义模型使用的报告将重新绑定到您的新语义模型。

限制

  • 计算列不迁移。
  • 自动日期/时间表未迁移。
  • 字段参数中计算列的引用已被删除。
  • 在度量表达式或其他DAX表达式中对计算列的引用将中断。
  • 尽可能将计算表迁移。此迁移的成功取决于计算表的相互依赖性和复杂性。此部分迁移是一个权宜之计,因为技术上来说,Direct Lake不支持计算表。
  • 有关Direct Lake的其他限制,请参阅此处

贡献

此项目欢迎贡献和建议。大多数贡献需要您同意一份贡献者许可协议(CLA),声明您有权,并且实际上确实授予我们使用您的贡献的权利。有关详细信息,请访问https://cla.opensource.microsoft.com

当您提交拉取请求时,CLA机器人将自动确定您是否需要提供CLA,并适当装饰PR(例如,状态检查,评论)。只需按照机器人提供的说明操作。您只需在整个使用我们CLA的仓库中进行一次。

此项目已采用Microsoft开源行为准则。有关更多信息,请参阅行为准则FAQ或通过opencode@microsoft.com联系以提出任何额外的问题或评论。

商标

此项目可能包含项目、产品或服务的商标或标志。授权使用Microsoft商标或标志需遵守并必须遵循Microsoft的商标和品牌指南。在此项目的修改版本中使用Microsoft商标或标志不得引起混淆或暗示Microsoft的赞助。任何第三方商标或标志的使用均受第三方政策的约束。

项目详细信息


下载文件

下载适用于您的平台的文件。如果您不确定选择哪一个,请了解更多关于安装包的信息。

源分布

semantic_link_labs-0.8.2.tar.gz (478.5 kB 查看散列)

上传时间

构建分布

semantic_link_labs-0.8.2-py3-none-any.whl (575.7 kB 查看散列)

上传时间 Python 3

由以下支持