跳转到主要内容

Microsoft Health Futures用于病理图像深度学习的包

项目描述

病理学模型和工作流程

公共数据上的模型

此存储库包含一组基于和针对公共数据集(PANDA、TCGA)构建的模型。有关将数据集上线和运行模型的详细说明,请参阅readthedocs

入门

设置Python

要处理病理学文件夹,请创建一个单独的Conda环境。

cd hi-ml-cpath
make env

然后您可以通过 conda activate HimlHisto 激活环境。通过从命令面板选择“Python:选择解释器”来设置VSCode使用此Conda环境。

如果需要更新依赖项,请修改 hi-ml-cpath/primary_deps.yml 文件,然后运行脚本 hi-ml-cpath/create_and_lock_environment.sh。这将创建一个包含所有依赖项固定版本的完整“锁定”环境规范。

设置AzureML

此外,请下载您希望使用的AzureML工作区的配置文件。

  • 在浏览器中,导航到相关工作区。
  • 单击页面右上角的下拉菜单,位于您的账户图片左侧。
  • 选择“下载配置文件”。
  • 将该文件保存到仓库根目录。

一旦配置文件到位,所有在 hi-ml-cpath 文件夹中启动的Python运行将自动使用此配置文件。

运行组织病理学模型

为了测试您的设置,请在 hi-ml-cpath 文件夹中执行以下操作

conda activate HimlHisto
python ../hi-ml/src/health_ml/runner.py --model health_cpath.TcgaCrckImageNetMIL  --cluster=training-nd24

这应在您通过 config.json 配置的AzureML工作区中启动一个AzureML作业。您可能需要调整计算集群的名称(如上面的示例中的 training-nd24)。

Conda环境

如果您在 hi-ml-cpath 文件夹中启动作业,它们将自动选择该文件夹中存在的Conda环境文件。如果您在不同的文件夹中启动作业,您需要添加 --conda_env 选项来指向文件 <repo_root>/hi-ml-cpath/environment.yml

运行组织病理学测试

hi-ml-cpath 文件夹中运行

make call_pytest

在VSCode中,所有测试都应该自动被识别。您可以通过修改VSCode的 .vscode/settings.json 文件中的 python.testing.pytestArgs 来排除 hi-mlhi-ml-azure 包的测试。

需要GPU的测试

组织病理学文件夹的测试管道包含在一个具有2个GPU的机器上运行 pytest。只有标记为 pytestgpu 标记的测试在该GPU机器上执行。注意,所有带有 gpu 标记的测试在CPU机器上运行时也会执行。您需要手动添加 skipif 标志来跳过那些仅在GPU机器上运行的测试。这也确保测试套件在构建代理之外执行时可以通过。

  • 仅在CPU机器上运行的测试:不提供任何 pytest 标记
def test_my_code() -> None:
    pass
  • 在CPU和GPU机器上运行的测试:添加 @pytest.mark.gpu
@pytest.mark.gpu
def test_my_code() -> None:
    pass
  • 仅在GPU机器上运行的测试
from health_ml.utils.common_utils import is_gpu_available
no_gpu = not is_gpu_available()

@pytest.mark.skipif(no_gpu, reason="Test requires GPU")
@pytest.mark.gpu
def test_my_code() -> None:
    pass

项目详情


下载文件

下载适用于您平台的文件。如果您不确定选择哪个,请了解有关 安装包 的更多信息。

源分布

hi-ml-cpath-0.5.2.tar.gz (114.7 kB 查看哈希值)

上传于

构建分发版

hi_ml_cpath-0.5.2-py3-none-any.whl (141.9 kB 查看哈希)

上传于 Python 3

由以下支持