与Mila集群一起工作的工具
项目描述
milatools
milatools软件包提供了mila
命令,旨在帮助连接和交互Mila集群。
警告
建议在本地机器上使用mila
命令。在集群上运行它将因错误而失败
安装
要求Python >= 3.8
pip install milatools
或者,对于最新版本
pip install git+https://github.com/mila-iqia/milatools.git
安装milatools后,使用mila init
开始
mila init
命令
mila init
交互式设置对Mila集群的访问。请准备好您的用户名和密码!
- 为方便使用
ssh mila
设置SSH配置 - 如果您还没有,设置公钥
- 将您的公钥复制到集群以实现无密码认证
- 在登录节点上设置公钥,以便能够ssh到计算节点
- 新功能:添加一个特殊的SSH配置,以使用
ssh mila-cpu
直接连接到计算节点
mila docs/intranet
- 使用
mila docs <search terms>
搜索Mila技术文档 - 使用
mila intranet <search terms>
搜索Mila内部网
这两个命令都会打开一个浏览器窗口。如果没有给出搜索词,您将被带到主页。
mila 代码
将 VSCode 实例连接到计算节点。 mila 代码
首先使用 slurm 分配一个计算节点(您还可以使用 --alloc
传递 slurm 选项),然后使用适当的选项调用 code
命令以在分配的节点上启动远程编码会话。
您可以简单地按 Ctrl+C 终止进程以结束会话。
usage: mila code [-h] [--cluster {mila,cedar,narval,beluga,graham}] [--alloc ...]
[--command VALUE] [--job VALUE] [--node VALUE] [--persist]
PATH
positional arguments:
PATH Path to open on the remote machine
options:
-h, --help show this help message and exit
--alloc ... Extra options to pass to slurm
--cluster {mila,cedar,narval,beluga,graham}
Which cluster to connect to.
--command VALUE Command to use to start vscode (defaults to "code" or the value
of $MILATOOLS_CODE_COMMAND)
--job VALUE Job ID to connect to
--node VALUE Node to connect to
--persist Whether the server should persist or not
例如
mila code path/to/my/experiment
可以使用 --alloc
选项在分配节点时将额外的参数传递给 salloc
(例如,使用 --alloc --gres=gpu:1
分配 1 个 GPU)。 --alloc
应该放在最后,因为它将接收其后的所有参数。
如果您已经在计算节点上有一个分配,您可以使用 --node NODENAME
或 --job JOBID
选项连接到该节点。
mila 服务
mila 服务
的目的是使在计算节点上启动笔记本、日志服务器等并连接到它们变得更加容易。
usage: mila serve [-h] {connect,kill,list,lab,notebook,tensorboard,mlflow,aim} ...
positional arguments:
{connect,kill,list,lab,notebook,tensorboard,mlflow,aim}
connect Reconnect to a persistent server.
kill Kill a persistent server.
list List active servers.
lab Start a Jupyterlab server.
notebook Start a Jupyter Notebook server.
tensorboard Start a Tensorboard server.
mlflow Start an MLFlow server.
aim Start an AIM server.
optional arguments:
-h, --help show this help message and exit
例如,要使用一个 GPU 启动 jupyterlab,您可以编写
mila serve lab --alloc --gres gpu:1
当然,您可以在 --alloc
之后写入任何 SLURM 参数。
结束连接将结束服务器,但可以使用 --persist
标志防止这种情况。在这种情况下,您可以写入 mila 服务连接 jupyter-lab
以重新连接到您的运行实例。使用 mila 服务列表
和 mila 服务终止
查看和管理任何运行实例。
项目详细信息
下载文件
下载适合您平台的文件。如果您不确定选择哪个,请了解有关 安装包 的更多信息。
源分布
构建分布
milatools-0.1.5.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 155409a8cba4048eb6a7d604ab3516e2f98a8d804a3504d4e81aaf0a1529cc54 |
|
MD5 | efaf9acd72eaff604cd680a586b35dad |
|
BLAKE2b-256 | 4019b1c80a7eafa7f9430d018f32f286ac96d827ad079d26e59e749017f96895 |
milatools-0.1.5-py3-none-any.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | fb8661b78a8fdafc6146933d694e215f384c8c17e0833a70f0783274b63567c1 |
|
MD5 | f7367fd00493b987724e71eeef7986e1 |
|
BLAKE2b-256 | a4910aad780fd9248e8233e23587f7ffa35c117885f29ea628ad755b61e05d99 |