跳转到主要内容

DataLad FUSE扩展包

项目描述

DataLad FUSE扩展包

codecov.io tests docs

datald-fuse提供了从其远程Web URL读取DataLad数据集文件的命令,而不必首先下载它们的全部内容。相反,使用fsspec来按需稀疏下载和本地缓存文件。

安装

datald-fuse的当前版本需要Python 3.7或更高版本。只需使用Python 3的pip来安装它(您有pip吗?)

python3 -m pip install datalad-fuse

此外,使用datald fusefs命令需要安装FUSE;在基于Debian的系统上,可以使用以下命令完成此操作

sudo apt-get install fuse

命令

datald fsspec-cache-clear [<选项>]

清除数据集的本地下载缓存。

选项

  • -d <DATASET>, --dataset <DATASET> — 指定要操作的数据集。如果没有指定数据集,则尝试根据当前工作目录识别数据集。

  • -r, --recursive — 清除子数据集的缓存。

datald fsspec-head [<选项>] <路径>

通过从远程URL获取数据来显示附加文件的头部行/字节。

选项

  • -d <DATASET>, --dataset <DATASET> — 指定要操作的数据集。如果没有指定数据集,则尝试根据当前工作目录识别数据集。

  • -n <INT>, --lines <INT> — 显示多少行(默认:10)

  • -c <INT>, --bytes <INT> — 显示多少字节

datald fusefs [<选项>] <挂载路径>

<mount-path> 创建一个只读的 FUSE 挂载,该挂载公开给定的数据集中的文件。在挂载下打开的文件如果不在本地数据集中,将按需从文件的 Web URL 下载其内容。

当命令完成后,根据 datalad.fusefs.cache-clear 配置选项的值,可能会运行 fsspec-cache-clear。如果它设置为 "visited",则访问过 FUSE 挂载的任何(子)数据集都将清除其缓存;如果设置为 "recursive",则将清除正在操作的数据集中的所有(子)数据集的缓存。

选项

  • --allow-other — 允许所有用户访问挂载中的文件。这需要在 /etc/fuse.conf 中设置 user_allow_other

  • -d <DATASET>, --dataset <DATASET> — 指定要操作的数据集。如果没有指定数据集,则尝试根据当前工作目录识别数据集。

  • -f--foreground — 在前台运行 FUSE 进程;使用 Ctrl-C 退出。当前此选项是必需的。

  • --mode-transparent — 在挂载中公开数据集的 .git 目录

项目详情


下载文件

下载适用于您平台的文件。如果您不确定该选择哪个,请了解更多关于 安装包 的信息。

源分发

datalad-fuse-0.5.1.tar.gz (57.7 kB 查看哈希)

上传时间

构建分发

datalad_fuse-0.5.1-py3-none-any.whl (26.7 kB 查看哈希)

上传时间 Python 3

由以下机构支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误记录 StatusPage StatusPage 状态页面