跳转到主要内容

合并分割成多部分的LLM权重文件

项目描述

PyTorch Merge

此存储库包含一个名为 py_merge.py 的脚本,可以用于将两个PyTorch模型 .bin 文件合并成一个模型文件。当您需要合并具有相同架构且兼容的两个模型的权重时,这可能很有用。脚本为存在于两个模型中的键的平均参数值。

ko-fi

先决条件

在使用此脚本之前,请确保已安装以下Python包

  • PyTorch
  • Transformers

您可以使用pip安装它们

pip install pytorch_merge

这将自动安装依赖项(torch和transformers)。

用法

打开终端,并输入

pytorch_merge --help

获取使用说明。

此工具需要3个参数

  • --config config.json -- 您正在使用的模型架构的配置文件。
  • --bin model1.bin model2.bin model3.bin -- 您想要合并的所有模型权重 .bin 文件。您可以合并一个多部分模型的权重文件,或者来自不同模型的权重,在这种情况下,权重将平均。您可以指定任意多的文件,它们将按顺序循环合并。
  • --output merged_model.bin -- 保存输出合并模型的路径。

例如

pytorch_merge -c config.json -b model1.bin model2.bin -o merged_model.bin

现在您可以使用合并的 merged_model.bin 文件与您的模型架构一起使用。

注意:合并模型并不总是会产生期望的结果,特别是如果模型具有不同的架构或是在不同的数据上训练的。

只有当您确定模型兼容时才使用此脚本。

许可证

此工具由Donalda Feith制作,并许可在GNU通用公共许可证v3或更高版本(GPLv3+)下使用。

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。

源分布

pytorch_merge-0.1.2.tar.gz (17.9 kB 查看哈希值)

上传时间

构建分布

pytorch_merge-0.1.2-py3-none-any.whl (17.5 kB 查看哈希值)

上传时间 Python 3

由以下机构支持

AWSAWS 云计算和安全赞助商 DatadogDatadog 监控 FastlyFastly CDN GoogleGoogle 下载分析 MicrosoftMicrosoft PSF 赞助商 PingdomPingdom 监控 SentrySentry 错误日志 StatusPageStatusPage 状态页面