Pickler类用于扩展标准pickle.Pickler的功能

这些信息尚未由PyPI验证

项目链接

主页

项目描述

cloudpickle

cloudpickle 允许序列化 Python 标准库中默认 pickle 模块不支持序列化的 Python 构造。

cloudpickle 特别适用于 集群计算，其中 Python 代码通过网络传输到远程主机执行，可能在数据附近。

在许多其他方面，cloudpickle 支持序列化 lambda 函数 以及在 __main__ 模块中（例如在脚本、shell 或 Jupyter 笔记本中）交互式定义的 函数和类。

Cloudpickle 只能用于在 完全相同的 Python 版本 之间发送对象。

使用 cloudpickle 进行 长期对象存储不受支持，并强烈反对。

安全提示：应该只从可信来源加载 pickle 数据，因为否则 pickle.load 可能会导致任意代码执行，从而导致严重的安全漏洞。

安装

最新版本的 cloudpickle 可从 pypi 获取

pip install cloudpickle

示例

序列化 lambda 表达式

>>> import cloudpickle
>>> squared = lambda x: x ** 2
>>> pickled_lambda = cloudpickle.dumps(squared)

>>> import pickle
>>> new_squared = pickle.loads(pickled_lambda)
>>> new_squared(2)
4

序列化在 Python shell 会话中交互式定义的函数（在 __main__ 模块中）

>>> CONSTANT = 42
>>> def my_function(data: int) -> int:
...     return data + CONSTANT
...
>>> pickled_function = cloudpickle.dumps(my_function)
>>> depickled_function = pickle.loads(pickled_function)
>>> depickled_function
<function __main__.my_function(data:int) -> int>
>>> depickled_function(43)
85

重写 pickle 的序列化机制以导入可构建结构

cloudpickle 和 pickle 之间的一个重要区别是，cloudpickle 可以通过值序列化函数或类，而 pickle 只能通过引用序列化它。通过引用序列化将函数和类视为模块的属性，并通过触发模块在加载时导入的指令进行打包。因此，通过引用序列化在限制方面有限，它假设包含函数或类的模块在反序列化环境中可用/可导入。当序列化在交互会话中定义的构造时，这个假设会破裂，这种情况会被 cloudpickle 自动检测，并以值的方式对这些构造进行序列化。

另一个预期假设会破裂的情况是在分布式执行环境中开发模块时：工作进程可能无法访问该模块，例如，如果它们位于开发模块的进程所在的不同机器上。本身，cloudpickle 无法检测此类“本地可导入”的模块并切换到值序列化；相反，它依赖于其默认模式，即通过引用序列化。然而，从 cloudpickle 2.0.0 开始，可以通过使用 register_pickle_by_value(module)//unregister_pickle_by_value(module) API 显式指定应使用值序列化的模块

>>> import cloudpickle
>>> import my_module
>>> cloudpickle.register_pickle_by_value(my_module)
>>> cloudpickle.dumps(my_module.my_function)  # my_function is pickled by value
>>> cloudpickle.unregister_pickle_by_value(my_module)
>>> cloudpickle.dumps(my_module.my_function)  # my_function is pickled by reference

使用此 API，无需在所有工作节点上重新安装模块的新版本，也无需重新启动工作进程：只需重新启动具有新源代码的客户端 Python 进程即可。

请注意，此功能仍然是 实验性的，并可能在以下情况下失败

如果通过值序列化的函数/类的主体包含一个 import 语句

>>> def f():
>>> ... from another_module import g
>>> ... # calling f in the unpickling environment may fail if another_module
>>> ... # is unavailable
>>> ... return g() + 1

如果通过引用序列化的函数在其执行期间使用通过值序列化的函数。

运行测试

使用 tox，测试运行所有支持的 Python 和 PyPy 版本的测试
```
pip install tox
tox
```
或者对于特定环境
```
tox -e py312
```

使用 pytest 仅运行您当前 Python 版本的测试

pip install -r dev-requirements.txt
PYTHONPATH='.:tests' pytest

历史

cloudpickle 最初由 picloud.com 开发，并作为客户端 SDK 的一部分提供。

PySpark（Apache Spark的Python接口）中包含了一份cloudpickle.py的副本。Davies Liu、Josh Rosen、Thom Neale和其他Apache Spark开发者对该项目进行了显著改进，特别是添加了对PyPy和Python 3的支持。

cloudpickle项目的目标是使其工作成果对Spark生态系统之外更广泛的受众可用，并使其更容易进一步改进，特别是通过一个专门的回归测试套件。

项目详情

这些信息尚未由PyPI验证

项目链接

主页

发布历史发布通知 | RSS订阅

本版本

3.0.0

2023年10月16日

2.2.1

2023年1月19日

2.2.0

2022年9月7日

2.1.0

2022年5月20日

2.0.0

2021年9月10日

1.6.0

2020年8月25日

1.5.0

2020年7月1日

1.4.1

2020年4月29日

1.4.0

2020年4月27日

1.3.0

2020年2月10日

1.2.2

2019年9月10日

1.2.1

2019年6月10日

1.2.0

2019年6月7日

1.1.1

2019年5月15日

1.0.0

2019年5月6日

0.8.1

2019年3月25日

0.8.0

2019年2月13日

0.7.0

2019年1月23日

0.6.1

2018年10月10日

0.6.0

2018年10月8日

0.5.6

2018年9月13日

0.5.5

2018年8月24日

0.5.4

2018年8月24日

0.5.3

2018年5月14日

0.5.2

2017年11月21日

0.5.1

2017年11月8日

0.5.0

2017年11月8日

0.4.4

2018年5月14日

0.4.3

2018年2月13日

0.4.2

2017年11月8日

0.4.1

2017年10月26日

0.4.0

2017年8月9日

0.3.1

2017年5月31日

0.3.0

2017年5月30日

0.2.2

2017年1月2日

0.2.1

2016年2月17日

0.2.0

2016年2月17日

0.1.1

2015年9月5日

0.1.0

2015年4月13日

下载文件

下载适合您平台的文件。如果您不确定选择哪个，请了解更多关于安装包的信息。

源代码分发

cloudpickle-3.0.0.tar.gz (21.2 kB 查看哈希值)

上传时间： 2023年10月16日 源代码

构建分发

cloudpickle-3.0.0-py3-none-any.whl (20.1 kB 查看哈希值)

上传时间： 2023年10月16日 Python 3

哈希值 for cloudpickle-3.0.0.tar.gz

哈希值 for cloudpickle-3.0.0.tar.gz
算法	哈希摘要
SHA256	`996d9a482c6fb4f33c1a35335cf8afd065d2a56e973270364840712d9131a882`
MD5	`655cf0e681a77fb1d6ed0f65bb78890f`
BLAKE2b-256	`c87242a6570fc61b1f8913529728ad314c7cf5961540728dcad22c33fb2db6b6`

哈希值 for cloudpickle-3.0.0-py3-none-any.whl

哈希值 for cloudpickle-3.0.0-py3-none-any.whl
算法	哈希摘要
SHA256	`246ee7d0c295602a036e86369c77fecda4ab17b506496730f2f576d9016fd9c7`
MD5	`7d45b9b702ab6b8ff09c13b9a2e8bac4`
BLAKE2b-256	`9643dae06432d0c4b1dc9e9149ad37b4ca8384cf6eb7700cd9215b177b914f0a`

cloudpickle 3.0.0

导航

验证详情

维护者

未验证信息

项目链接

元数据

分类器

项目描述

cloudpickle

安装

示例

重写 pickle 的序列化机制以导入可构建结构

运行测试

历史

项目详情

验证详情

维护者

未验证信息

项目链接

元数据

分类器

发布历史发布通知 | RSS订阅

下载文件

源代码分发

构建分发

cloudpickle 3.0.0

导航

验证详情

维护者

未验证信息

项目链接

元数据

分类器

项目描述

cloudpickle

安装

示例

重写 pickle 的序列化机制以导入可构建结构

运行测试

历史

项目详情

验证详情

维护者

未验证信息

项目链接

元数据

分类器

发布历史 发布通知 | RSS订阅

下载文件

源代码分发

构建分发

发布历史发布通知 | RSS订阅