transformers · PyPI · Python 包索引

适用于JAX、PyTorch和TensorFlow的先进机器学习技术

这些详细信息尚未由PyPI 验证

项目链接

首页

元信息

许可证： Apache软件许可证（Apache 2.0许可证）
作者： Hugging Face团队（过去和未来）及其所有贡献者（https://github.com/huggingface/transformers/graphs/contributors）
标签 NLP, 视觉, 语音, 深度, 学习, Transformer, PyTorch, TensorFlow, JAX, BERT, GPT-2, Wav2Vec2, ViT
要求： Python >=3.8.0
提供额外功能： accelerate、agents、all、audio、benchmark、codecarbon、deepspeed、deepspeed-testing、dev、dev-tensorflow、dev-torch、flax、flax-speech、ftfy、integrations、ja、modelcreation、natten、onnx、onnxruntime、optuna、quality、ray、retrieval、ruff、sagemaker、sentencepiece、serving、sigopt、sklearn、speech、testing、tf、tf-cpu、tf-speech、tiktoken、timm、tokenizers、torch、torch-speech、torch-vision、torchhub、video、vision

项目描述

Hugging Face Transformers Library

英语 | 简体中文 | 繁體中文 | 한국어 | Español | 日本語 | हिन्दी | Русский | Рortuguês | తెలుగు | Français | Deutsch | Tiếng Việt | العربية | اردو |

适用于JAX、PyTorch和TensorFlow的先进机器学习技术

🤗 Transformers提供了数千个预训练模型，以在文本、视觉和音频等不同模态上执行任务。

这些模型可以应用于以下方面：

📝 文本，如文本分类、信息提取、问答、摘要、翻译和文本生成，支持超过100种语言。
🖼️ 图片，如图像分类、目标检测和分割。
🗣️ 音频，如语音识别和音频分类。

Transformer模型还可以在多种模态结合的情况下执行任务，如表格问答、光学字符识别、从扫描文档中提取信息、视频分类和视觉问答。

🤗 Transformers提供了API，可以快速下载和使用这些预训练模型，在给定的文本上进行微调，然后在我们的模型库上与社区共享。同时，每个定义架构的Python模块都是完全独立的，可以修改以进行快速研究实验。

🤗 Transformers由最流行的三个深度学习库——Jax、PyTorch和TensorFlow——支持，它们之间具有无缝集成。在加载其中一个进行推理之前，使用其中一个训练模型非常简单。

在线演示

您可以直接从模型库的页面测试我们的大部分模型。我们还提供私有模型托管、版本控制和推理API，用于公共和私有模型。

以下是一些示例：

在自然语言处理中

在计算机视觉领域

在音频领域

在多模态任务中

使用Transformers的100个项目

Transformers不仅仅是一个使用预训练模型的工具包：它是一个围绕它和Hugging Face Hub构建的项目社区。我们希望Transformers能够帮助开发者、研究人员、学生、教授、工程师以及任何其他人构建他们的梦想项目。

为了庆祝Transformers的10万个星星，我们决定将焦点放在社区上，并创建了一个awesome-transformers页面，列出了在Transformers周围构建的100个令人难以置信的项目。

如果你拥有或使用一个你认为应该列入该列表的项目，请打开一个PR来添加它！

如果你需要Hugging Face团队提供的定制支持

快速浏览

要立即在给定输入（文本、图像、音频等）上使用模型，我们提供了pipeline API。Pipelines将预训练模型与其在训练期间使用的预处理结合起来。以下是如何快速使用pipeline来对正负文本进行分类的示例

>>> from transformers import pipeline

# Allocate a pipeline for sentiment-analysis
>>> classifier = pipeline('sentiment-analysis')
>>> classifier('We are very happy to introduce pipeline to the transformers repository.')
[{'label': 'POSITIVE', 'score': 0.9996980428695679}]

代码的第二行下载并缓存了pipeline使用的预训练模型，而第三行则在给定的文本上评估它。这里的答案是“正面”，置信度为99.97%。

许多任务都有现成的预训练pipeline可供使用，不仅在NLP领域，在计算机视觉和语音领域也是如此。例如，我们可以轻松地从图像中提取检测到的对象

>>> import requests
>>> from PIL import Image
>>> from transformers import pipeline

# Download an image with cute cats
>>> url = "https://hugging-face.cn/datasets/huggingface/documentation-images/resolve/main/coco_sample.png"
>>> image_data = requests.get(url, stream=True).raw
>>> image = Image.open(image_data)

# Allocate a pipeline for object detection
>>> object_detector = pipeline('object-detection')
>>> object_detector(image)
[{'score': 0.9982201457023621,
  'label': 'remote',
  'box': {'xmin': 40, 'ymin': 70, 'xmax': 175, 'ymax': 117}},
 {'score': 0.9960021376609802,
  'label': 'remote',
  'box': {'xmin': 333, 'ymin': 72, 'xmax': 368, 'ymax': 187}},
 {'score': 0.9954745173454285,
  'label': 'couch',
  'box': {'xmin': 0, 'ymin': 1, 'xmax': 639, 'ymax': 473}},
 {'score': 0.9988006353378296,
  'label': 'cat',
  'box': {'xmin': 13, 'ymin': 52, 'xmax': 314, 'ymax': 470}},
 {'score': 0.9986783862113953,
  'label': 'cat',
  'box': {'xmin': 345, 'ymin': 23, 'xmax': 640, 'ymax': 368}}]

这里，我们得到了一个检测到图像中的对象的列表，每个对象周围都有一个框和一个置信度得分。这里是在左边的原始图像，右边的预测结果

你可以在这篇教程中了解更多关于pipeline API支持的任务。

除了pipeline之外，要下载和使用给定任务中的任何预训练模型，只需三行代码。以下是PyTorch版本

>>> from transformers import AutoTokenizer, AutoModel

>>> tokenizer = AutoTokenizer.from_pretrained("google-bert/bert-base-uncased")
>>> model = AutoModel.from_pretrained("google-bert/bert-base-uncased")

>>> inputs = tokenizer("Hello world!", return_tensors="pt")
>>> outputs = model(**inputs)

以下是TensorFlow的等效代码

>>> from transformers import AutoTokenizer, TFAutoModel

>>> tokenizer = AutoTokenizer.from_pretrained("google-bert/bert-base-uncased")
>>> model = TFAutoModel.from_pretrained("google-bert/bert-base-uncased")

>>> inputs = tokenizer("Hello world!", return_tensors="tf")
>>> outputs = model(**inputs)

分词器负责预训练模型期望的所有预处理，可以直接在单个字符串（如上面的示例）或列表上调用。它将输出一个字典，您可以在下游代码中使用或直接使用**参数展开操作符将字典传递给模型。

模型本身是一个常规的Pytorch nn.Module或一个TensorFlow tf.keras.Model（取决于您的后端），您可以使用它就像通常一样。有关如何将此类模型集成到经典的PyTorch或TensorFlow训练循环或如何使用我们的Trainer API快速在新数据集上进行微调的教程，请参阅这篇教程。

为什么我应该使用变压器？

易于使用的最先进模型
- 在自然语言理解与生成、计算机视觉和音频任务上表现出高性能。
- 对教育者和从业者来说入门门槛低。
- 只需学习三个类，用户界面抽象少。
- 统一API，用于使用我们所有的预训练模型。
计算成本更低，碳足迹更小。
- 研究人员可以共享训练好的模型，而不是总是重新训练。
- 从业者可以减少计算时间和生产成本。
- 数十种架构，所有模态超过40万个预训练模型。
为模型的每个阶段选择合适的框架
- 用3行代码训练最先进的模型。
- 可以在TF2.0/PyTorch/JAX框架之间自由移动单个模型。
- 无缝选择训练、评估和生产所需的正确框架。
轻松定制模型或示例以满足您的需求
- 我们为每个架构提供示例，以重现原始作者发布的结果。
- 尽可能一致地公开模型内部结构。
- 模型文件可以独立于库使用，以便快速实验。

为什么不应该使用变压器？

这个库不是一个模块化工具箱，不是神经网络构建块。故意没有在模型文件中对代码进行重构，添加额外的抽象，以便研究人员可以快速迭代每个模型，而不必深入研究额外的抽象/文件。
训练API不是旨在与任何模型一起工作，而是针对库提供的模型进行优化。对于通用机器学习循环，您应该使用另一个库（可能是加速库）。
虽然我们尽力展示尽可能多的用例，但我们示例文件夹中的脚本只是示例。预计它们不会直接适用于您特定的问题，并且您可能需要更改几行代码来适应您的需求。

安装

使用pip

此存储库已在Python 3.8+、Flax 0.4.1+、PyTorch 1.11+和TensorFlow 2.6+上进行了测试。

您应该在虚拟环境中安装🤗 Transformers。如果您不熟悉Python虚拟环境，请查看用户指南。

首先，使用您打算使用的Python版本创建一个虚拟环境，并激活它。

然后，您需要安装Flax、PyTorch或TensorFlow中的至少一个。请参阅有关您平台特定安装命令的TensorFlow安装页面、PyTorch安装页面和/或Flax和Jax安装页面。

安装了这些后端之一后，可以使用pip按以下方式安装🤗 Transformers

pip install transformers

如果您想尝试示例或需要代码的尖端版本，并且不想等待新版本发布，您必须从源安装库。

使用conda

🤗 Transformers可以使用conda按以下方式安装

conda install conda-forge::transformers

注意：从频道安装transformers已弃用。

按照Flax、PyTorch或TensorFlow的安装页面查看如何使用conda安装它们。

注意：在Windows上，您可能需要激活开发者模式才能受益于缓存。如果这不是您的选择，请在此问题中告诉我们。

模型架构

所有模型检查点由🤗 Transformers提供，无缝集成自huggingface.co 模型库，模型由用户和组织直接上传。

当前检查点数量：

🤗 Transformers目前提供以下架构：请参见此处了解每个架构的高级概述。

要检查每个模型是否有Flax、PyTorch或TensorFlow的实现，或者是否有由🤗 Tokenizers库支持的关联分词器，请参阅此表。

这些实现已在多个数据集上进行了测试（请参阅示例脚本），并且应该与原始实现的表现相匹配。您可以在文档的示例部分中找到更多关于性能的详细信息。

了解更多

章节	描述
文档	完整的API文档和教程
任务概述	🤗 Transformers支持的任务
预处理教程	使用`Tokenizer`类准备模型数据
训练和微调	在PyTorch/TensorFlow训练循环中使用🤗 Transformers提供的模型和`Trainer` API
快速浏览：微调/使用脚本	示例脚本，用于在广泛的任务上微调模型
模型共享和上传	上传并共享您微调的模型与社区

引用

我们现在有一篇关于🤗 Transformers库的论文，您可以引用此处。

@inproceedings{wolf-etal-2020-transformers,
    title = "Transformers: State-of-the-Art Natural Language Processing",
    author = "Thomas Wolf and Lysandre Debut and Victor Sanh and Julien Chaumond and Clement Delangue and Anthony Moi and Pierric Cistac and Tim Rault and Rémi Louf and Morgan Funtowicz and Joe Davison and Sam Shleifer and Patrick von Platen and Clara Ma and Yacine Jernite and Julien Plu and Canwen Xu and Teven Le Scao and Sylvain Gugger and Mariama Drame and Quentin Lhoest and Alexander M. Rush",
    booktitle = "Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing: System Demonstrations",
    month = oct,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/2020.emnlp-demos.6",
    pages = "38--45"
}

项目详情

这些详细信息尚未由PyPI 验证

项目链接

首页

元信息

许可证： Apache软件许可证（Apache 2.0许可证）
作者： Hugging Face团队（过去和未来）及其所有贡献者（https://github.com/huggingface/transformers/graphs/contributors）
标签 NLP, 视觉, 语音, 深度, 学习, Transformer, PyTorch, TensorFlow, JAX, BERT, GPT-2, Wav2Vec2, ViT
要求： Python >=3.8.0
提供额外功能： accelerate、agents、all、audio、benchmark、codecarbon、deepspeed、deepspeed-testing、dev、dev-tensorflow、dev-torch、flax、flax-speech、ftfy、integrations、ja、modelcreation、natten、onnx、onnxruntime、optuna、quality、ray、retrieval、ruff、sagemaker、sentencepiece、serving、sigopt、sklearn、speech、testing、tf、tf-cpu、tf-speech、tiktoken、timm、tokenizers、torch、torch-speech、torch-vision、torchhub、video、vision

发布历史发布通知 | RSS源

本版本

4.45.1

2024年9月26日

4.45.0

2024年9月25日

4.44.2

2024年8月22日

4.44.1

2024年8月20日

4.44.0

2024年8月6日

4.43.4

2024年8月5日

4.43.3

2024年7月26日

4.43.2

2024年7月24日

4.43.1

2024年7月23日

4.43.0

2024年7月23日

4.42.4

2024年7月11日

4.42.3

2024年6月28日

4.42.2

2024年6月28日

4.42.1

2024年6月27日

4.42.0

2024年6月27日

4.41.2

2024年5月30日

4.41.1

2024年5月22日

4.41.0

2024年5月17日

4.40.2

2024年5月6日

4.40.1

2024年4月23日

4.40.0

2024年4月18日

4.39.3

2024年4月2日

4.39.2

2024年3月28日

4.39.1

2024年3月22日

4.39.0

2024年3月21日

4.38.2

2024年3月1日

4.38.1

2024年2月22日

4.38.0

2024年2月21日

4.37.2

2024年1月29日

4.37.1

2024年1月24日

4.37.0

2024年1月22日

4.36.2

2023年12月18日

4.36.1

2023年12月14日

4.36.0

2023年12月11日

4.35.2

2023年11月15日

4.35.1

2023年11月14日

4.35.0

2023年11月2日

4.34.1

2023年10月18日

4.34.0

2023年10月3日

4.33.3

2023年9月27日

4.33.2

2023年9月15日

4.33.1

2023年9月6日

4.33.0

2023年9月5日

4.32.1

2023年8月28日

4.32.0

2023年8月22日

4.31.0

2023年7月18日

4.30.2

2023年6月13日

4.30.1

2023年6月9日

4.30.0

2023年6月8日

4.29.2

2023年5月16日

4.29.1

2023年5月11日

4.29.0

2023年5月10日

4.28.1

2023年4月14日

4.28.0

2023年4月13日

4.27.4

2023年3月29日

4.27.3

2023年3月23日

4.27.2

2023年3月20日

4.27.1

2023年3月15日

4.27.0

2023年3月15日

4.26.1

2023年2月9日

4.26.0

2023年1月24日

4.25.1

2022年12月1日

4.25.0 已撤回

2022年12月1日

撤回此版本的原因

版本设置不正确

4.24.0

2022年11月1日

4.23.1

2022年10月11日

4.23.0

2022年10月10日

4.22.2

2022年9月27日

4.22.1

2022年9月16日

4.22.0

2022年9月14日

4.21.3

2022年9月5日

4.21.2

2022年8月24日

4.21.1

2022年8月4日

4.21.0

2022年7月27日

4.20.1

2022年6月21日

4.20.0

2022年6月16日

4.19.4

2022年6月10日

4.19.3

2022年6月9日

4.19.2

2022年5月16日

4.19.1

2022年5月13日

4.19.0

2022年5月12日

4.18.0

2022年4月6日

4.17.0

2022年3月3日

4.16.2

2022年1月31日

4.16.1

2022年1月28日

4.16.0

2022年1月27日

4.15.0

2021年12月22日

4.14.1

2021年12月15日

4.14.0 已撤回

2021年12月15日

撤回此版本的原因

当TensorFlow和Onnx都在环境中时，出现循环导入

4.13.0

2021年12月9日

4.12.5

2021年11月17日

4.12.4

2021年11月16日

4.12.3

2021年11月3日

4.12.2

2021年10月29日

4.12.1

2021年10月29日

4.12.0

2021年10月28日

4.11.3

2021年10月6日

4.11.2

2021年9月30日

4.11.1

2021年9月29日

4.11.0

2021年9月27日

4.10.3

2021年9月22日

4.10.2

2021年9月10日

4.10.1

2021年9月10日

4.10.0

2021年8月31日

4.9.2

2021年8月9日

4.9.1

2021年7月26日

4.9.0

2021年7月22日

4.8.2

2021年6月30日

4.8.1

2021年6月24日

4.8.0

2021年6月23日

4.7.0

2021年6月17日

4.6.1

2021年5月20日

4.6.0

2021年5月12日

4.5.1

2021年4月13日

4.5.0

2021年4月6日

4.4.2

2021年3月18日

4.4.1

2021年3月16日

4.4.0

2021年3月16日

4.3.3

2021年2月24日

4.3.2

2021年2月9日

4.3.1

2021年2月9日

4.3.0

2021年2月8日

4.3.0rc1 预发布版

2021年2月4日

4.2.2

2021年1月21日

4.2.1

2021年1月14日

4.2.0

2021年1月13日

4.1.1

2020年12月17日

4.1.0

2020年12月17日

4.0.1

2020年12月9日

4.0.0

2020年11月30日

4.0.0rc1 预发布版

2020年11月19日

3.5.1

2020年11月13日

3.5.0

2020年11月10日

3.4.0

2020年10月20日

3.3.1

2020年9月29日

3.3.0

2020年9月28日

3.2.0

2020年9月22日

3.1.0

2020年9月1日

3.0.2

2020年7月6日

3.0.1

2020年7月3日

3.0.0

2020年6月29日

2.11.0

2020年6月2日

2.10.0

2020年5月22日

2.9.1

2020年5月14日

2.9.0

2020年5月7日

2.8.0

2020年4月6日

2.7.0

2020年3月30日

2.6.0

2020年3月24日

2.5.1

2020年2月24日

2.5.0

2020年2月19日

2.4.1

2020年1月31日

2.4.0

2020年1月31日

2.3.0

2019年12月20日

2.2.2

2019年12月13日

2.2.1

2019年12月3日

2.2.0

2019年11月26日

2.1.1

2019年10月11日

2.1.0

2019年10月9日

2.0.0

2019年9月26日

0.1

2016年8月17日

下载文件

下载适合您平台的文件。如果您不确定选择哪个，请了解更多关于安装包的信息。

源代码分发

transformers-4.45.1.tar.gz (8.5 MB 查看散列值)

上传时间 2024年9月26日 源代码

构建分发

transformers-4.45.1-py3-none-any.whl (9.9 MB 查看散列值)

上传时间 2024年9月26日 Python 3

transformers-4.45.1.tar.gz的散列值

transformers-4.45.1.tar.gz的散列值
算法	散列摘要
SHA256	`9cace11072172df05ca6a694fcd1f5064a55b63285e492bd88f0ad1cec270f02`
MD5	`4a89dac4352158c2bcc7dc9d9045edee`
BLAKE2b-256	`151f4d4c718c178b27268e5b9fa6112ebe82e190b703a984a51b0f743168ed49`

transformers-4.45.1-py3-none-any.whl的散列值

transformers-4.45.1-py3-none-any.whl的散列值
算法	散列摘要
SHA256	`21e3f47aa7256dbbfb5215937a3168a984c94432ce3a16b7908265807d62aee8`
MD5	`67c0fa330baa5be7779e876c4393afdb`
BLAKE2b-256	`17f2f01ea29c8eff8e749d96525a17c2d3ec02656cec9a80c20fb3e74dba4b04`

transformers 4.45.1

导航

验证详细信息

维护者

未验证详细信息

项目链接

元信息

分类器

项目描述

英语 | 简体中文 | 繁體中文 | 한국어 | Español | 日本語 | हिन्दी | Русский | Рortuguês | తెలుగు | Français | Deutsch | Tiếng Việt | العربية | اردو |

适用于JAX、PyTorch和TensorFlow的先进机器学习技术

在线演示

使用Transformers的100个项目

如果你需要Hugging Face团队提供的定制支持

快速浏览

为什么我应该使用变压器？

为什么不应该使用变压器？

安装

使用pip

使用conda

模型架构

了解更多

引用

项目详情

验证详细信息

维护者

未验证详细信息

项目链接

元信息

分类器

发布历史发布通知 | RSS源

下载文件

源代码分发

构建分发

transformers 4.45.1

导航

验证详细信息

维护者

未验证详细信息

项目链接

元信息

分类器

项目描述

英语 | 简体中文 | 繁體中文 | 한국어 | Español | 日本語 | हिन्दी | Русский | Рortuguês | తెలుగు | Français | Deutsch | Tiếng Việt | العربية | اردو |

适用于JAX、PyTorch和TensorFlow的先进机器学习技术

在线演示

使用Transformers的100个项目

如果你需要Hugging Face团队提供的定制支持

快速浏览

为什么我应该使用变压器？

为什么不应该使用变压器？

安装

使用pip

使用conda

模型架构

了解更多

引用

项目详情

验证详细信息

维护者

未验证详细信息

项目链接

元信息

分类器

发布历史 发布通知 | RSS源

下载文件

源代码分发

构建分发

发布历史发布通知 | RSS源