farm-haystack · PyPI · Python 包索引

LLM框架，用于构建可定制的、生产就绪的LLM应用程序。将组件（模型、向量数据库、文件转换器）连接到可以与您的数据进行交互的管道或代理。

这些详细信息尚未由PyPI验证

项目链接

元信息

许可证：自由分发，Apache软件许可证
作者： deepset.ai
标签 BERT, QA, 问题回答, 读者, 检索器, albert, 语言模型, mrc, roberta, 搜索, 语义搜索, squad, 迁移学习, transformer
要求： Python >=3.8
提供额外功能： all、all-gpu、audio、aws、colab、crawler、dev、docstores、docstores-gpu、elasticsearch、elasticsearch7、elasticsearch8、faiss、faiss-gpu、file-conversion、formatting、inference、metrics、mongodb、ocr、only-faiss、only-faiss-gpu、only-pinecone、onnx、onnx-gpu、opensearch、pdf、pinecone、preprocessing、ray、sql、weaviate

项目描述


CI/CD
文档
包
元信息

Haystack 是一个端到端的自然语言处理框架，它使您能够构建由LLMs、Transformer模型、向量搜索等功能驱动的应用程序。无论您是想执行问答、回答生成、语义文档搜索，还是构建能够进行复杂决策和查询解决的工具，您都可以使用Haystack中的最先进的NLP模型来构建端到端的NLP应用程序，以解决您的用例。

核心概念

🏃‍♀️ 流水线: 这是Haystack的标准结构，它基于您的数据执行各种NLP任务，例如检索增强生成、问答等。流水线中的数据从一个节点流到下一个节点。您定义节点如何相互交互以及一个节点如何将数据推送到下一个节点。

一个示例流水线可能包含一个 Retriever 节点和一个 PromptNode。当流水线在查询下运行时，Retriever首先从您的数据中检索与查询相关的上下文，然后PromptNode使用LLM生成最终答案。

⚛️ 节点: 每个节点完成一项功能。例如，预处理文档、检索文档、使用语言模型回答问题等。

🕵️ 智能体: （自1.15起）智能体是一个由LLM（如GPT-3）驱动的组件，它可以决定下一步的最佳行动以获取查询的结果。它使用可用的工具来实现这一点。虽然流水线有一个明确的开始和结束，但智能体能够决定查询是否已经解决。它还可以使用流水线作为工具。

🛠️ 工具: 您可以将工具视为一位专家，能够真正擅长某件事。例如，一个好的计算器擅长数学。或者一个 WebRetriever，擅长从互联网检索页面。Haystack中的节点或流水线也可以用作工具。工具是智能体使用的组件，用于解决复杂的查询。

🗂️ 文档存储: 文档存储是一个数据库，您在其中存储文本数据以供Haystack访问。Haystack文档存储包括ElasticSearch、Opensearch、Weaviate、Pinecone、FAISS等。有关可用的文档存储的完整列表，请参阅我们的文档。

使用Haystack可以构建什么

通过使用可用的向量数据库并自定义您的LLM交互来构建 检索增强生成（RAG），无限可能🚀
在自然语言中执行问答，以找到您文档中的粒度答案。
执行语义搜索并按照意义检索文档。
构建能够做出复杂决策以回答复杂查询的应用程序：例如，可以解决复杂客户查询、在许多不相关资源上进行知识搜索的系统等。
使用现成的模型或根据您的数据进行微调。
使用用户反馈来评估、基准测试并持续改进您的模型。

功能

最新模型：Haystack 允许您使用和比较来自 OpenAI、Cohere 和 Hugging Face 的模型，以及您自己的本地模型或 SageMaker 上托管的模型。使用最新的 LLM 或基于 Transformer 的模型（例如：BERT、RoBERTa、MiniLM）。
模块化：多种选择以适应您的技术堆栈和用例。广泛的选择用于存储您的数据的 DocumentStores、文件转换工具等。
开放：与 Hugging Face 的模型中心、OpenAI、Cohere 和各种 Azure 服务集成。
可扩展：使用检索器和生产规模组件（如 Elasticsearch 和快速 API REST API）扩展到数百万文档。
端到端：所有工具都在一个地方：文件转换、清理、分割、训练、评估、推理、标记等。
可定制：针对您的领域微调模型或实现您自己的节点。
持续学习：从生产中的用户反馈收集新的训练数据，并持续改进您的模型。

资源


📒 文档	组件、流水线节点、指南、API 参考
💾 安装	如何安装 Haystack
🎓 教程	查看 Haystack 可以做什么，包括我们的笔记本和脚本
🎉 Haystack 附加组件	一个列出可单独安装的额外 Haystack 软件包和组件的仓库。
🔰 演示	包含 Haystack 演示应用程序的仓库，使用 Docker Compose 和 REST API
🖖 社区	Discord、𝕏 (Twitter)、Stack Overflow、GitHub 讨论区
💙 贡献	我们欢迎所有贡献！
📊 基准测试	检索器、阅读器和 DocumentStores 的速度和准确性
🔭 路线图	Haystack 的公共路线图
📰 博客	了解 Haystack 和 NLP 的最新动态
☎️ 招聘	我们在招聘！请查看我们的空缺职位

💾 安装

有关详细安装指南，请参阅官方文档。在那里您将找到处理 Windows 和 Apple Silicon 的自定义安装说明。

基本安装

使用 pip 安装 Haystack 最新版本的基版本

pip install farm-haystack

此命令安装了基本 Pipelines 所需的一切，这些 Pipelines 使用内存中的 DocumentStore 和外部 LLM 提供程序（例如 OpenAI）。

完整安装

要使用更高级的功能，例如某些 DocumentStores、使用本地 Transformer 模型进行推理、FileConverters、OCR 或 Ray，您需要安装其他依赖项。以下命令安装 Haystack 的最新版本及其所有依赖项

pip install 'farm-haystack[all]' ## or 'all-gpu' for the GPU-enabled dependencies

如果您只想安装本地硬件上模型推理所需的依赖项（而不是远程 API 端点），例如 torch 和 sentence-transformers，则可以使用以下命令

pip install 'farm-haystack[inference]' ## installs torch, sentence-transformers, sentencepiece, and huggingface-hub

如果您想尝试尚未正式发布的最新功能，可以使用以下命令从主分支安装不稳定版本：

pip install git+https://github.com/deepset-ai/haystack.git@main#egg=farm-haystack

要修改Haystack代码，首先克隆此仓库：

git clone https://github.com/deepset-ai/haystack.git

然后进入克隆的文件夹，使用pip安装项目，包括开发依赖项：

cd haystack && pip install -e '.[dev]'

如果您想为Haystack仓库做出贡献，请首先查看我们的贡献指南。

查看依赖项列表，以检查您想安装的依赖项（例如，[all]、[dev]或其他）。

安装REST API：

Haystack附带REST API，以便您可以将其作为服务部署。从Haystack仓库的根目录运行以下命令来安装REST_API：

pip install rest_api/

您可以在我们的PyPi页面上了解更多关于我们的PyPi包的信息。

🔰演示

您可以在我们的haystack-demos仓库中找到一些托管演示，以及如何在本地运行它们的说明。

:dizzy: 使用检索增强减少幻觉 - LLM的生成式问答

🐥 我应该关注吗？ - 使用LLM总结推文

🌎 探索世界 - 提取式问答

🖖社区

如果您有功能请求或错误报告，请随时在Github上打开一个问题。我们会定期检查这些，并期待快速响应。如果您想讨论某个主题，或获得有关如何使Haystack适应您的项目的更一般性建议，您可以在Github讨论或我们的Discord频道中发起一个话题。我们还会查看𝕏 (Twitter)和Stack Overflow。

💙 贡献

我们非常欢迎社区的贡献——无论是快速修复一个错别字，还是完全新的功能！您不需要是Haystack专家就能提供有意义的改进。要了解如何开始，请首先查看我们的贡献指南。

谁使用Haystack

以下是一些使用Haystack的项目和公司列表。想添加您的吗？请打开一个PR，将其添加到列表中，让世界知道您使用Haystack！

项目详情

这些详细信息尚未由PyPI验证

项目链接

元信息

许可证：自由分发，Apache软件许可证
作者： deepset.ai
标签 BERT, QA, 问题回答, 读者, 检索器, albert, 语言模型, mrc, roberta, 搜索, 语义搜索, squad, 迁移学习, transformer
要求： Python >=3.8
提供额外功能： all、all-gpu、audio、aws、colab、crawler、dev、docstores、docstores-gpu、elasticsearch、elasticsearch7、elasticsearch8、faiss、faiss-gpu、file-conversion、formatting、inference、metrics、mongodb、ocr、only-faiss、only-faiss-gpu、only-pinecone、onnx、onnx-gpu、opensearch、pdf、pinecone、preprocessing、ray、sql、weaviate

发布历史发布通知 | RSS源

本版本

1.26.3

2024年8月29日

1.26.3rc1 预发布

2024年6月19日

1.26.2

2024年6月6日

1.26.1

2024年6月5日

1.26.0

2024年6月4日

1.26.0rc1 预发布

2024年6月3日

1.25.5

2024年4月24日

1.25.4

2024年4月23日

1.25.3

2024年4月23日

1.25.2

2024年4月2日

1.25.1

2024年3月25日

1.25.0

2024年3月4日

1.25.0rc1 预发布

2024年2月29日

1.24.1

2024年2月8日

1.24.1rc1 预发布

2024年2月8日

1.24.0

2024年1月25日

1.24.0rc1 预发布

2024年1月24日

1.23.0

2023年12月14日

1.23.0rc1 预发布

2023年12月14日

1.23.0rc0 预发布

2023年11月6日

1.22.1

2023年11月9日

1.22.0

2023年11月7日

1.22.0rc3 预发布

2023年11月3日

1.22.0rc2 预发布

2023年11月2日

1.22.0rc1 预发布

2023年10月30日

1.22.0rc0 预发布

2023年11月5日

1.21.2

2023年10月6日

1.21.2rc1 预发布

2023年10月5日

1.21.1

2023年10月4日

1.21.1rc2 预发布

2023年10月4日

1.21.1rc1 预发布

2023年10月3日

1.21.0

2023年9月27日

1.21.0rc1 预发布

2023年9月26日

1.21.0rc0 预发布

2023年11月2日

1.20.2rc0 预发布

2023年9月20日

1.20.1

2023年9月12日

1.20.0

2023年9月4日

1.20.0rc1 预发布

2023年8月30日

1.19.0

2023年7月26日

1.19.0rc2 预发布

2023年7月26日

1.19.0rc1 预发布

2023年7月24日

1.18.1

2023年6月30日

1.18.0

2023年6月29日

1.18.0rc2 预发布

2023年6月27日

1.18.0rc1 预发布

2023年6月26日

1.17.2

2023年6月19日

1.17.2rc1 预发布

2023年6月16日

1.17.1

2023年6月5日

1.17.0

2023年5月30日

1.17.0rc2 预发布

2023年5月24日

1.17.0rc1 预发布

2023年5月23日

1.16.1

2023年4月28日

1.16.1rc1 预发布

2023年4月28日

1.16.0

2023年4月27日

1.16.0rc2 预发布

2023年4月26日

1.16.0rc1 预发布

2023年4月26日

1.15.1

2023年4月3日

1.15.1rc1 预发布

2023年3月31日

1.15.0

2023年3月30日

1.15.0rc5 预发布

2023年3月29日

1.15.0rc4 预发布

2023年3月29日

1.15.0rc3 预发布

2023年3月28日

1.15.0rc2 预发布

2023年3月28日

1.15.0rc1 预发布

2023年3月27日

1.14.0

2023年2月28日

1.14.0rc2 预发布

2023年2月22日

1.14.0rc1 预发布

2023年2月20日

1.13.2

2023年2月9日

1.13.2rc0 预发布

2023年2月9日

1.13.1

2023年2月3日

1.13.1rc1 预发布

2023年2月2日

1.13.0

2023年1月31日

1.13.0rc2 预发布

2023年1月31日

1.13.0rc1 预发布

2023年1月27日

1.12.2

2022年12月22日

1.12.2rc1 预发布

2022年12月22日

1.12.1

2022年12月21日

1.12.0

2022年12月21日

1.12.0rc2 预发布

2022年12月20日

1.12.0rc1 预发布

2022年12月14日

1.11.1

2022年12月6日

1.11.1rc1 预发布

2022年12月6日

1.11.0

2022年11月21日

1.11.0rc0 预发布

2022年11月17日

1.10.0

2022年10月25日

1.10.0rc1 预发布

2022年10月20日

1.9.1

2022年10月10日

1.9.1rc1 预发布

2022年10月10日

1.9.0

2022年9月26日

1.9.0rc3 预发布

2022年9月22日

1.9.0rc2 预发布

2022年9月22日

1.9.0rc1 预发布

2022年9月21日

1.8.0

2022年8月26日

1.7.1

2022年8月19日

1.7.0

2022年8月15日

1.6.0

2022年7月6日

1.5.0

2022年6月2日

1.4.0

2022年5月5日

1.3.0

2022年3月23日

1.2.0

2022年2月23日

1.1.0

2022年1月20日

1.0.0

2021年12月8日

0.10.0

2021年9月16日

0.9.0

2021年6月21日

0.8.0

2021年4月13日

0.7.0

2021年1月21日

0.6.0

2020年12月17日

0.5.0

2020年11月6日

0.4.0

2020年9月21日

0.3.0

2020年7月16日

0.2.1

2020年5月5日

0.2.0.post1

2020年5月5日

0.1.0.post2

2019年11月28日

下载文件

下载适用于您平台的文件。如果您不确定选择哪个，请了解更多关于安装包的信息。

源分发

farm_haystack-1.26.3.tar.gz (623.0 kB 查看哈希值)

上传时间 2024年8月29日 源

构建分发

farm_haystack-1.26.3-py3-none-any.whl (763.9 kB 查看哈希值)

上传时间 2024年8月29日 Python 3

哈希值 for farm_haystack-1.26.3.tar.gz

farm_haystack-1.26.3.tar.gz 的哈希值
算法	哈希摘要
SHA256	`8ad342e5390cc8842cff6213853783079ea2fb30cc95d1513299038a4b2f0bcc`
MD5	`c5edb2c1d14275cfd93ed00c0fcb06a8`
BLAKE2b-256	`5a195a5145869f052509a89b6253c1ccead85e9d71e0da97141f53574201f0e9`

哈希值 for farm_haystack-1.26.3-py3-none-any.whl

farm_haystack-1.26.3-py3-none-any.whl 的哈希值
算法	哈希摘要
SHA256	`ab43d173543d24afa6bb30ae73d30d17cca81ff50804f0e588f0e07329bb7770`
MD5	`90145b798b9c7326a63d896eb5610532`
BLAKE2b-256	`a8e0046774ba4f545ff6a5249f0effbfd5948920550a0485e3197de7051e810f`

farm-haystack 1.26.3

导航

验证详细信息

维护者

未验证的详细信息

项目链接

元信息

分类器

项目描述

核心概念

使用Haystack可以构建什么

功能

资源

💾 安装

🔰演示

🖖社区

💙 贡献

谁使用Haystack

项目详情

验证详细信息

维护者

未验证的详细信息

项目链接

元信息

分类器

发布历史发布通知 | RSS源

下载文件

源分发

构建分发

farm-haystack 1.26.3

导航

验证详细信息

维护者

未验证的详细信息

项目链接

元信息

分类器

项目描述

核心概念

使用Haystack可以构建什么

功能

资源

💾 安装

🔰演示

🖖社区

💙 贡献

谁使用Haystack

项目详情

验证详细信息

维护者

未验证的详细信息

项目链接

元信息

分类器

发布历史 发布通知 | RSS源

下载文件

源分发

构建分发

发布历史发布通知 | RSS源