gpt all local下载 - gpt all local源代码下载

gpt all local

其他源码

1.0.0

下载

在私人数据上使用LLM，所有这些

该项目是使用大型语言模型（LLM）从私人数据中检索信息，在本地运行所有部分（包括模型）的学习练习。目的是在计算机上运行LLM，以在计算机上的一组文件上提出问题。这些文件可以是任何类型的文档，例如PDF，Word或文本文件。

这种结合LLM和私人数据的方法称为检索增强的生成（RAG）。它是在本文中引入的。

信用额度应得的信用：我基于原始Privategpt（他们称之为原始版本）。我重新完成了这些作品以了解它们的工作方式。在“来源”部分中查看更多内容。

我们要实现的目标：给定计算机上的一组文件（a），我们希望在该计算机上运行的大型语言模型（b）在它们上回答问题（c）。

我们试图实现的目标

但是，我们无法将文件直接馈送到模型。大型语言模型（LLMS）具有上下文窗口，该窗口限制了我们可以输入的信息（它们的工作记忆）。为了克服该限制，我们将文件分为较小的零件，称为块，仅将相关的文件馈送到模型（D）中。

解决方案第1部分

但是，问题变成了“我们如何找到相关的块？” 。我们使用相似性搜索（e）来匹配问题和块。相似性搜索反过来需要向量嵌入（F），这是用编码语义关系的向量的单词表示（从技术上讲，密集的向量嵌入，而不是将其与稀疏的向量表示（例如词袋和tf-idf）混淆）。一旦有了相关的块，我们就将它们与问题结合在一起，以创建一个提示（g），该提示（g）指示LLM回答问题。

解决方案第2部分

我们需要最后一块：持续存储。为块创建嵌入需要时间。我们不想每次问一个问题。因此，我们需要将嵌入和原始文本（块）保存在矢量存储（或数据库）（h）中。矢量商店可以大大生长，因为它存储了原始文本块及其矢量嵌入。我们使用矢量索引（i）有效地找到相关的块。

解决方案第3部分

现在我们有了我们需要的所有作品。

我们可以将实现分为两个部分：摄入和检索数据。

摄入：目标是将本地文件分为适合LLM输入大小（上下文窗口）的较小块。我们还需要为每个块创建向量嵌入。矢量嵌入使我们能够找到最相关的块来帮助回答问题。因为分块和嵌入需要时间，所以我们只想这样做一次，因此我们将结果保存在矢量存储（数据库）中。
检索：给出一个用户问题，我们使用相似性搜索来查找最相关的块（即与问题相关的本地文件的部分）。一旦确定了最相关的块，我们就可以使用LLM回答问题。为此，我们将用户问题与相关块结合在一起，并提示指示LLM回答问题。

以下图中说明了这两个步骤。

摄入和检索

如何使用这个项目

如果您还没有这样做，请准备环境。如果您已经准备好环境，请用source venv/bin/activate激活它。

有两种使用此项目的方法：

命令行界面：使用此命令来查看更多日志并了解正在发生的事情（请参阅下面的--verbose标志）。
简化应用程序：使用此应用程序进行更易于用户友好的体验。

命令行接口

将要使用的文件复制到data文件夹中。
运行python main.py ingest以将文件摄入矢量存储。
运行python main.py retrieve以从矢量存储中检索数据。这将提示您提出问题。

使用--verbose标志获取有关该程序在幕后所做的事情的更多详细信息。

要重新启动数据，请删除vector_store文件夹并再次运行python main.py ingest 。

简化应用程序

运行streamlit run app.py它将在浏览器窗口中打开应用程序。

该命令可能会失败，第一次运行它。 Python环境与Pyenv一起工作的地方有一个小故障。如果简化显示“无法导入模块消息”，请停用Python环境，然后deactivate其再次激活，并使用source venv/bin/activate激活，然后运行streamlit run app.py

设计

摄取数据

如果您还没有这样做，请准备环境。如果您已经准备好环境，请用source venv/bin/activate激活它。

命令： python main.py ingest [--verbose]

此阶段的目的是使数据可搜索。但是，用户的问题和数据内容可能不完全匹配。因此，我们不能使用简单的搜索引擎。我们需要执行矢量嵌入支持的相似性搜索。向量嵌入是此阶段最重要的部分。

摄入数据具有以下步骤：

加载文件：与文档类型匹配的文档读取器用于加载文件。在这一点上，我们有一系列字符，其中包含文件内容（从现在开始）。元数据，图片等被忽略。
将文档分成块：文档分离器将文档划分为指定尺寸的块。我们需要将文档分开以适合模型的上下文大小（并在使用付费模型时发送更少的令牌）。每个块的确切大小取决于文档分离器。例如，句子分离器试图在句子级别拆分，使一些块小于指定的大小。
为每个块创建向量嵌入：嵌入模型为每个块创建一个向量嵌入。这是使我们能够找到最相关的块来帮助回答问题的关键步骤。
将嵌入到矢量数据库（商店）中：坚持我们上面所做的所有工作，因此我们将来不必重复它。

未来的改进：

更聪明的文档解析。例如，请勿将图形字幕与部分文本相结合；请勿解析参考部分（或者，用实际的参考文本替换内联引用）。
改善并行性。理想情况下，我们希望每个文件并行运行整个工作流（负载文档，块，嵌入，持久）。这需要一个解决方案，该解决方案不仅可以与I/O结合，还可以使CPU结合的任务并行。向量商店还必须支持多个作家。
尝试不同的分解策略，例如检查句子分式（ NLTKTextSplitter或SpacyTextSplitter ）是否会改善答案。
根据LLM输入（上下文）大小选择块大小。目前，它的硬编码为少数数字，这可能会影响结果的质量。另一方面，它节省了LLM API的成本。我们需要找到平衡。
自动化摄入过程：检测是否有新的或更改的文件并摄取它们。

检索数据

如果您还没有这样做，请准备环境。如果您已经准备好环境，请用source venv/bin/activate激活它。

命令： python main.py retrieve [--verbose]

此阶段的目的是从本地数据中检索信息。我们通过获取矢量商店中最相关的块并将其与用户的问题和提示相结合来做到这一点。该提示指示语言模型（LLM）回答问题。

检索数据具有以下步骤：

查找最相关的块：查询矢量商店以找到问题的最相关的块。
将块与问题和提示结合在一起：将块与问题和提示结合在一起。提示指示LLM回答问题。
将组合文本发送到LLM：将组合的文本发送到LLM以获取答案。

未来的改进：

添加Langchain回调以查看检索过程的步骤。
提示仅使用本地文档中的内容回答提示，例如“仅使用以下文档中的信息：...”。没有此步骤，模型似乎梦想着培训数据的答案，这并不总是相关的。
添加适度以滤除进攻的答案。
通过重新评估改进答案： “过度取消我们的搜索结果，然后根据修饰符或一组修饰符确定性地重新启动。” 。
尝试不同的链条类型（与上一点有关）。

改善结果

我们必须做出一些妥协才能使其在合理的时间内在本地机器上运行。

我们使用一个小型模型。这个很难改变。该模型必须在CPU上运行并适合内存。
我们使用较小的嵌入尺寸。如果我们等待更长的摄入过程，我们可以增加嵌入尺寸。
保持一切相同并尝试不同的链条。

来源

大多数摄入/检索代码基于原始私人法，他们现在称为原始代码。

有什么不同：

简化UI的应用程序。
使用较新的嵌入式和大型语言模型版本。
现代化Python代码。例如，它使用pathlib而不是os.path ，并且具有正确的日志记录代替打印语句。
添加了更多的记录以了解发生了什么。使用--verbose标志查看详细信息。
添加了一个主要程序来运行摄入/检索步骤。
填写requirements.txt 。

有关在此项目开发期间收集的更多注释，请参见此文件。

准备环境

这是一个一次性步骤。如果您已经这样做了，只需使用source venv/bin/activate激活虚拟环境。

Python环境

运行以下命令以创建虚拟环境并安装所需的软件包。

python3 -m venv venv
source venv/bin/activate
pip install --upgrade pip
pip install -r requirements.txt

PDF解析

unstructured中的PDF解析器是实际解析器软件包顶部的一层。在“安装以下系统依赖项”子弹下，按照unstructured读数中的说明进行操作。需要流行式包装和Tesseract软件包（忽略其他软件包）。

模型

我建议从在CPU上运行的小型型号开始。 GPT4All在这里有模型列表。我用Mistral-7b-Openorca Q4进行了测试。它需要8 GB的RAM运行。请注意，某些模型具有限制性许可。在商业项目中使用许可之前，请先检查许可证。

创建一个名为models的文件夹。
单击此处下载Mistral 7b Openorca（3.8 GB下载，8 GB RAM）。
将模型复制到models文件夹。

展开

附加信息

版本 1.0.0
类型其他源码
更新时间 2025-05-24
大小 220.18KB
来自于 Github

gpt all local

在私人数据上使用LLM，所有这些

如何使用这个项目

命令行接口

简化应用程序

设计

摄取数据

检索数据

改善结果

来源

准备环境

Python环境

PDF解析

模型

GPT影视最新版

爱无处不在

全E

一整天都在死去

毁灭全人类

彻夜不眠

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express