OSGPT是一个功能强大的插件,旨在从指定的文件夹中动态加载文档并创建可搜索的向量数据库。它不仅提供了一种从文档查询的快速方法,而且还允许您在主机系统上执行CLI命令,无论是Linux/Unix还是Windows。
请参阅gpt4中的osgpt
想象一下,与操作系统进行对话,您可以通过聊天来毫不费力地从文件中搜索和管理您的信息。使用OSGPT,您可以做到这一点。它将文件管理转换为动态的交互式体验。不再使用多个目录或使用复杂的搜索查询来移动; OSGPT的高级搜索功能简化了跨多个目录的文档中查找信息的经常繁琐的任务。此外,其自动加载功能将自动从指定目录加载文档到可搜索的矢量数据库中,从而使您的文件立即访问。
完全控制:直接从聊天接口执行任何CLI命令。多个命令:同步执行同时处理多个命令。配置支持:配置工作目录以进行命令执行,以进行灵活性和安全性。
借助OSGPT,您可以获得两全其美的最佳状态 - 聊天机器人了解您的任务和强大的CLI引擎可以执行它们。告别杂耍多个窗口的日子,并向交互式计算打招呼。
git clone https://github.com/Ravi-Teja-konda/OSGPT.git cd OSGPT3.安装所需的Python库:
pip install -r requirements.txtworking_directory_unix:这是在UNIX/Linux系统上运行OSGPT时执行命令的工作目录。默认目录为 /TMP,为其安全性和保障推荐。
working_directory_windows:类似于UNIX设置,这是在Windows系统上运行OSGPT时将执行命令的目录。默认值为%temp%。
注意:确保您选择的目录的最低CHMOD为700,用于UNIX/Linux,并具有适当的Windows权限以维护安全性。
OpenAI_API_KEY:这是OpenAI的API键,这对于使用GPT模型至关重要。用您的实际API密钥替换占位符。
Metadata_file_path:这是存储索引数据库的元数据的地方。
主机:这是OSGPT服务器将运行的主机IP地址。默认值为0.0.0.0,这意味着可以从任何IP地址访问它。端口:这是OSGPT服务器将在其上收听传入请求的端口号。默认端口为5004。
如果主机地址有更改,请确保更新以下文件:
要开始,请使用以下命令运行插件:
python3 main . py接下来,导航到您的Chatgpt Plus帐户。在设置下,启用开发人员工具(请参阅图像以获取参考)。切换到GPT-4选项卡,然后继续进入插件存储。在插件商店页面的底部,您会找到一个名为“开发自己的插件”的链接(请参阅图像)。单击此链接,并根据需要输入您的信息。
在我的示例中,我使用了Localhost:5004。您可以使用其他端口,例如2323或8080,但请确保您的防火墙或安全软件不会阻止连接(请参阅图像)。
要使用此插件,您需要将POST请求发送到服务器的 /命令端点。该请求应包含一个带有命令字段的JSON主体,代表您希望执行的命令。
例子:
{
"command" : " echo 'Hello, World!' "
}另外,您可以通过直接指示Chatgpt来简化工作流程,说:“您可以访问我的CLI,请执行...”。其余的将为您照顾!
加载数据集OS GPT提供了从指定文件夹中动态加载文档并创建可搜索矢量数据库的能力。您可以使用此功能将名为Technical_files作为数据集的文件夹加载,然后查询以获取特定信息。
如何加载数据集以加载数据集,需要将邮政请求发送到 /load_data端点。该请求应包含一个指定folder_path和dataset_name的JSON主体。
这是一个示例请求,以加载位于/home/runner/osgpt/osgpt/technology_files的文件夹作为数据集“ technical_files”
{
"folder_path" : " /home/runner/OSGPT/OSGPT/technical_files " ,
"dataset_name" : " technical_files "
}成功执行后,您应该收到类似的回复:
{
" Database for technical_files created successfully! "
}注意:如果您的文件夹大小如此之大,则LOAD_DATA将花费大量时间来完成数据库。可能会在chatgpt接口中丢弃错误,但将创建数据库,一旦创建数据库,您会从settings.json文件中看到信息
加载数据集后,您可以查询特定信息。例如,如果您想在技术files数据库中查找与“ langchain”相关的文档或文件,则可以通过将邮政请求发送到 /query_data端点来做到这一点。
该请求应包含一个指定查询和dataset_name的JSON主体。
示例查询:要搜索Technology_files数据库中的“ Langchain”,您的JSON主体看起来像这样:
{
"query" : " ravi teja " ,
"dataset_name" : " personal_files "
}成功执行后,OS GPT将搜索技术文件数据库中的任何文件或文档,并返回相关结果。
请注意,此插件执行命令,而无需进行任何消毒或安全检查。确保仅在安全和控制的环境中使用它,并且不会将服务器公开到公共Internet。该Chatgpt插件是为开发人员设计的,不应在生产服务器上部署!仅在Localhost上使用它!
我们对GPT Vision API的即将发布感到非常兴奋。一旦它可用,我们就计划将图像分析功能集成到OSGPT中。这将使用户不仅可以查询基于文本的文档,还可以查询图像,从而解锁全新的可用性维度。请注意,在当前版本时,ChatGPT不支持同时使用插件和视觉功能。随着未来版本允许,我们期待着这种集成。
我们了解数据的价值,并且我们致力于在未来几天提供高级分析功能。无论您是使用Excel电子表格还是CSV文件,OSGPT都会提供您需要了解数据所需的工具。请继续关注更新!
欢迎捐款!请随时提交拉动请求。
如果您感谢我的工作,请考虑支持我:
此存储库是Chatgpt-Shellmaster的扩展版本,它添加了文件内容搜索和文件功能的动态加载的功能。
该项目是在“帮助世界增长?”许可证下获得许可的。请参阅许可证文件以获取详细信息