OSGPT是一個功能強大的插件,旨在從指定的文件夾中動態加載文檔並創建可搜索的向量數據庫。它不僅提供了一種從文檔查詢的快速方法,而且還允許您在主機系統上執行CLI命令,無論是Linux/Unix還是Windows。
請參閱gpt4中的osgpt
想像一下,與操作系統進行對話,您可以通過聊天來毫不費力地從文件中搜索和管理您的信息。使用OSGPT,您可以做到這一點。它將文件管理轉換為動態的交互式體驗。不再使用多個目錄或使用複雜的搜索查詢來移動; OSGPT的高級搜索功能簡化了跨多個目錄的文檔中查找信息的經常繁瑣的任務。此外,其自動加載功能將自動從指定目錄加載文檔到可搜索的矢量數據庫中,從而使您的文件立即訪問。
完全控制:直接從聊天接口執行任何CLI命令。多個命令:同步執行同時處理多個命令。配置支持:配置工作目錄以進行命令執行,以進行靈活性和安全性。
借助OSGPT,您可以獲得兩全其美的最佳狀態 - 聊天機器人了解您的任務和強大的CLI引擎可以執行它們。告別雜耍多個窗口的日子,並向交互式計算打招呼。
git clone https://github.com/Ravi-Teja-konda/OSGPT.git cd OSGPT3.安裝所需的Python庫:
pip install -r requirements.txtworking_directory_unix:這是在UNIX/Linux系統上運行OSGPT時執行命令的工作目錄。默認目錄為 /TMP,為其安全性和保障推薦。
working_directory_windows:類似於UNIX設置,這是在Windows系統上運行OSGPT時將執行命令的目錄。默認值為%temp%。
注意:確保您選擇的目錄的最低CHMOD為700,用於UNIX/Linux,並具有適當的Windows權限以維護安全性。
OpenAI_API_KEY:這是OpenAI的API鍵,這對於使用GPT模型至關重要。用您的實際API密鑰替換佔位符。
Metadata_file_path:這是存儲索引數據庫的元數據的地方。
主機:這是OSGPT服務器將運行的主機IP地址。默認值為0.0.0.0,這意味著可以從任何IP地址訪問它。端口:這是OSGPT服務器將在其上收聽傳入請求的端口號。默認端口為5004。
如果主機地址有更改,請確保更新以下文件:
要開始,請使用以下命令運行插件:
python3 main . py接下來,導航到您的Chatgpt Plus帳戶。在設置下,啟用開發人員工具(請參閱圖像以獲取參考)。切換到GPT-4選項卡,然後繼續進入插件存儲。在插件商店頁面的底部,您會找到一個名為“開發自己的插件”的鏈接(請參閱圖像)。單擊此鏈接,並根據需要輸入您的信息。
在我的示例中,我使用了Localhost:5004。您可以使用其他端口,例如2323或8080,但請確保您的防火牆或安全軟件不會阻止連接(請參閱圖像)。
要使用此插件,您需要將POST請求發送到服務器的 /命令端點。該請求應包含一個帶有命令字段的JSON主體,代表您希望執行的命令。
例子:
{
"command" : " echo 'Hello, World!' "
}另外,您可以通過直接指示Chatgpt來簡化工作流程,說:“您可以訪問我的CLI,請執行...”。其餘的將為您照顧!
加載數據集OS GPT提供了從指定文件夾中動態加載文檔並創建可搜索矢量數據庫的能力。您可以使用此功能將名為Technical_files作為數據集的文件夾加載,然後查詢以獲取特定信息。
如何加載數據集以加載數據集,需要將郵政請求發送到 /load_data端點。該請求應包含一個指定folder_path和dataset_name的JSON主體。
這是一個示例請求,以加載位於/home/runner/osgpt/osgpt/technology_files的文件夾作為數據集“ technical_files”
{
"folder_path" : " /home/runner/OSGPT/OSGPT/technical_files " ,
"dataset_name" : " technical_files "
}成功執行後,您應該收到類似的回复:
{
" Database for technical_files created successfully! "
}注意:如果您的文件夾大小如此之大,則LOAD_DATA將花費大量時間來完成數據庫。可能會在chatgpt接口中丟棄錯誤,但將創建數據庫,一旦創建數據庫,您會從settings.json文件中看到信息
加載數據集後,您可以查詢特定信息。例如,如果您想在技術files數據庫中查找與“ langchain”相關的文檔或文件,則可以通過將郵政請求發送到 /query_data端點來做到這一點。
該請求應包含一個指定查詢和dataset_name的JSON主體。
示例查詢:要搜索Technology_files數據庫中的“ Langchain”,您的JSON主體看起來像這樣:
{
"query" : " ravi teja " ,
"dataset_name" : " personal_files "
}成功執行後,OS GPT將搜索技術文件數據庫中的任何文件或文檔,並返回相關結果。
請注意,此插件執行命令,而無需進行任何消毒或安全檢查。確保僅在安全和控制的環境中使用它,並且不會將服務器公開到公共Internet。該Chatgpt插件是為開發人員設計的,不應在生產服務器上部署!僅在Localhost上使用它!
我們對GPT Vision API的即將發布感到非常興奮。一旦它可用,我們就計劃將圖像分析功能集成到OSGPT中。這將使用戶不僅可以查詢基於文本的文檔,還可以查詢圖像,從而解鎖全新的可用性維度。請注意,在當前版本時,ChatGPT不支持同時使用插件和視覺功能。隨著未來版本允許,我們期待著這種集成。
我們了解數據的價值,並且我們致力於在未來幾天提供高級分析功能。無論您是使用Excel電子表格還是CSV文件,OSGPT都會提供您需要了解數據所需的工具。請繼續關注更新!
歡迎捐款!請隨時提交拉動請求。
如果您感謝我的工作,請考慮支持我:
此存儲庫是Chatgpt-Shellmaster的擴展版本,它添加了文件內容搜索和文件功能的動態加載的功能。
該項目是在“幫助世界增長?”許可證下獲得許可的。請參閱許可證文件以獲取詳細信息