歡迎來到檢索增強一代(RAG)項目! ?該項目旨在在Jupyter筆記本電腦環境中使用Python代碼介紹和演示RAG的實際應用。 LlamainDex在這裡使用。我們認為,學習和實驗抹布應該是教育和樂趣! ?
該項目分為幾個文件夾:
文件:此文件夾包含您的參考的重要文件:
readme.md :您當前正在閱讀此文件!它提供了該項目的概述。Intro of Retrieval Augmented Generation (RAG) and application demos_Henry.pdf :此文件解釋了背景信息,並提供了使用抹布的動手實驗的其他信息。這是開始的必讀! python_env :在此文件夾中,您會找到NLP.yml文件。導入此YAML文件以創建專用的Python環境,以無縫運行代碼。
代碼: code文件夾包含三個jupyter筆記本文件,每個文件代表一個不同的實驗:
1_Basic_RAG_Pipeline.ipynb :此筆記本演示了基本的抹布管道。這是理解抹布的基本原理的好起點。2_Sentence_window_retrieval.ipynb :此筆記本探索使用抹布的句子窗口檢索的概念。發現破佈如何從特定上下文窗口中檢索信息。3_Auto-merging_Retrieval.ipynb :在此筆記本中,您將了解自動合併檢索以及它如何改善生成過程。令人興奮的東西!數據: data文件夾是您可以存儲自己感興趣的文檔以進行檢索的地方。目前,我們提供了一個名為Henry.txt的示例文件。隨時用自己的文檔替換它,以嘗試用抹布進行實驗。
常見:在此文件夾中,您會找到openAI.env文件。不要忘記在此文件中添加OpenAI API鍵,以啟用與OpenAI型號的無縫交互。
要開始您的破布旅程,請按照以下步驟:
克隆或將此項目存儲庫下載到您的本地計算機。
在python_env文件夾中導入NLP.yml文件以創建專用的Python環境。這樣可以確保正確安裝所有依賴項。
在common文件夾”中,打開openAI.env文件並輸入您的OpenAI API鍵。此步驟對於訪問OpenAI模型至關重要。
通過閱讀files文件夾中Intro of Retrieval Augmented Generation (RAG) and application demos_Henry.pdf來熟悉該項目。它提供了重要的背景信息和動手實驗。
探索三個jupyter筆記本文件( 1_Basic_RAG_Pipeline.ipynb , 2_Sentence_window_retrieval.ipynb和3_Auto-merging_Retrieval.ipynb )在code文件夾中。運行筆記本以查看抹布的行動!
通過修改提供的示例或在data文件夾中使用自己的文檔來實驗抹布。隨時發揮創造力,並為之帶來樂趣! ?
恭喜!現在,您配備了學習,申請和娛樂的必要信息和工具,並通過檢索增強發電(RAG)獲得樂趣。我們希望這個項目能夠激發您的好奇心,並鼓勵您使用提供的Jupyter筆記本探索激動人心的抹布世界。生成快樂! ?
如果您有任何疑問或需要進一步的幫助,請隨時伸出援手。享受您的破布旅程! ?