CollegeChatbot
1.0.0
該項目是一個問答聊天機器人,旨在通過大型語言模型(LLMS),文本插件,檢索提升生成(RAG)和及時的工程技術的組合來回答與全球技術學院(GAT)有關的問題。聊天機器人可以同時處理文本和音頻輸入,從而根據對話歷史記錄和預加載文檔提供相關答案。
克隆存儲庫
git clone https://github.com/mahadev0811/CollegeChatbot.git
cd CollegeChatbot創建虛擬環境
python -m venv venv
source venv/bin/activate # On Windows use `venvScriptsactivate`安裝依賴項
pip install -r requirements.txt配置API密鑰
config.json文件: {
"google_api_key" : " YOUR_GOOGLE_API_KEY "
}運行應用程序
streamlit run st_app.py與聊天機器人互動
要生成初始的原始數據文件( gat_raw.txt ),請使用webscrapper.ipynb筆記本。本筆記本將其適當的URL和格式刪除文本內容。
要從數據文件中生成嵌入式,請使用embedding_generator.py腳本。該腳本讀取包含數據的文本文件,使用標誌性模型生成嵌入式,並將嵌入方式保存為泡菜文件。
將embedding_generator.py腳本運行,並帶有數據文件的路徑作為參數:
python embedding_generator.py --data_file data_generation/gat_refined.txt該腳本將生成數據文件中這些段落的嵌入,並將其保存為泡菜文件( gat_embeddings.pkl )。
該項目是根據MIT許可證獲得許可的 - 有關詳細信息,請參見許可證文件。