CollegeChatbot
1.0.0
该项目是一个问答聊天机器人,旨在通过大型语言模型(LLMS),文本插件,检索提升生成(RAG)和及时的工程技术的组合来回答与全球技术学院(GAT)有关的问题。聊天机器人可以同时处理文本和音频输入,从而根据对话历史记录和预加载文档提供相关答案。
克隆存储库
git clone https://github.com/mahadev0811/CollegeChatbot.git
cd CollegeChatbot创建虚拟环境
python -m venv venv
source venv/bin/activate # On Windows use `venvScriptsactivate`安装依赖项
pip install -r requirements.txt配置API密钥
config.json文件: {
"google_api_key" : " YOUR_GOOGLE_API_KEY "
}运行应用程序
streamlit run st_app.py与聊天机器人互动
要生成初始的原始数据文件( gat_raw.txt ),请使用webscrapper.ipynb笔记本。本笔记本将其适当的URL和格式删除文本内容。
要从数据文件中生成嵌入式,请使用embedding_generator.py脚本。该脚本读取包含数据的文本文件,使用标志性模型生成嵌入式,并将嵌入方式保存为泡菜文件。
将embedding_generator.py脚本运行,并带有数据文件的路径作为参数:
python embedding_generator.py --data_file data_generation/gat_refined.txt该脚本将生成数据文件中这些段落的嵌入,并将其保存为泡菜文件( gat_embeddings.pkl )。
该项目是根据MIT许可证获得许可的 - 有关详细信息,请参见许可证文件。