CollegeChatbot
1.0.0
이 프로젝트는 대형 언어 모델 (LLMS), 텍스트-예정된 생성 (RAG) 및 신속한 엔지니어링 기술의 조합을 사용하여 GAT (Global Academy of Technology) 와 관련된 질문에 답변하도록 설계된 Q & A 챗봇입니다. 챗봇은 텍스트 및 오디오 입력을 모두 처리하여 대화 기록 및 사전로드 된 문서를 기반으로 관련 답변을 제공 할 수 있습니다.
저장소를 복제하십시오
git clone https://github.com/mahadev0811/CollegeChatbot.git
cd CollegeChatbot가상 환경을 만듭니다
python -m venv venv
source venv/bin/activate # On Windows use `venvScriptsactivate`종속성을 설치하십시오
pip install -r requirements.txtAPI 키를 구성합니다
config.json 파일을 만듭니다. {
"google_api_key" : " YOUR_GOOGLE_API_KEY "
}응용 프로그램을 실행하십시오
streamlit run st_app.py챗봇과 상호 작용하십시오
초기 원시 데이터 파일 ( gat_raw.txt )을 생성하려면 webscrapper.ipynb 노트북을 사용하십시오. 이 노트북은 주어진 URL에서 텍스트 내용을 긁어 내고 적절하게 형식을 형식화합니다.
데이터 파일에서 임베딩을 생성하려면 embedding_generator.py 스크립트를 사용하십시오. 이 스크립트는 데이터가 포함 된 텍스트 파일을 읽고, 플래그 딩 모델을 사용하여 임베딩을 생성하며, 임베딩을 피클 파일로 저장합니다.
인수로 데이터 파일의 경로를 사용하여 indedding_generator.py 스크립트를 실행하십시오.
python embedding_generator.py --data_file data_generation/gat_refined.txt 스크립트는 데이터 파일의 단락에 대한 임베딩을 생성하고 피클 파일 ( gat_embeddings.pkl )으로 저장합니다.
이 프로젝트는 MIT 라이센스에 따라 라이센스가 부여됩니다. 자세한 내용은 라이센스 파일을 참조하십시오.