Genaius KT는 회사 내에서 지식 관리를 위해 설계된 Q & A 챗봇입니다. 그것은 직원, 특히 새로운 인턴과 연수생을 지속적으로 그리고 이전 프로젝트를 이해하는 데 도움이됩니다. 챗봇은 교육 내용 및 프로젝트 세부 사항과 관련된 쿼리에 응답하여 지식 전송이 원활하고 효율적입니다.
GenAIus/
├── backend/
│ ├── Data/
│ │ └── (Initial raw data of multiple formats)
│ ├── DataChunks/
│ │ └── (Extracted data chunks from all_extracted_data.txt)
│ ├── Downloads/
│ │ └── (Connected with MongoDB to download data)
│ ├── AllCleanData.txt
│ ├── ExtractedRawData.txt
│ ├── app.py
│ ├── cleaningChunks.py
│ ├── downloadRawFiles.py
│ ├── embeddings.json
│ ├── environment.yml
│ ├── extractor.py
│ ├── model.py
│ ├── ScrapeHTML.py
│ ├── splittingDataToChunks.py
│ └── uploadRawFiles.py
├── frontend/
│ └── (Next.js files)
├── README.md
└── LICENSEGenaius 챗봇의 파이프 라인은 여러 단계로 구성됩니다.
파이프 라인의 첫 번째 단계는 다음을 포함하여 다양한 회사 문서에서 데이터를 수집하는 것입니다.
회사 데이터는 종종 기밀이기 때문에 더미이지만 사실적인 데이터는 이러한 형식으로 생성되었습니다.
텍스트 데이터 추출은 다양한 파일 형식의 내용을 읽고 통합 텍스트 파일 ( ExtractedRawData.txt )에 저장하는 여러 파이썬 라이브러리를 사용하여 수행됩니다. 사용 된 라이브러리에는 다음이 포함됩니다.
osdocxcsvopenpyxlPyPDF2cv2pytesseractpptxselenium (웹 기반 데이터 용) 추출 된 텍스트 데이터는 Google Gemini AI 모델을 사용하여 전처리됩니다. 큰 데이터 세트가 주어지면 데이터는 작은 조각으로 뭉쳐져 배치로 처리됩니다. 정리 된 데이터는 AllCleanData.txt 라는 파일에 저장됩니다.
이 프로젝트는 데이터 청소 및 교육 부품에 Gemini API 키를 활용합니다. 프로젝트를 복제하거나 포킹 한 후 .env 파일의 자리 표시자를 자신의 Gemini API 키로 교체하십시오.
데이터가 정리되면 다음 단계는 Gemini AI 모델을 사용하여 벡터 임베딩을 생성하는 것입니다. 챗봇은 이러한 임베딩을 사용하여 사용자 쿼리를 기반으로 관련 정보를 검색하여 도메인에 집중할 수 있도록합니다.
플라스크 백엔드는 프론트 엔드를 챗봇의 처리 로직에 연결하는 데 도움이됩니다. 백엔드는 사용자 인터페이스와 AI 모델 간의 요청 및 응답을 처리합니다.
사용자 인터페이스는 Next.js를 사용하여 구축되며 직원이 Genaius Chatbot과 상호 작용할 수있는 사용자 친화적 인 채팅 인터페이스를 제공합니다. 프론트 엔드 디자인은 접근성과 사용 편의성을 강조합니다.
로컬로 프로젝트를 설정하려면 다음 단계를 따르십시오.
저장소 복제 :
git clone https://github.com/Pree-04/Team-GenAIus
cd GenAIus
중요 : 프로젝트를 복제하거나 포킹 한 후 프로젝트 파일을 저장 한 각 지역 경로를 반영하기 위해 코드의 디렉토리와 경로를 변경하십시오.
백엔드 종속성 설치 : CD 백엔드 PIP 설치 -R 요구 사항 .txt
Frontend : CD Frontend NPM 설치를 설정하십시오
백엔드 디렉토리에서 .env 파일을 만들고 Gemini API 키를 추가하십시오. gemini_api_key = Your_gemini_api_key_here
백엔드 서버를 실행하려면 : CD 백엔드 Python app.py
프론트 엔드를 시작하려면 : CD Frontend NPM Run Dev
챗봇과 상호 작용하려면 http : // localhost : 3000을 방문하십시오.
엔드 투 엔드 통합 : 챗봇의 포괄적 인 통합으로 웹 애플리케이션을 완전히 배포하여 접근성을 향상시킵니다. 계층 적 액세스 제어 : 조직 내 직원의 위치에 따라 기밀 데이터에 대한 액세스를 제한하는 기능을 구현합니다. 이를 통해 민감한 정보가 적절한 간격을 가진 사람들에게만 액세스 할 수 있습니다.
기부금을 환영합니다! 풀 요청을 작성하거나 토론을위한 문제를 열어주십시오.
이 프로젝트는 MIT 라이센스에 따라 라이센스가 부여됩니다. 자세한 내용은 라이센스 파일을 참조하십시오.