Docuchat ai
프로젝트 설명
이 프로젝트는 PDF 문서에서 정보를 추출하고 이해하는 것을 전문으로하는 생성 AI 챗봇입니다. 이를 통해 사용자는 여러 PDF 파일을 업로드하고 해당 문서의 내용을 기차하고 PDFS 컨텐츠와 관련된 질문을하거나 질문을 할 수 있습니다. 챗봇은 Langchain, PYPDF2 및 Streamlit을 활용하여 대화식 및 사용자 친화적 인 경험을 제공합니다.
개요
- PDFS 업로드 : 사용자는 하나 이상의 PDF 파일을 챗봇에 업로드 할 수 있습니다.
- 교육 : 챗봇은 Langchain 및 PYPDF2를 사용하여 PDF를 처리하여 텍스트 데이터를 추출하고 지식 기반을 생성합니다.
- 채팅 인터페이스 : 사용자는 PDF 문서의 범위 내에서 질문을하거나 문의하여 챗봇과 대화를 시작할 수 있습니다.
- 응답 : 챗봇은 생성 AI를 사용하여 훈련 된 지식 기반을 기반으로 의미있는 응답을 제공합니다.
- 사용자 친화적 인 :이 프로젝트는 간단한 상호 작용을 위해 Streamlit을 사용하여 사용자 친화적 인 인터페이스로 구축되었습니다.
사용 사례
PDFS 용 생성 AI 챗봇에는 다음을 포함하여 광범위한 실제 응용 프로그램이 있습니다.
- 연구 지원 : 연구자들은 학술 논문과 저널에서 정보를 신속하게 추출하여 관련 연구와 데이터를보다 쉽게 찾을 수 있습니다.
- 법률 문서 분석 : 법률 전문가는 챗봇을 사용하여 법률 문서, 계약 및 판례법을 검토하여 특정 질문에 답변 할 수 있습니다.
- 교육 지원 : 학생과 교육자는 챗봇을 사용하여 교과서 및 연구 논문에 대한 질문을함으로써 복잡한 주제를 더 잘 이해할 수 있습니다.
- 지식 기반 생성 : 챗봇을 사용하여 PDF 컬렉션에서 지식 기반을 생성하여 데이터 검색을 용이하게 할 수 있습니다.
- 기술 문서 : 개발자와 엔지니어는 챗봇을 사용하여 기술 매뉴얼 및 문서에서 특정 정보를 검색 할 수 있습니다.
- 규정 준수 및 규제 쿼리 : 준수 담당자는 챗봇에 의존하여 규정 준수 문서를 쿼리하여 규정을 준수 할 수 있습니다.
기술 스택
- Langchain : Langchain은 텍스트 추출 및 이해를 포함한 자연 언어 처리 (NLP) 작업에 사용됩니다.
- PYPDF2 : PYPDF2는 PDF 문서에서 텍스트 내용을 추출하는 데 사용됩니다.
- sleamlit : sleamlit은 챗봇에 대한 사용자 친화적 인 웹 인터페이스를 작성하는 데 사용되는 프레임 워크입니다.
- 생성 AI :이 프로젝트는 생성 AI 기술을 통합하여 PDF의 내용에 따라 응답을 생성합니다.
- Python :이 프로젝트는 주로 Python에서 개발되었습니다.
배포 된 링크
라이브 데모
시작하기
이 프로젝트를 로컬로 운영하려면 다음을 수행하십시오.
- 저장소 복제 :
git clone https://github.com/ShashankGupta10/DocuChat-AI.git
cd DocuChat-AI
pip install -r requirements.txt
streamlit run app.py