PDF 질문 응답 시스템 검색 증명 세대 (RAG)
이 프로젝트는 PDF 문서에서 컨텍스트 인식 답변을 추출하고 제공하도록 설계된 정교한 질문 응답 시스템입니다. Advanced Recreval-Augmented Generation (RAG) 기술과 최신 AI 모델을 통합 함으로써이 시스템을 통해 사용자는보다 효율적이고 지능적인 방식으로 문서와 상호 작용할 수 있습니다.
사용 사례
- 학업 연구 : 연구 논문, 보고서 또는 연구에서 통찰력을 신속하게 추출합니다.
- 전문 분석 : 긴 계약, 백색 인 또는 매뉴얼을 쉽게 탐색하십시오.
- 일상적인 사용 : 밀도가 높거나 복잡한 PDF 문서와의 상호 작용을 단순화합니다.
주요 기능
- PDF 처리 : 분석을위한 PDF 문서를 업로드 및 처리합니다.
- 대화식 Q & A : 자연스러운 질문을 입력하고 문서 내용에 따라 정확한 답변을받습니다.
- 고급 검색 : 정확한 컨텐츠 검색을 위해 벡터 기반 인덱싱 및 유사성 스코어링을 사용합니다.
- 사용자 친화적 인 인터페이스 : Streamlit으로 구축 된 웹 응용 프로그램은 사용 편의성과 접근성을 보장합니다.
사용 된 기술
FRONTEND : TRIMLIT BACKEND : PYTHON MACHORENCE LEARCINE : 문서 색인을위한 텍스트 생성 벡터 스토어 인덱스를위한 포옹 페이스 트랜스포머 사용자 지정 리트리버 및 우편 프로세서 개선 정확도.
설치 및 설정
- 저장소 복제 :
git clone https://github.com/your-repo-name.git
cd your-repo-name
- 응용 프로그램 실행 : 간소화 응용 프로그램을 시작하십시오.
PDF를 업로드하고 쿼리를 시작하십시오
- 응용 프로그램 인터페이스를 통해 원하는 PDF 파일을 업로드하십시오.

- 질문을 입력하고 상황에 맞는 정확한 응답을 검색하십시오.

작동 방식
PDF 처리 :
- 시스템은 업로드 된 PDF를 읽고 처리하여 인덱싱을 위해 관리 가능한 청크로 나눕니다.
정보 검색 :
- 인덱스 된 컨텐츠는 고급 임베딩 및 유사성 스코어링을 사용하여 검색됩니다.
답변 세대 :
- 미리 훈련 된 언어 모델은 검색된 컨텐츠에 따라 상황을 인식하고 간결한 응답을 생성합니다.
기술 스택
- 프론트 엔드 : 대화식 및 직관적 인 사용자 경험을 위해 간소화.
- 백엔드 :
- 자연어 이해와 세대를위한 포옹 페이스 변압기.
- 맞춤 임베딩을 사용한 벡터 기반 검색.
- 프로그래밍 언어 : 파이썬.
코드 개요
app.py
- 사용자 인터페이스를 제공하는 유선 응용 프로그램.
- PDF 업로드, 질문 입력 및 표시를 처리합니다.
rag.py
- 핵심 래그 논리를 구현합니다.
- PDF 처리 : PDF를 관리 가능한 청크로 읽고 나눕니다.
- 인덱싱 : 효율적인 컨텐츠 검색을위한 벡터 인덱스를 만듭니다.
- 쿼리 엔진 : 리트리버 및 후 프로세서를 사용하여 쿼리에 답변합니다.
- 응답 생성 : 변압기 모델을 사용하여 자세한 응답을 생성합니다.
사용 지침
- PDF 파일을 업로드하십시오.
- 시스템이 문서를 처리 할 때까지 기다립니다.
- 질문을 입력하고 "답변 받기"를 클릭하십시오.
- 시스템에서 생성 된 답변을보십시오.
향후 향상
- 다중 문서 지원 : 여러 PDF 파일에서 쿼리를 활성화합니다.
- 다국어 지원 : 여러 언어로 문서 처리에 대한 지원을 추가하십시오.
- GPU 지원 : 더 빠른 처리 및 응답 시간을 위해 GPU 가속도를 구현합니다.
- 추가 형식 : DOCX 및 TXT와 같은 다른 문서 형식으로 지원을 확장하십시오.
- 향상된 UI : 고급 분석 및 시각화 기능으로 사용자 인터페이스를 향상시킵니다.
기여
우리는 지역 사회의 기여를 환영합니다. 기여 :
- 저장소를 포크하십시오.
- 기능 분기를 만듭니다.
- 기부금을 자세히 설명하는 풀 요청을 제출하십시오.
문제 나 제안에 대해서는 저장소에 대한 토론 또는 문제를 열어주십시오.
특허
이 프로젝트는 MIT 라이센스에 따라 라이센스가 부여됩니다. 라이센스의 조건에 따라 사용, 수정 및 배포하십시오.
연락하다
문의 나 추가 정보는 저장소 문제 추적기 또는 이메일을 통해 문의하십시오 (해당되는 경우).