Medical_ChatBot 다운로드 Medical_ChatBot 소스 코드 다운로드

Medical_ChatBot

기타 소스코드

1.0.0

다운로드

Langchain 및 Pinecone을 사용한 의료 챗봇

이 프로젝트는 의료용 PDF 책에서 정보를 검색하고 Langchain을 사용하여 처리하고 효율적인 정보 검색을 위해 Pinecone을 사용하는 의료 챗봇을 구축합니다.

특징

의료 지식 기반 : PDF 책에서 의료 정보를 추출하고 구성합니다.
Langchain 통합 : Langchain 라이브러리를 사용하여 사용자 쿼리를 처리하고 지식 기반의 관련 정보와 일치시킵니다.
- 특히 Langchain의 텍스트 처리 기능은 추가 분석을 위해 의료 텍스트를 정리하고 준비하기 위해 활용됩니다.
LLAMA2 Embeddings : 사용자 쿼리와 의료 텍스트 스 니펫 모두에 대한 상황에 맞는 임베딩을 생성하기 위해 포옹 얼굴에서 강력한 LLAMA2 모델을 사용합니다. 이를 통해 다르게 표현 된 경우에도 의미 론적 일치 및 관련 정보를 검색 할 수 있습니다.
PENECONE VECTOR DATABASE : 효율적인 검색을 위해 생성 된 임베드를 Pinecone Vector 데이터베이스에 저장합니다. 이를 통해 의료 지식 기반을 빠르고 확장 가능한 검색 할 수 있습니다.
챗봇 인터페이스 : 사용자가 챗봇과 상호 작용하고 의학적 질문을 할 수있는 사용자 친화적 인 인터페이스 (텍스트 기반 또는 잠재적 음성 기반)를 제공합니다.
HTML 및 CSS 설계 : 채팅 인터페이스는 HTML을 사용하여 설계되었으며 CSS를 사용하여 스타일링하여 직관적이고 시각적으로 매력적인 사용자 경험을 제공합니다.
FLASK 백엔드 : 응용 프로그램 백엔드는 Python의 가벼운 웹 프레임 워크 인 Flask를 사용하여 사용자 요청을 처리하고 챗봇과 상호 작용합니다.
실시간 메시징 : 사용자는 실시간으로 챗봇과 통신하여 쿼리에 대한 즉각적인 응답을받을 수 있습니다.

기술 스택

Langchain : 자연 언어 처리를위한 파이썬 라이브러리 (NLP) 워크 플로우, 텍스트 처리, 임베딩 생성 및 정보 검색 모듈을 제공합니다.
포옹 페이스 트랜스포머 : 상황에 맞는 임베딩을 생성하기 위해 LLAMA2와 같은 미리 훈련 된 NLP 모델에 대한 액세스를 제공합니다.
PENECONE : 임베딩과 같은 고차원 데이터의 효율적인 저장 및 검색을 가능하게하는 벡터 데이터베이스 서비스.
추가 라이브러리 : 선택한 인터페이스 (텍스트 기반 또는 음성 기반)에 따라 NLTK 또는 Spacy와 같은 추가 라이브러리가 추가 텍스트 처리 및 챗봇 기능에 사용될 수 있습니다.
FLASK : Chatbot의 인터페이스를 개발하고 사용자 요청을 처리하는 데 사용되는 Python의 가벼운 웹 프레임 워크.

워크 플로

지식 기반 생성 :

 from langchain_community . embeddings import HuggingFaceEmbeddings
from langchain_community . document_loaders import PyPDFLoader
from langchain . text_splitter import RecursiveCharacterTextSplitter

def create_knowledge_base ( pdf_path ):
  # Load PDF text
  loader = PyPDFLoader ( pdf_path , glob = "*.pdf" )
  text_data = loader . load ()

  # Text processing and chunking
  text_splitter = RecursiveCharacterTextSplitter ( chunk_size = 500 , chunk_overlap = 20 )
  text_chunks = text_splitter . split_documents ( text_data )

  # Download Llama2 embeddings (or your chosen model)
  embeddings = HuggingFaceEmbeddings ( model_name = "sentence-transformers/all-MiniLM-L6-v2" )

  # Generate embeddings for each text chunk
  # ... (code to generate embeddings for each chunk using embeddings object)

  # Store text chunks and embeddings in a data structure (e.g., list of dictionaries)
  knowledge_base = []
  for i , chunk in enumerate ( text_chunks ):
    chunk_embedding = embeddings . encode ( chunk )  # Generate embedding for the chunk
    knowledge_base . append ({
      "text" : chunk ,
      "embedding" : chunk_embedding
    })
  return knowledge_base

PENECONE 통합 :

 from langchain_pinecone import PineconeVectorStore
from pinecone . data . index import Index
from dotenv import load_dotenv
import os

def store_knowledge_base_in_pinecone ( knowledge_base ):
  load_dotenv ()
  PINECONE_API_KEY = os . getenv ( "PINECONE_API_KEY" )
  PINECONE_ENV = os . getenv ( "PINECONE_ENV" )
  PINECONE_INDEX_NAME = os . getenv ( "PINECONE_INDEX_NAME" )

  # Connect to Pinecone
  pc = pinecone . Pinecone ( api_key = PINECONE_API_KEY , environment = PINECONE_ENV )
  index = pc . Index ( PINECONE_INDEX_NAME )

  # Extract text and embeddings from knowledge base
  text_data = [ kb [ "text" ] for kb in knowledge_base ]
  embeddings = [ kb [ "embedding" ] for kb in knowledge_base ]

  # Store embeddings in Pinecone
  PineconeVectorStore . from_documents ( text_data , embeddings , index_name = PINECONE_INDEX_NAME )

  print ( f"Knowledge base stored in Pinecone index: { PINECONE_INDEX_NAME } " )

챗봇 인터페이스 (자리 표시 자) :

 # This section is a placeholder as the full chatbot development requires additional libraries
# like Rasa or Dialogflow. Here's a basic outline to illustrate the concept.

def chatbot_loop ():
  while True :
    user_query = input ( "Ask me a medical question (or type 'quit' to exit): " )
    if user_query . lower () == "quit" :
      break

    # Process user query (similar to text processing in knowledge base creation)
    processed_query = # (code to clean and process the user query)

    # Generate embedding for the user query
    query_embedding = embeddings . encode ( processed_query )

    # Retrieve similar text snippets from Pinecone using query embedding
    similar_results = retrieve_from_pinecone ( query_embedding )

    # Extract and present relevant information to the user
    if similar_results :
      for result in similar_results :
        print ( f"Relevant Information: { result [ 'text' ] } " )
    else :
      print ( "Sorry, I couldn't find any information related to your question." )

이익

개선 된 의료 정보 액세스 : 사용자는 사용자 친화적 인 인터페이스를 통해 PDF 책의 의료 정보에 쉽게 액세스하고 이해할 수 있습니다.
시맨틱 검색 : LLAMA2 임베딩은 사용자 쿼리가 책의 실제 텍스트와 다르게 표현되는 경우에도 관련 정보를보다 정확하게 검색 할 수 있습니다.
확장 성 : Pinecone은 지식 기반이 증가함에 따라 효율적인 정보 검색을 가능하게합니다.

추가 고려 사항

의학적 면책 조항 : 이 챗봇은 정보 제공 목적으로 만 사용되며 전문적인 의학적 조언을 대신해서는 안된다는 것을 명확하게 진술하는 것이 중요합니다. 사용자는 항상 진단 및 치료를 위해 의료 전문가와 상담해야합니다.
데이터 보안 : 의료 정보를 처리하고 저장할 때 적절한 보안 조치가 구현되도록합니다.
모델 선택 : LLAMA2는 강력한 모델이지만 PDF 책의 특정 의료 정보에 더 적합 할 수있는 포옹 얼굴에서 다른 의료 도메인 별 모델을 탐색하는 것을 고려하십시오.
챗봇 개발 : 강력한 챗봇 인터페이스를 개발하려면 대화 흐름 및 자연어 이해를 처리하기위한 RASA 또는 DialogFlow와 같은 추가 라이브러리가 필요합니다.

이 프로젝트는 의료 정보에 액세스하고 이해할 수있는 접근 가능하고 효율적인 방법을 제공하는 의료 챗봇을 만드는 데있어 Langchain과 Pinecone의 잠재력을 보여줍니다. 의료 PDF 책과 원하는 기능의 특정 요구에 맞게이 개념을 적응하고 확장해야합니다.

설치

Langchain Pinecone Vector Store 프로젝트를 설정하려면 다음을 수행하십시오.

저장소 복제 :

git clone https://github.com/ < username > / < repository > .git
cd < repository >

종속성 설치 :
```
pip install -r requirements.txt
```

환경 변수 구성 :

루트 디렉토리에서 .env 파일을 만들고 다음 변수를 지정하십시오.

 PINECONE_API_KEY=<your_pinecone_api_key>
PINECONE_ENV=<pinecone_environment>
PINECONE_INDEX_NAME=<pinecone_index_name>

용법

Pinecone 벡터 데이터베이스에 벡터를 저장하려면 다음 명령을 실행하십시오.

python store_vectors.py

기여

Langchain Pinecone Vector Store Project에 대한 기여가 권장되고 감사합니다! 향상, 버그 수정 또는 새로운 기능에 대한 아이디어가 있으면 풀 요청을 제출하십시오. 저장소에 요약 된 기여 가이드 라인을 따르십시오.

특허

이 프로젝트는 라이센스 계약에 명시된 이용 약관에 따라 무제한 사용, 배포 및 수정을 허용하는 MIT 라이센스에 따라 라이센스가 부여됩니다.

확장하다

추가 정보

버전 1.0.0
유형 기타 소스코드
업데이트 시간 2025-05-29
크기 2.7MB
출처 Github

Medical_ChatBot

Langchain 및 Pinecone을 사용한 의료 챗봇

특징

기술 스택

워크 플로

이익

추가 고려 사항

설치

용법

기여

특허

OpenCore_NO_ACPI_Build

nspanel_pro_tools_apk

zkwork_aleo_gpu_worker

nextcloud_share_url_downloader

개_여우_토끼

리화 데이터 분석 엔진 무료 버전 3.0_search_navigation_collection_여론_순위_api

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express