تنزيل Medical_ChatBot - تنزيل رمز المصدر Medical

Medical_ChatBot

شفرة المصدر الأخرى

1.0.0

تنزيل

chatbot الطبية مع langchain و pinecone

يقوم هذا المشروع ببناء chatbot طبي يسترجع المعلومات من كتاب PDF طبي ويستخدم langchain للمعالجة والثاني من أجل استرجاع المعلومات الفعالة.

سمات

قاعدة المعرفة الطبية: مقتطفات وتنظيم المعلومات الطبية من كتاب PDF.
تكامل Langchain: يستخدم مكتبات Langchain لمعالجة استعلامات المستخدم ومطابقةها مع المعلومات ذات الصلة من قاعدة المعرفة.
- على وجه التحديد ، سيتم الاستفادة من قدرات معالجة النص في Langchain لتنظيف وإعداد النص الطبي لمزيد من التحليل.
LLAMA2 تضمينات: توظف نموذج LLAMA2 القوي من الوجه المعانقة لإنشاء التضمينات السياقية لكل من استفسارات المستخدم ومقتطفات النص الطبي. هذا يسمح للمطابقة الدلالية واسترجاع المعلومات ذات الصلة حتى عند صياغتها بشكل مختلف.
قاعدة بيانات ناقل Pinecone: تخزن التضمينات التي تم إنشاؤها في قاعدة بيانات ناقل Pinecone لاسترجاع فعال. هذا يتيح البحث السريع والقابل للتطوير لقاعدة المعرفة الطبية.
واجهة chatbot: توفر واجهة سهلة الاستخدام (قائمة على النص أو محتملة الصوت) للمستخدمين للتفاعل مع chatbot وطرح الأسئلة الطبية.
تصميم HTML و CSS: تم تصميم واجهة الدردشة باستخدام HTML وتصميمها باستخدام CSS لتوفير تجربة مستخدم بديهية وجذابة.
الواجهة الخلفية Flask: تم تصميم الواجهة الخلفية للتطبيق باستخدام Flask ، وهو إطار ويب خفيف الوزن لـ Python ، للتعامل مع طلبات المستخدم والتفاعل مع chatbot.
المراسلة في الوقت الفعلي: يمكن للمستخدمين التواصل مع chatbot في الوقت الفعلي ، وتلقي ردود فورية على استفساراتهم.

كومة تقنية

Langchain: مكتبة Python لسير عمل معالجة اللغة الطبيعية (NLP) ، تقدم وحدات لمعالجة النص وتوليد المعلومات واسترجاع المعلومات.
محولات الوجه المعانقة: يوفر الوصول إلى نماذج NLP المدربة مسبقًا مثل LLAMA2 لتوليد التضمينات السياقية.
Pinecone: خدمة قاعدة بيانات المتجهات تتيح التخزين والاسترجاع الفعال للبيانات عالية الأبعاد مثل التضمين.
مكتبات إضافية: اعتمادًا على الواجهة المختارة (المستندة إلى النص أو الصوتي) ، قد يتم استخدام مكتبات إضافية مثل NLTK أو Spacy لمزيد من وظائف معالجة النص و chatbot.
Flask: إطار ويب خفيف الوزن للبيثون المستخدم لتطوير واجهة chatbot والتعامل مع طلبات المستخدم.

سير العمل

إنشاء قاعدة المعرفة:

 from langchain_community . embeddings import HuggingFaceEmbeddings
from langchain_community . document_loaders import PyPDFLoader
from langchain . text_splitter import RecursiveCharacterTextSplitter

def create_knowledge_base ( pdf_path ):
  # Load PDF text
  loader = PyPDFLoader ( pdf_path , glob = "*.pdf" )
  text_data = loader . load ()

  # Text processing and chunking
  text_splitter = RecursiveCharacterTextSplitter ( chunk_size = 500 , chunk_overlap = 20 )
  text_chunks = text_splitter . split_documents ( text_data )

  # Download Llama2 embeddings (or your chosen model)
  embeddings = HuggingFaceEmbeddings ( model_name = "sentence-transformers/all-MiniLM-L6-v2" )

  # Generate embeddings for each text chunk
  # ... (code to generate embeddings for each chunk using embeddings object)

  # Store text chunks and embeddings in a data structure (e.g., list of dictionaries)
  knowledge_base = []
  for i , chunk in enumerate ( text_chunks ):
    chunk_embedding = embeddings . encode ( chunk )  # Generate embedding for the chunk
    knowledge_base . append ({
      "text" : chunk ,
      "embedding" : chunk_embedding
    })
  return knowledge_base

تكامل Pinecone:

 from langchain_pinecone import PineconeVectorStore
from pinecone . data . index import Index
from dotenv import load_dotenv
import os

def store_knowledge_base_in_pinecone ( knowledge_base ):
  load_dotenv ()
  PINECONE_API_KEY = os . getenv ( "PINECONE_API_KEY" )
  PINECONE_ENV = os . getenv ( "PINECONE_ENV" )
  PINECONE_INDEX_NAME = os . getenv ( "PINECONE_INDEX_NAME" )

  # Connect to Pinecone
  pc = pinecone . Pinecone ( api_key = PINECONE_API_KEY , environment = PINECONE_ENV )
  index = pc . Index ( PINECONE_INDEX_NAME )

  # Extract text and embeddings from knowledge base
  text_data = [ kb [ "text" ] for kb in knowledge_base ]
  embeddings = [ kb [ "embedding" ] for kb in knowledge_base ]

  # Store embeddings in Pinecone
  PineconeVectorStore . from_documents ( text_data , embeddings , index_name = PINECONE_INDEX_NAME )

  print ( f"Knowledge base stored in Pinecone index: { PINECONE_INDEX_NAME } " )

واجهة chatbot (العنصر النائب):

 # This section is a placeholder as the full chatbot development requires additional libraries
# like Rasa or Dialogflow. Here's a basic outline to illustrate the concept.

def chatbot_loop ():
  while True :
    user_query = input ( "Ask me a medical question (or type 'quit' to exit): " )
    if user_query . lower () == "quit" :
      break

    # Process user query (similar to text processing in knowledge base creation)
    processed_query = # (code to clean and process the user query)

    # Generate embedding for the user query
    query_embedding = embeddings . encode ( processed_query )

    # Retrieve similar text snippets from Pinecone using query embedding
    similar_results = retrieve_from_pinecone ( query_embedding )

    # Extract and present relevant information to the user
    if similar_results :
      for result in similar_results :
        print ( f"Relevant Information: { result [ 'text' ] } " )
    else :
      print ( "Sorry, I couldn't find any information related to your question." )

فوائد

الوصول إلى المعلومات الطبية المحسّنة: يمكن للمستخدمين الوصول إلى المعلومات الطبية وفهمها بسهولة من كتاب PDF من خلال واجهة سهلة الاستخدام.
البحث الدلالي: يسمح تضمينات LLAMA2 باسترداد أكثر دقة للمعلومات ذات الصلة حتى عندما يتم صياغة استعلامات المستخدم بشكل مختلف عن النص الفعلي في الكتاب.
قابلية التوسع: يتيح Pinecone استرجاع المعلومات الفعالة مع نمو قاعدة المعرفة.

اعتبارات أخرى

إخلاء المسئولية الطبية: من الأهمية بمكان أن نذكر بوضوح أن هذا الدردشة مخصصة لأغراض إعلامية فقط ولا ينبغي استخدامها كبديل للمشورة الطبية المهنية. يجب على المستخدمين دائمًا استشارة أخصائي الرعاية الصحية للتشخيص والعلاج.
أمان البيانات: تأكد من تنفيذ التدابير الأمنية المناسبة عند التعامل مع المعلومات الطبية وتخزينها.
اختيار النموذج: في حين أن LLAMA2 هو نموذج قوي ، فكر في استكشاف نماذج طبية أخرى خاصة بالمجال من وجه المعانقة والتي قد تكون أكثر ملاءمة للمعلومات الطبية المحددة في كتاب PDF.
تطوير chatbot: يتطلب تطوير واجهة chatbot قوية مكتبات إضافية مثل RASA أو DialogFlow للتعامل مع تدفق المحادثة وفهم اللغة الطبيعية.

يعرض هذا المشروع إمكانات Langchain و Pinecone في إنشاء chatbot طبي يوفر وسيلة يمكن الوصول إليها وفعالة للوصول إلى المعلومات الطبية وفهمها. تذكر أن تتكيف مع هذا المفهوم وتوسعها لتناسب الاحتياجات المحددة لكتاب PDF الطبي والوظائف المطلوبة.

تثبيت

لإعداد مشروع متجر Langchain Pinecone Vector Store ، اتبع هذه الخطوات:

استنساخ المستودع:

git clone https://github.com/ < username > / < repository > .git
cd < repository >

تثبيت التبعيات:
```
pip install -r requirements.txt
```
تكوين متغيرات البيئة:
قم بإنشاء ملف .env في دليل الجذر وحدد المتغيرات التالية:
```
 PINECONE_API_KEY=<your_pinecone_api_key>
PINECONE_ENV=<pinecone_environment>
PINECONE_INDEX_NAME=<pinecone_index_name>
```

الاستخدام

لتخزين المتجهات في قاعدة بيانات Pinecone Vector ، قم بتنفيذ الأمر التالي:

python store_vectors.py

المساهمة

يتم تشجيع وتقدير المساهمات في مشروع متجر Langchain Pinecone Vector Store! إذا كانت لديك أفكار للتحسينات أو إصلاحات الأخطاء أو الميزات الجديدة ، فيرجى إرسال طلب سحب. تأكد من اتباع إرشادات المساهمة الموضحة في المستودع.

رخصة

تم ترخيص هذا المشروع بموجب ترخيص معهد ماساتشوستس للتكنولوجيا ، والذي يسمح للاستخدام غير المقيد والتوزيع والتعديل ، مع مراعاة الشروط والأحكام المحددة في اتفاقية الترخيص.

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع شفرة المصدر الأخرى
وقت التحديث 2025-05-29
الحجم 2.7MB
من Github

تطبيقات ذات صلة

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Dog_Fox_Bunny

2022-08-01
محرك تحليل البيانات Lihua الإصدار المجاني 3.0_search_navigation_collection_public Oplic_ranking_api

2022-06-28

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل