
KnowledgeGpt dirancang untuk mengumpulkan informasi dari berbagai sumber, termasuk data internet dan lokal, yang dapat digunakan untuk membuat petunjuk. Prompt ini kemudian dapat digunakan oleh model GPT-3 Openai untuk menghasilkan jawaban yang kemudian disimpan dalam database untuk referensi di masa mendatang.
Untuk mencapai hal ini, teks pertama kali diubah menjadi vektor ukuran tetap menggunakan model open source atau openai. Ketika kueri diajukan, teks juga diubah menjadi vektor dan dibandingkan dengan embeddings pengetahuan yang tersimpan. Informasi yang paling relevan kemudian dipilih dan digunakan untuk menghasilkan konteks yang cepat.
KnowledgeGPT mendukung berbagai sumber informasi termasuk situs web, PDF, File PowerPoint (PPTX), dan Dokumen (DOCM). Selain itu, ia dapat mengekstraksi teks dari subtitle dan audio YouTube (menggunakan teknologi ucapan-ke-teks) dan menggunakannya sebagai sumber informasi. Hal ini memungkinkan beragam informasi yang dikumpulkan dan digunakan untuk menghasilkan petunjuk dan jawaban.
Instalasi PYPI, Jalankan di Terminal: pip install knowledgegpt
Atau Anda dapat menggunakan versi terbaru dari repositori: pip install -r requirements.txt dan kemudian pip install .
Unduh Model Bahasa yang Diperlukan untuk Parsing: python3 -m spacy download en_core_web_sm
uvicorn server:app --reload
# Import the library
from knowledgegpt . extractors . web_scrape_extractor import WebScrapeExtractor
# Import OpenAI and Set the API Key
import openai
from example_config import SECRET_KEY
openai . api_key = SECRET_KEY
# Define target website
url = "https://en.wikipedia.org/wiki/Bombard_(weapon)"
# Initialize the WebScrapeExtractor
scrape_website = WebScrapeExtractor ( url = url , embedding_extractor = "hf" , model_lang = "en" )
# Prompt the OpenAI Model
answer , prompt , messages = scrape_website . extract ( query = "What is a bombard?" , max_tokens = 300 , to_save = True , mongo_client = db )
# See the answer
print ( answer )
# Output: 'A bombard is a type of large cannon used during the 14th to 15th centuries.'Contoh lain dapat ditemukan di folder contoh. Tetapi untuk memberikan ide yang lebih baik tentang cara menggunakan perpustakaan, berikut adalah contoh sederhana:
# Basic Usage
basic_extractor = BaseExtractor ( df )
answer , prompt , messages = basic_extractor . extract ( "What is the title of this PDF?" , max_tokens = 300 ) # PDF Extraction
pdf_extractor = PDFExtractor ( pdf_file_path , extraction_type = "page" , embedding_extractor = "hf" , model_lang = "en" )
answer , prompt , messages = pdf_extractor . extract ( query , max_tokens = 1500 ) # PPTX Extraction
ppt_extractor = PowerpointExtractor ( file_path = ppt_file_path , embedding_extractor = "hf" , model_lang = "en" )
answer , prompt , messages = ppt_extractor . extract ( query , max_tokens = 500 ) # DOCX Extraction
docs_extractor = DocsExtractor ( file_path = "../example.docx" , embedding_extractor = "hf" , model_lang = "en" , is_turbo = False )
answer , prompt , messages =
docs_extractor . extract ( query = "What is an object detection system?" , max_tokens = 300 ) # Extraction from Youtube video (audio)
scrape_yt_audio = YoutubeAudioExtractor ( video_id = url , model_lang = 'tr' , embedding_extractor = 'hf' )
answer , prompt , messages = scrape_yt_audio . extract ( query = query , max_tokens = 1200 )
# Extraction from Youtube video (transcript)
scrape_yt_subs = YTSubsExtractor ( video_id = url , embedding_extractor = 'hf' , model_lang = 'en' )
answer , prompt , messages = scrape_yt_subs . extract ( query = query , max_tokens = 1200 )docker build -t knowledgegptimage .
docker run -p 8888:8888 knowledgegptimage(Untuk diperpanjang ...)
(Untuk diperbarui dengan gambar yang lebih baik)