gpt 4 pdf
1.0.0
พื้นที่เก็บข้อมูล GitHub นี้เป็นเจ้าภาพโปรแกรมที่ใช้ Python ที่ออกแบบมาสำหรับการประมวลผลและการโต้ตอบ PDF ขั้นสูง โปรแกรมประกอบด้วยสององค์ประกอบหลัก: pdfcontextextractor และ pdfsearchanddisplay PDFContexTextractor ใช้ Langchain สำหรับการดึงข้อมูลตามบริบทจากเอกสาร PDF ซึ่งได้รับการปรับปรุงโดยความสามารถของ AI จากโมเดลของ OpenAI คลาส PDFSearchandDisplay ใช้ประโยชน์จาก pymupdf และ pdfplumber ค้นหาเอกสาร PDF สำหรับบริบทเฉพาะเน้นพวกเขาและจับภาพหน้าจอของหน้าด้วยไฮไลท์ที่สำคัญ เครื่องมือนี้มีประโยชน์อย่างยิ่งสำหรับการแยกวิเคราะห์และการใส่คำอธิบายประกอบ PDFs บนพื้นฐานของการสืบค้นบริบทเหมาะสำหรับการวิจัยเชิงวิชาการการวิเคราะห์เอกสารและการสร้างรายงานอัตโนมัติ