ดาวน์โหลด multi modal document search Download - multi modal document search Source Source Download

multi modal document search

ซอร์สโค้ดอื่น ๆ

1.0.0

ดาวน์โหลด

การค้นหาเอกสารหลายกิริยา

ในฐานะที่เป็นโครงการที่ค่อนข้างรวดเร็วพื้นที่เก็บข้อมูลนี้มีแอปพลิเคชัน Streamlit ที่ช่วยให้ผู้ใช้สามารถอัปโหลดภาพหน้าจอซึ่งจะถูกสอบถามกับฐานข้อมูลของเอกสาร PDF ทั้งโครงสร้างภาพรวมถึงข้อความที่รวม (อาจ) ถูกใช้เพื่อค้นหาเอกสารการจับคู่สำหรับชุดที่กำหนดด้วยตนเอง

กระบวนการสอบถาม

เมื่อผู้ใช้อัปโหลดสกรีนช็อตสองกระแสจะถูกเรียกใช้ ก่อนอื่นเราสร้างรูปแบบการฝังภาพสองชิ้นของภาพหน้าจอ ชิ้นส่วนถูกสร้างขึ้นเนื่องจากการฝังภาพ VIT-G-14 ได้รับการฝึกฝนบนอินพุตสแควร์ สไลด์จุดไฟหรือเอกสาร A4 มักจะมีความสัมพันธ์ด้านข้างของใกล้ถึง 2: 1 นั่นคือเหตุผลว่าทำไม chunking ควรสนับสนุนคุณภาพการสืบค้นโดยรวม จากนั้นภาพที่ฝัง (2 x 1024dim) จะถูกสอบถามกับร้านค้าเวกเตอร์ของชิ้นที่รู้จัก โฟลว์ครั้งที่สองแยกข้อความแรกออกจากภาพหน้าจอโดยใช้เครื่องยนต์ Tesseract OCR ของ Google หลังจากนั้นข้อความฝังตัว (1024DIM) จะถูกสร้างขึ้นโดยใช้หนึ่งในโมเดลหลายภาษาที่มีประสิทธิภาพดีที่สุด E5 ขนาดใหญ่ ในขั้นตอนสุดท้ายผลลัพธ์จะถูกรวมเข้าด้วยกันโดยใช้ระบบ ID ที่ใช้ร่วมกันระหว่างร้านค้าเวกเตอร์และส่งไปยังผู้ใช้

การตัดสินใจออกแบบ

นี่คือสถานที่ที่ฉันแบ่งปันความคิดของฉัน

ทำไมต้องใช้ภาพหน้าจอไม่ใช่เอกสารเป็นอินพุต?

แนวคิดคือการจัดหาเครื่องมือที่ใช้อย่างรวดเร็ว สมมติว่าคุณมีสไลด์การนำเสนอและต้องการทราบว่าคุณสร้างสิ่งที่คล้ายกันก่อนหน้านี้หรือไม่ หากคุณจะอัปโหลดเอกสารทั้งหมดจะมีข้อกำหนดสำหรับฟิลด์อินพุตหมายเลขหน้าพิเศษคุณจะต้องค้นหาเอกสารในระบบไฟล์ของคุณและประเภทไฟล์จะต้องได้รับการสนับสนุน เพียงแค่ถ่ายภาพหน้าจอก็เร็วกว่า (มีทางลัดที่มีประโยชน์ในระบบปฏิบัติการทั้งหมด) และเพียงแค่อัปโหลดภาพเดียวตรงไปข้างหน้า

ทำไมต้องมีกระแส?

มันรวดเร็วในการรวบรวมแอพขนาดเล็กและฉันชอบอินเตอร์เฟสภาพมากกว่าเครื่องมือที่ใช้ CLI

รุ่นที่เลือกได้อย่างไร?

ส่วนใหญ่ผ่านกระดานผู้นำของ HuggingFace เนื่องจากนี่เป็นโครงการขนาดเล็กที่ฉันต้องการใช้โมเดลที่ผ่านการฝึกอบรมมาก่อน

นำเอกสารของคุณเองไปที่ร้านค้าเวกเตอร์ได้อย่างไร?

สคริปต์ pdf_to_db.py เป็นซ้ำง่ายกว่าเอกสารทั้งหมดใน pdfs/ ซึ่งใช้คลาสอื่น ๆ เพื่อเติมเต็มร้านค้าเวกเตอร์

บทสรุป

นี่ไม่ใช่โครงการที่ได้รับการพัฒนาอย่างแข็งขันและส่วนใหญ่ใช้ในการทำโครงการด้วยเทคโนโลยีที่ใช้แล้ว หากคุณมีคำถามใด ๆ โปรดติดต่อฉัน

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-05-30
ขนาด 7.92KB
มาจาก Github

แอปที่เกี่ยวข้อง

multi roblox macos

2024-11-14
TikTok Multi Downloader

2024-11-10
ค้นหาคำ 800

2024-11-08
azure search python samples

2024-11-05
Dragon Ball Project เวอร์ชั่นภาษาจีนหลายภาษา

2024-08-23
Liehuo! ค้นหา ค้นหาภาษาอังกฤษ

2011-01-07

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด