Construction_Doc_Semantic_Search
1.0.0
สคริปต์ Python นี้ออกแบบมาเพื่อดึงข้อมูลตำแหน่งจากข้อความที่ไม่ได้จัดรูปแบบสำหรับการอ่านเครื่อง แอปพลิเคชันตัวอย่างอาจเป็นการประมวลผลรายงานที่เขียนด้วยลายมือที่ได้รับการสแกนและข้อความที่ดึงออกมาจากรายงาน สคริปต์จะอ่านเนื้อหาทั้งหมดของไฟล์ข้อความลงในตัวแปรสตริงจากนั้นใช้รูปแบบการประมวลผลภาษาธรรมชาติ GPT-3.5-turbo ของ OpenAI เพื่อค้นหาข้อความสำหรับข้อมูลตำแหน่ง ขั้นแรกสคริปต์จะแยกข้อความที่เครื่องหมายคงที่จากนั้นจะค้นหาจำนวนบรรทัดคงที่สำหรับข้อมูลตำแหน่งโดยใช้สวิตช์การจำแนกประเภทไบนารี GPT หากไม่พบข้อมูลตำแหน่งใด ๆ หรือการจัดรูปแบบ PDF ไม่ตรงกับการจัดรูปแบบที่สันนิษฐานสคริปต์จะใช้โมเดล GPT เพื่อค้นหาการแยกข้อความทั้งหมดสำหรับสถานที่ เอาต์พุตเป็นสตริงที่มีข้อมูลตำแหน่งที่พบในข้อความ