Construction_Doc_Semantic_Search
1.0.0
這個Python腳本旨在從文本中提取位置數據,該數據未格式化用於機器可讀性。一個示例應用程序可以處理已掃描的手寫報告,並從報告中提取文本。該腳本將文本文件的整個內容讀取到字符串變量中,然後使用OpenAI的GPT-3.5-Turbo自然語言處理模型來搜索文本以查看位置數據。首先,該腳本將文本分配為固定標記,然後使用GPT驅動的二進制分類開關搜索固定數量的線路數量。如果找不到任何位置數據或PDF格式不匹配假定的格式,則腳本使用GPT模型來搜索整個文本提取位置。輸出是包含文本中發現的位置數據的字符串。