Construction_Doc_Semantic_Search
1.0.0
이 파이썬 스크립트는 기계 가독성을 위해 형식이없는 텍스트에서 위치 데이터를 추출하도록 설계되었습니다. 예제 응용 프로그램은 스캔 된 필기 보고서를 처리하고 보고서에서 텍스트를 추출 할 수 있습니다. 스크립트는 텍스트 파일의 전체 내용을 문자열 변수로 읽은 다음 OpenAI의 GPT-3.5 터버 자연 언어 처리 모델을 사용하여 위치 데이터의 텍스트를 검색합니다. 먼저, 스크립트는 고정 마커로 텍스트를 분할 한 다음 GPT 전동 바이너리 분류 스위치를 사용하여 위치 데이터에 대한 고정 된 수의 줄을 검색합니다. 위치 데이터를 찾지 못하거나 PDF 형식이 가정 된 형식과 일치하지 않으면 스크립트는 GPT 모델을 사용하여 위치에 대한 전체 텍스트 추출을 검색합니다. 출력은 텍스트에있는 위치 데이터를 포함하는 문자열입니다.