Construction_Doc_Semantic_Search
1.0.0
这个Python脚本旨在从文本中提取位置数据,该数据未格式化用于机器可读性。一个示例应用程序可以处理已扫描的手写报告,并从报告中提取文本。该脚本将文本文件的整个内容读取到字符串变量中,然后使用OpenAI的GPT-3.5-Turbo自然语言处理模型来搜索文本以查看位置数据。首先,该脚本将文本分配为固定标记,然后使用GPT驱动的二进制分类开关搜索固定数量的线路数量。如果找不到任何位置数据或PDF格式不匹配假定的格式,则脚本使用GPT模型来搜索整个文本提取位置。输出是包含文本中发现的位置数据的字符串。