Construction_Doc_Semantic_Search
1.0.0
このPythonスクリプトは、マシンの読みやすさのためにフォーマットされていないテキストから位置データを抽出するように設計されています。アプリケーションの例は、スキャンされた手書きレポートを処理し、テキストがレポートから抽出される可能性があります。スクリプトは、テキストファイルの内容全体を文字列変数に読み取り、OpenAIのGPT-3.5ターボ自然言語処理モデルを使用して、テキストを検索します。まず、スクリプトは固定マーカーにテキストを分割し、次にGPT搭載のバイナリ分類スイッチを使用して位置データの固定数の行を検索します。位置データが見つからない場合、またはPDFフォーマットが想定されるフォーマットと一致しない場合、スクリプトはGPTモデルを使用して、テキスト抽出全体をロケーションの検索します。出力は、テキストにあるロケーションデータを含む文字列です。