Digital Form with GPT4 Vision API
1.0.0
使用GPT 4 Vision API的POC使用https://jsonforms.io/的JSON表單從圖像中生成數字形式
?靈感來自:
兩個存儲庫都表明,GPT4視覺API可用於從圖像中生成UI,並可以識別圖像中提供的佈局的模式和結構。

單擊縮略圖以在YouTube上觀看:
https://nathanfhh.github.io/digital-form-with-with-gpt4-vision-api/
我正在使用pdf.js處理PDF文件並請求OpenAI的API,以完全在瀏覽器中生成響應。
cd進入前端目錄 cd ai-json-formnpm install
npm run devcd進入目錄 cd backendpoetry install
# alternatively, you can use pip install
pip install -r requirements.txt export OPENAI_API_KEY=
# optional
export OPENAI_ORG=如果您計劃僅使用模擬響應,則應將OpenAI_API_KEY設置為任何值。
python main.py echo " OPENAI_API_KEY=YOUR_API_KEY " > .env
# The following is optional
echo " OPENAI_ORG=YOUR_ORG " >> .envdocker-compose up --buildhttp://localhost:8080/aijsv/ 我是Vue的新手,因此代碼可能不是最佳實踐。我仍在學習和進步。如果您有任何建議,請隨時進行公關。
從前端上傳最多三頁的PDF文件
如果要調整頁數,則可以更改
backend/app/socket.py中的MAX_PDF_PAGES變量
當後端以Base64字符串格式接收PDF文件時,它會執行以下過程:
pdf2image將其保存到 /TMP文件夾中。PyPDF2從同一PDF文件中提取字符串。提取的字符串將成為發送到GPT4模型的提示的一部分,以提高準確性。每當前端收到塊時,它都會將其附加到codemirror編輯器,並檢查當前內容是否是有效的YAML。如果是有效的YAML,它將將其應用於JSON計劃,以迫使UI重新渲染。