POC yang menggunakan GPT 4 Vision API untuk menghasilkan bentuk digital dari gambar menggunakan bentuk JSON dari https://jsonforms.io/
? Terinspirasi oleh:
Kedua repositori menunjukkan bahwa API penglihatan GPT4 dapat digunakan untuk menghasilkan UI dari gambar dan dapat mengenali pola dan struktur tata letak yang disediakan dalam gambar.

Klik Thumbnail untuk ditonton di YouTube:
https://nathanfhh.github.io/digital-form-with-gpt4-vision-api/
Saya menggunakan pdf.js untuk memproses file PDF dan meminta API OpenAI untuk menghasilkan respons sepenuhnya di browser.
cd ke Direktori Frontend cd ai-json-formnpm install
npm run devcd ke direktori cd backendpoetry install
# alternatively, you can use pip install
pip install -r requirements.txt export OPENAI_API_KEY=
# optional
export OPENAI_ORG=Jika Anda berencana untuk menggunakan respons tiruan saja, Anda harus mengatur openai_api_key ke nilai apa pun.
python main.py echo " OPENAI_API_KEY=YOUR_API_KEY " > .env
# The following is optional
echo " OPENAI_ORG=YOUR_ORG " >> .envdocker-compose up --buildhttp://localhost:8080/aijsv/ Saya baru mengenal Vue, jadi kodenya mungkin bukan praktik terbaik. Saya masih belajar dan meningkatkan. Jika Anda memiliki saran, jangan ragu untuk PR.
Unggah file PDF hingga tiga halaman dari frontend
Jika Anda ingin menyesuaikan jumlah halaman, Anda dapat mengubah variabel
MAX_PDF_PAGESdibackend/app/socket.py
Ketika backend menerima file PDF dalam format string base64, ia melakukan proses berikut:
pdf2image .PyPDF2 . String yang diekstraksi akan menjadi bagian dari prompt yang dikirim ke model GPT4 untuk meningkatkan akurasi. Setiap kali frontend menerima potongan, ia menambahkannya ke editor codemirror , dan memeriksa apakah konten saat ini adalah YAML yang valid. Jika ini adalah YAML yang valid, itu akan menerapkannya pada skema JSON untuk memaksa UI untuk merendahkan kembali.