Digital Form with GPT4 Vision API Unduh - Digital Form with GPT4 Vision API

Digital Form with GPT4 Vision API

Kode sumber lainnya

1.0.0

Unduh

PDF ke Formulir Digital Menggunakan API Visi GPT4

POC yang menggunakan GPT 4 Vision API untuk menghasilkan bentuk digital dari gambar menggunakan bentuk JSON dari https://jsonforms.io/

? Terinspirasi oleh:

Screenshot-to-Code ： https: //github.com/abi/screenshot-to-code
Draw-a-ui ： https: //github.com/sawyerhood/draw-a-ui

Kedua repositori menunjukkan bahwa API penglihatan GPT4 dapat digunakan untuk menghasilkan UI dari gambar dan dapat mengenali pola dan struktur tata letak yang disediakan dalam gambar.

angka

Gambar yang dihasilkan oleh Dall-E 3.

Demo?

Klik Thumbnail untuk ditonton di YouTube:

Cobalah di halaman GitHub saya

https://nathanfhh.github.io/digital-form-with-gpt4-vision-api/

Saya menggunakan pdf.js untuk memproses file PDF dan meminta API OpenAI untuk menghasilkan respons sepenuhnya di browser.

Berlari Menggunakan Lingkungan Lokal

Frontend

cd ke Direktori Frontend

 cd ai-json-form

Instal Paket dan Jalankan

npm install
npm run dev

Backend

cd ke direktori

 cd backend

Instal Paket

poetry install
# alternatively, you can use pip install
pip install -r requirements.txt

Pengaturan Variabel Lingkungan

 export OPENAI_API_KEY=
# optional
export OPENAI_ORG=

Jika Anda berencana untuk menggunakan respons tiruan saja, Anda harus mengatur openai_api_key ke nilai apa pun.

Berlari

python main.py

Berlari menggunakan Docker?

Ekspor Variabel Lingkungan

 echo " OPENAI_API_KEY=YOUR_API_KEY " > .env
# The following is optional
echo " OPENAI_ORG=YOUR_ORG " >> .env

Jalankan komposisi Docker

docker-compose up --build

Buka browser dan kunjungi http://localhost:8080/aijsv/

Penafian

Saya baru mengenal Vue, jadi kodenya mungkin bukan praktik terbaik. Saya masih belajar dan meningkatkan. Jika Anda memiliki saran, jangan ragu untuk PR.

Arus menjelaskan

Unggah file PDF hingga tiga halaman dari frontend
Jika Anda ingin menyesuaikan jumlah halaman, Anda dapat mengubah variabel MAX_PDF_PAGES di backend/app/socket.py
Ketika backend menerima file PDF dalam format string base64, ia melakukan proses berikut:
- Konversi string URL kembali ke byte
- Baca file PDF, konversinya ke gambar JPG, dan simpan ke folder /TMP menggunakan paket pdf2image .
- Ekstrak string dari file PDF yang sama menggunakan paket PyPDF2 . String yang diekstraksi akan menjadi bagian dari prompt yang dikirim ke model GPT4 untuk meningkatkan akurasi.
- Siapkan petunjuk dan kirimkan mereka bersama dengan tangkapan layar PDF ke GPT4 Vision API
- Kirim chunk ke frontend melalui socket.io secara bertahap.
Setiap kali frontend menerima potongan, ia menambahkannya ke editor codemirror , dan memeriksa apakah konten saat ini adalah YAML yang valid. Jika ini adalah YAML yang valid, itu akan menerapkannya pada skema JSON untuk memaksa UI untuk merendahkan kembali.

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-03-06
ukuran 4.78MB
Berasal dari Github

Aplikasi Terkait

easy digital downloads

2024-11-06
Perangkat Lunak Pelacak Digital MultiSales

2024-09-01
Edisi Deluxe Digital yang Menghujat

2022-08-26
Istanbul: Edisi Digital

2022-08-19
Ekstra Deluxe Digital Wasteland 3

2022-07-29
Burung dengan Perasaan

2022-07-26

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua