POC ที่ใช้ GPT 4 Vision API เพื่อสร้างรูปแบบดิจิตอลจากภาพโดยใช้รูปแบบ JSON จาก https://jsonforms.io/
- แรงบันดาลใจจาก:
ที่เก็บทั้งสองแสดงให้เห็นว่า GPT4 Vision API สามารถใช้เพื่อสร้าง UI จากภาพและสามารถรับรู้รูปแบบและโครงสร้างของเค้าโครงที่มีให้ในภาพ

คลิกรูปขนาดย่อเพื่อดูบน YouTube:
https://nathanfhh.github.io/digital-form-with-gpt4-vision-api/
ฉันใช้ PDF.JS เพื่อประมวลผลไฟล์ PDF และขอ API ของ OpenAI เพื่อสร้างการตอบสนองทั้งหมดในเบราว์เซอร์
cd ในไดเรกทอรีส่วนหน้า cd ai-json-formnpm install
npm run devcd เป็นไดเรกทอรี cd backendpoetry install
# alternatively, you can use pip install
pip install -r requirements.txt export OPENAI_API_KEY=
# optional
export OPENAI_ORG=หากคุณวางแผนที่จะใช้การตอบสนองจำลองเท่านั้นคุณควรตั้งค่า openai_api_key เป็นค่าใด ๆ
python main.py echo " OPENAI_API_KEY=YOUR_API_KEY " > .env
# The following is optional
echo " OPENAI_ORG=YOUR_ORG " >> .envdocker-compose up --buildhttp://localhost:8080/aijsv/ ฉันยังใหม่กับ Vue ดังนั้นรหัสอาจไม่ใช่แนวปฏิบัติที่ดีที่สุด ฉันยังคงเรียนรู้และปรับปรุง หากคุณมีคำแนะนำใด ๆ โปรดอย่าลังเลที่จะประชาสัมพันธ์
อัปโหลดไฟล์ PDF สูงสุดสามหน้าจากส่วนหน้า
หากคุณต้องการปรับจำนวนหน้าคุณสามารถเปลี่ยนตัวแปร
MAX_PDF_PAGESในbackend/app/socket.py
เมื่อแบ็กเอนด์ได้รับไฟล์ PDF ในรูปแบบสตริง Base64 จะทำกระบวนการต่อไปนี้:
pdf2imagePyPDF2 สตริงที่สกัดจะกลายเป็นส่วนหนึ่งของพรอมต์ที่ส่งไปยังโมเดล GPT4 เพื่อเพิ่มความแม่นยำ เมื่อใดก็ตามที่ส่วนหน้าได้รับก้อนมันจะต่อท้ายไปยังตัวแก้ไข codemirror และตรวจสอบว่าเนื้อหาปัจจุบันเป็น Yaml ที่ถูกต้องหรือไม่ หากเป็น Yaml ที่ถูกต้องมันจะนำไปใช้กับโครงการ JSON เพื่อบังคับให้ UI ทำการเรนเดอร์อีกครั้ง