Digital Form with GPT4 Vision API - Digital Form with GPT4 Vision API

Digital Form with GPT4 Vision API

شفرة المصدر الأخرى

1.0.0

تنزيل

PDF إلى النموذج الرقمي باستخدام GPT4 Vision API

POC الذي يستخدم GPT 4 Vision API لإنشاء نموذج رقمي من صورة باستخدام نماذج JSON من https://jsonforms.io/

؟ مستوحاة من:

لقطة شاشة إلى كود ： https: //github.com/abi/Screenshot-to-code
Draw-A-Ui ： https: //github.com/sawyerhood/draw-a-ui

يوضح كلا المستودعين أنه يمكن استخدام واجهة برمجة تطبيقات GPT4 Vision لإنشاء واجهة مستخدم من صورة ويمكن أن يتعرف على أنماط وهيكل التصميم المقدم في الصورة.

شكل

الصورة التي تم إنشاؤها بواسطة Dall-E 3.

العرض التوضيحي؟

انقر فوق الصورة المصغرة للمشاهدة على YouTube:

جربه على صفحة github الخاصة بي

https://nathanfhh.github.io/digital-form-with-gpt4-vision-api/

أنا أستخدم pdf.js لمعالجة ملف PDF وطلب واجهة برمجة تطبيقات Openai لإنشاء الاستجابة بالكامل في المتصفح.

التشغيل باستخدام البيئة المحلية

الواجهة

cd في دليل الواجهة الأمامية

 cd ai-json-form

تثبيت الحزم وتشغيله

npm install
npm run dev

الخلفية

cd في الدليل

 cd backend

تثبيت الحزم

poetry install
# alternatively, you can use pip install
pip install -r requirements.txt

متغيرات البيئة الإعداد

 export OPENAI_API_KEY=
# optional
export OPENAI_ORG=

إذا كنت تخطط لاستخدام استجابة وهمية فقط ، فيجب عليك تعيين Openai_API_Key على أي قيمة.

يجري

python main.py

تشغيل باستخدام Docker؟

تصدير متغيرات البيئة

 echo " OPENAI_API_KEY=YOUR_API_KEY " > .env
# The following is optional
echo " OPENAI_ORG=YOUR_ORG " >> .env

قم بتشغيل Docker-Corm

docker-compose up --build

افتح المتصفح وقم بزيارة http://localhost:8080/aijsv/

تنصل

أنا جديد على Vue ، لذلك قد لا يكون الرمز هو أفضل الممارسات. ما زلت أتعلم وأتحسن. إذا كان لديك أي اقتراحات ، فلا تتردد في العلاقات العامة.

التدفق شرح

تحميل ملفات PDF بما يصل إلى ثلاث صفحات من الواجهة الأمامية
إذا كنت ترغب في ضبط عدد الصفحات ، فيمكنك تغيير متغير MAX_PDF_PAGES في backend/app/socket.py
عندما تتلقى الواجهة الخلفية ملف PDF بتنسيق سلسلة BASE64 ، فإنه يقوم بالعمليات التالية:
- تحويل سلسلة عنوان URL إلى البايتات
- اقرأ ملف PDF ، وقم بتحويله إلى صورة JPG ، وحفظه إلى مجلد /TMP باستخدام الحزمة pdf2image .
- استخراج الأوتار من نفس ملف PDF باستخدام الحزمة PyPDF2 . ستصبح السلاسل المستخرجة جزءًا من المطالبة المرسلة إلى نموذج GPT4 لتعزيز الدقة.
- قم بإعداد المطالبات وأرسلها مع لقطة شاشة PDF إلى واجهة برمجة تطبيقات GPT4 Vision
- أرسل الجزء إلى الواجهة الأمامية عبر Socket.io بشكل تدريجي.
عندما تتلقى الواجهة الأمامية الجزء ، فإنه يلحقه بمحرر codemirror ، ويتحقق مما إذا كان المحتوى الحالي هو yaml صالح. إذا كان YAML صالحًا ، فسيقوم بتطبيقه على مخطط JSON لإجبار واجهة المستخدم على إعادة تقديم العروض.

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع شفرة المصدر الأخرى
وقت التحديث 2025-03-06
الحجم 4.78MB
من Github

تطبيقات ذات صلة

easy digital downloads

2024-11-06
برنامج التتبع الرقمي للمبيعات المتعددة

2024-09-01
الطبعة الرقمية الفاخرة التجديفية

2022-08-26
اسطنبول: الطبعة الرقمية

2022-08-19
القفار 3 إضافات ديلوكس الرقمية

2022-07-29
الطيور مع المشاعر

2022-07-26

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل