POC الذي يستخدم GPT 4 Vision API لإنشاء نموذج رقمي من صورة باستخدام نماذج JSON من https://jsonforms.io/
؟ مستوحاة من:
يوضح كلا المستودعين أنه يمكن استخدام واجهة برمجة تطبيقات GPT4 Vision لإنشاء واجهة مستخدم من صورة ويمكن أن يتعرف على أنماط وهيكل التصميم المقدم في الصورة.

انقر فوق الصورة المصغرة للمشاهدة على YouTube:
https://nathanfhh.github.io/digital-form-with-gpt4-vision-api/
أنا أستخدم pdf.js لمعالجة ملف PDF وطلب واجهة برمجة تطبيقات Openai لإنشاء الاستجابة بالكامل في المتصفح.
cd في دليل الواجهة الأمامية cd ai-json-formnpm install
npm run devcd في الدليل cd backendpoetry install
# alternatively, you can use pip install
pip install -r requirements.txt export OPENAI_API_KEY=
# optional
export OPENAI_ORG=إذا كنت تخطط لاستخدام استجابة وهمية فقط ، فيجب عليك تعيين Openai_API_Key على أي قيمة.
python main.py echo " OPENAI_API_KEY=YOUR_API_KEY " > .env
# The following is optional
echo " OPENAI_ORG=YOUR_ORG " >> .envdocker-compose up --buildhttp://localhost:8080/aijsv/ أنا جديد على Vue ، لذلك قد لا يكون الرمز هو أفضل الممارسات. ما زلت أتعلم وأتحسن. إذا كان لديك أي اقتراحات ، فلا تتردد في العلاقات العامة.
تحميل ملفات PDF بما يصل إلى ثلاث صفحات من الواجهة الأمامية
إذا كنت ترغب في ضبط عدد الصفحات ، فيمكنك تغيير متغير
MAX_PDF_PAGESفيbackend/app/socket.py
عندما تتلقى الواجهة الخلفية ملف PDF بتنسيق سلسلة BASE64 ، فإنه يقوم بالعمليات التالية:
pdf2image .PyPDF2 . ستصبح السلاسل المستخرجة جزءًا من المطالبة المرسلة إلى نموذج GPT4 لتعزيز الدقة. عندما تتلقى الواجهة الأمامية الجزء ، فإنه يلحقه بمحرر codemirror ، ويتحقق مما إذا كان المحتوى الحالي هو yaml صالح. إذا كان YAML صالحًا ، فسيقوم بتطبيقه على مخطط JSON لإجبار واجهة المستخدم على إعادة تقديم العروض.