Un POC qui utilise GPT 4 Vision API pour générer une forme numérique à partir d'une image utilisant des formulaires JSON à partir de https://jsonforms.io/
? Inspiré par:
Les deux référentiels démontrent que l'API de vision GPT4 peut être utilisée pour générer une interface utilisateur à partir d'une image et peut reconnaître les motifs et la structure de la disposition fournie dans l'image.

Cliquez sur la vignette pour regarder sur YouTube:
https://nathanfhh.github.io/digital-for-with-gpt4-vision-api/
J'utilise PDF.js pour traiter le fichier PDF et demander à l'API d'OpenAI pour générer entièrement la réponse dans le navigateur.
cd dans Frontend Directory cd ai-json-formnpm install
npm run devcd dans le répertoire cd backendpoetry install
# alternatively, you can use pip install
pip install -r requirements.txt export OPENAI_API_KEY=
# optional
export OPENAI_ORG=Si vous prévoyez d'utiliser la réponse simulée uniquement, vous devez définir OpenAI_API_KEY à n'importe quelle valeur.
python main.py echo " OPENAI_API_KEY=YOUR_API_KEY " > .env
# The following is optional
echo " OPENAI_ORG=YOUR_ORG " >> .envdocker-compose up --buildhttp://localhost:8080/aijsv/ Je suis nouveau à Vue, donc le code n'est peut-être pas la meilleure pratique. J'apprends et m'améliore toujours. Si vous avez des suggestions, n'hésitez pas à faire des relations publiques.
Télécharger des fichiers PDF de trois pages du frontend
Si vous souhaitez ajuster le nombre de pages, vous pouvez modifier la variable
MAX_PDF_PAGESdansbackend/app/socket.py
Lorsque le backend reçoit le fichier PDF au format de chaîne Base64, il effectue les processus suivants:
pdf2image .PyPDF2 . Les chaînes extraites feront partie de l'invite envoyée au modèle GPT4 pour améliorer la précision. Chaque fois que le frontend reçoit le morceau, il l'ajoute à l'éditeur codemirror et vérifie si le contenu actuel est un YAML valide. S'il s'agit d'un YAML valide, il l'appliquera au régime JSON pour forcer l'interface utilisateur à renvoyer.