Un POC que utiliza la API de Vision GPT 4 para generar una forma digital a partir de una imagen utilizando formularios JSON de https://jsonforms.io/
? Inspirado por:
Ambos repositorios demuestran que la API de visión GPT4 se puede utilizar para generar una interfaz de usuario a partir de una imagen y puede reconocer los patrones y la estructura del diseño proporcionado en la imagen.

Haga clic en la miniatura para ver en YouTube:
https://nathanfhh.github.io/digital-form-with-gpt4-vision-api/
Estoy usando PDF.JS para procesar el archivo PDF y solicitar la API de OpenAI para generar la respuesta por completo en el navegador.
cd en directorio frontend cd ai-json-formnpm install
npm run devcd en directorio cd backendpoetry install
# alternatively, you can use pip install
pip install -r requirements.txt export OPENAI_API_KEY=
# optional
export OPENAI_ORG=Si planea usar solo la respuesta simulada, debe configurar OpenAI_API_KEY en cualquier valor.
python main.py echo " OPENAI_API_KEY=YOUR_API_KEY " > .env
# The following is optional
echo " OPENAI_ORG=YOUR_ORG " >> .envdocker-compose up --buildhttp://localhost:8080/aijsv/ Soy nuevo en Vue, por lo que el código podría no ser la mejor práctica. Todavía estoy aprendiendo y mejorando. Si tiene alguna sugerencia, no dude en las relaciones públicas.
Sube archivos PDF de hasta tres páginas desde el frontend
Si desea ajustar el número de páginas, puede cambiar la variable
MAX_PDF_PAGESenbackend/app/socket.py
Cuando el backend recibe el archivo PDF en formato de cadena Base64, realiza los siguientes procesos:
pdf2image .PyPDF2 . Las cadenas extraídas se convertirán en parte del aviso enviado al modelo GPT4 para mejorar la precisión. Cada vez que el frontend recibe el fragmento, lo agrega al editor codemirror y verifica si el contenido actual es un YAML válido. Si es un YAML válido, lo aplicará al esquema JSON para obligar a la interfaz de usuario a volver a renderizar.