Um POC que usa a API do GPT 4 Vision para gerar um formulário digital a partir de uma imagem usando formulários JSON de https://jsonforms.io/
? Inspirado em:
Ambos os repositórios demonstram que a API de visão GPT4 pode ser usada para gerar uma interface do usuário a partir de uma imagem e pode reconhecer os padrões e a estrutura do layout fornecido na imagem.

Clique na miniatura para assistir no YouTube:
https://nathanfhh.github.io/digital-form-with-gpt4-vision-api/
Estou usando o PDF.js para processar o arquivo PDF e solicitar à API do OpenAI que gerar inteiramente a resposta no navegador.
cd em diretório de front -end cd ai-json-formnpm install
npm run devcd no diretório cd backendpoetry install
# alternatively, you can use pip install
pip install -r requirements.txt export OPENAI_API_KEY=
# optional
export OPENAI_ORG=Se você planeja usar apenas a resposta simulada, definirá o OpenAI_API_KEY para qualquer valor.
python main.py echo " OPENAI_API_KEY=YOUR_API_KEY " > .env
# The following is optional
echo " OPENAI_ORG=YOUR_ORG " >> .envdocker-compose up --buildhttp://localhost:8080/aijsv/ Eu sou novo no Vue, então o código pode não ser a melhor prática. Ainda estou aprendendo e melhorando. Se você tiver alguma sugestão, sinta -se à vontade para pr.
Carregue arquivos PDF de até três páginas do front -end
Se você deseja ajustar o número de páginas, poderá alterar a variável
MAX_PDF_PAGESembackend/app/socket.py
Quando o back -end recebe o arquivo PDF no formato Base64 String, ele faz os seguintes processos:
pdf2image .PyPDF2 . As cordas extraídas se tornarão parte do prompt enviado ao modelo GPT4 para aumentar a precisão. Sempre que o front -end recebe o pedaço, ele o anexa ao editor codemirror e verifica se o conteúdo atual é um YAML válido. Se for um YAML válido, ele o aplicará ao esquema JSON para forçar a interface do usuário a renderizar novamente.