POC, который использует GPT 4 Vision API для генерации цифровой формы из изображения с использованием форм JSON с https://jsonforms.io/
? Вдохновлен:
Оба репозиториев демонстрируют, что API Vision GPT4 может использоваться для генерации пользовательского интерфейса из изображения и может распознать шаблоны и структуру макета, предоставленного на изображении.

Нажмите на миниатюру, чтобы посмотреть на YouTube:
https://nathanfhh.github.io/digital-form-with-gpt4-vision-api/
Я использую pdf.js для обработки файла PDF и запроса в API OpenAI для создания ответа полностью в браузере.
cd в каталог Frontend cd ai-json-formnpm install
npm run devcd в каталог cd backendpoetry install
# alternatively, you can use pip install
pip install -r requirements.txt export OPENAI_API_KEY=
# optional
export OPENAI_ORG=Если вы планируете использовать только фиктивный ответ, вы должны установить OpenAI_API_KEY на любое значение.
python main.py echo " OPENAI_API_KEY=YOUR_API_KEY " > .env
# The following is optional
echo " OPENAI_ORG=YOUR_ORG " >> .envdocker-compose up --buildhttp://localhost:8080/aijsv/ Я новичок в Vue, поэтому код может быть не лучшей практикой. Я все еще учусь и улучшаюсь. Если у вас есть какие -либо предложения, пожалуйста, не стесняйтесь PR.
Загрузить PDF -файлы до трех страниц с фронта
Если вы хотите настроить количество страниц, вы можете изменить переменную
MAX_PDF_PAGESвbackend/app/socket.py
Когда бэкэнд получает файл PDF в формате строки BASE64, он выполняет следующие процессы:
pdf2image .PyPDF2 . Извлеченные строки станут частью подсказки, отправленной в модель GPT4 для повышения точности. Всякий раз, когда фронт получает кусок, он добавляет его в редактор codemirror и проверяет, является ли текущий содержимое действительным YAML. Если это действительный YAML, он применит его к схеме JSON, чтобы заставить пользовательский интерфейс повторный рендеринг.