Digital Form with GPT4 Vision API
1.0.0
使用GPT 4 Vision API的POC使用https://jsonforms.io/的JSON表单从图像中生成数字形式
?灵感来自:
两个存储库都表明,GPT4视觉API可用于从图像中生成UI,并可以识别图像中提供的布局的模式和结构。

单击缩略图以在YouTube上观看:
https://nathanfhh.github.io/digital-form-with-with-gpt4-vision-api/
我正在使用pdf.js处理PDF文件并请求OpenAI的API,以完全在浏览器中生成响应。
cd进入前端目录 cd ai-json-formnpm install
npm run devcd进入目录 cd backendpoetry install
# alternatively, you can use pip install
pip install -r requirements.txt export OPENAI_API_KEY=
# optional
export OPENAI_ORG=如果您计划仅使用模拟响应,则应将OpenAI_API_KEY设置为任何值。
python main.py echo " OPENAI_API_KEY=YOUR_API_KEY " > .env
# The following is optional
echo " OPENAI_ORG=YOUR_ORG " >> .envdocker-compose up --buildhttp://localhost:8080/aijsv/ 我是Vue的新手,因此代码可能不是最佳实践。我仍在学习和进步。如果您有任何建议,请随时进行公关。
从前端上传最多三页的PDF文件
如果要调整页数,则可以更改
backend/app/socket.py中的MAX_PDF_PAGES变量
当后端以Base64字符串格式接收PDF文件时,它会执行以下过程:
pdf2image将其保存到 /TMP文件夹中。PyPDF2从同一PDF文件中提取字符串。提取的字符串将成为发送到GPT4模型的提示的一部分,以提高准确性。每当前端收到块时,它都会将其附加到codemirror编辑器,并检查当前内容是否是有效的YAML。如果是有效的YAML,它将将其应用于JSON计划,以迫使UI重新渲染。