pdf bundle
1.0.0
这个带回家的项目是在不到72小时的时间范围内设计的,这是高级MLOP角色招聘过程的一步。
PDF捆绑包是一种工具,旨在从存储在AWS S3存储桶中的PDF文档中提取文本,将这些文档分解为较小的零件,并使用句子变压器生成矢量嵌入。然后将这些嵌入式存储在Pinecone矢量数据库中,以进行有效的存储和检索。
PDF捆绑包通过FastApi提供用户友好的接口。 query_search端点有助于基于及时的搜索,允许用户输入查询并迅速检索最相似的向量嵌入。这种相似性是使用余弦相似性确定的,该度量捕获了向量之间的语义相似性。在简化可用性的响应时,PDF捆绑包通过自动将详细响应上传到S3存储桶来确保透明度。 PDF束有效地发现了最相似的向量嵌入,其无缝集成和鲁棒功能。
确保PDF捆绑包API服务器在以下服务器上运行:
该应用程序已在以下方面部署和访问:铁路。
警告:自由实例旋转延迟
请注意,渲染提供的免费实例可能由于不活动而经历旋转。处理请求时,这可能会导致50秒或更长时间。当您的网络浏览器试图加载页面时,请耐心等待。
使用以下JSON有效载荷发送邮政请求到API端点/query_search :
{
"prompt" : " your_user_defined_prompt " ,
"n_top" : 5
}将"your_user_defined_prompt"替换为要使用的提示, "n_top"并基于余弦的类似性来检索的类似嵌入式数量。
接收一个响应,其中包含与提供的提示最相似的嵌入。
欢迎捐款!如果您遇到任何错误或提出改进建议,请随时提交拉动请求或打开问题。
有关任何查询或支持,请联系[email protected]