pdf bundle
1.0.0
這個帶回家的項目是在不到72小時的時間範圍內設計的,這是高級MLOP角色招聘過程的一步。
PDF捆綁包是一種工具,旨在從存儲在AWS S3存儲桶中的PDF文檔中提取文本,將這些文檔分解為較小的零件,並使用句子變壓器生成矢量嵌入。然後將這些嵌入式存儲在Pinecone矢量數據庫中,以進行有效的存儲和檢索。
PDF捆綁包通過FastApi提供用戶友好的接口。 query_search端點有助於基於及時的搜索,允許用戶輸入查詢並迅速檢索最相似的向量嵌入。這種相似性是使用餘弦相似性確定的,該度量捕獲了向量之間的語義相似性。在簡化可用性的響應時,PDF捆綁包通過自動將詳細響應上傳到S3存儲桶來確保透明度。 PDF束有效地發現了最相似的向量嵌入,其無縫集成和魯棒功能。
確保PDF捆綁包API服務器在以下服務器上運行:
該應用程序已在以下方面部署和訪問:鐵路。
警告:自由實例旋轉延遲
請注意,渲染提供的免費實例可能由於不活動而經歷旋轉。處理請求時,這可能會導致50秒或更長時間。當您的網絡瀏覽器試圖加載頁面時,請耐心等待。
使用以下JSON有效載荷發送郵政請求到API端點/query_search :
{
"prompt" : " your_user_defined_prompt " ,
"n_top" : 5
}將"your_user_defined_prompt"替換為要使用的提示, "n_top"並基於餘弦的類似性來檢索的類似嵌入式數量。
接收一個響應,其中包含與提供的提示最相似的嵌入。
歡迎捐款!如果您遇到任何錯誤或提出改進建議,請隨時提交拉動請求或打開問題。
有關任何查詢或支持,請聯繫[email protected]