project lakechain
0.5.0

AWS上的雲本地,AI驅動的文檔處理管道。

前往我們的文檔,其中包含了解該項目所需的所有信息,並迅速開始構建!
LakeChain項目是一個基於AWS雲開發套件(CDK)的實驗框架,它使使用基礎結構AS-Code在AWS上表達和部署可擴展的文檔處理管道變得易於表達。它強調管道的模塊化,並提供40多個準備好的組件來製作複雜文檔管道的原型,這些管道可以從框中擴展到數百萬個文檔。
該項目旨在幫助AWS客戶構建和擴展不同類型的文檔處理管道,範圍廣泛的用例,包括元數據提取,文檔轉換, NLP分析,文本摘要,翻譯,音頻轉錄,計算機視覺,檢索增強的生成管道等等!
?以下是管道的示例,該管道部署了AWS基礎架構以在僅幾行代碼中自動轉錄上傳到S3的音頻文件。比例為數百萬個文件。

請參閱許可證。