中文介紹
Lakesoul是一個雲本地湖泊框架,可支持可擴展的元數據管理,酸性交易,高效且靈活的UPSERT操作,模式演化以及統一的流媒體和批處理處理。
Lakesoul支持多個計算引擎讀寫湖倉庫表數據,包括Spark,Flink,Presto和Pytorch,並支持多個計算模式,例如批處理,流,MPP和AI。 Lakesoul支持HDFS和S3等存儲系統。

Lakesoul最初是由Dmetasoul Company創建的,自2023年5月以來,被捐贈給Linux Foundation AI&Data作為沙盒項目。
Lakesoul為行和列實現增量UPSERT,並允許並發更新。
Lakesoul使用LSM-Tree類似結構來支持帶有主鍵的哈希分區表的更新,並在提供優化的讀取性能(請參閱性能基準)的同時,獲得了很高的寫入吞吐量。 Lakesoul尺度元數據管理並通過使用PostgreSQL實現酸控制。
Lakesoul使用Rust實現本機元數據層和IO層,並提供C/Java/Python接口來支持多個計算框架(例如大數據和AI)的連接。
Lakesoul支持並發批處理或流式讀寫。讀寫和寫作都支持CDC語義,以及自動架構的演變和加劇的保證,構建實時數據倉庫非常容易。
Lakesoul支持多工作空間和RBAC。 Lakesoul使用Postgres的RBAC和行級安全策略來實施元數據的許可隔離。與Hadoop用戶和組一起,可以實現物理數據隔離。 Lakesoul的許可隔離對於SQL/Java/Python Jobs有效。
Lakesoul支持自動分解壓實,自動餐桌生命週期維護以及自動冗餘數據清潔,降低操作成本並提高可用性。
更詳細的功能請參閱我們的文檔頁面:文檔
按照快速啟動快速設置測試環境。
請在文檔網站中找到教程:
請在Doc網站上找到使用文檔:用法DOC
快速開始
教程
使用文檔
社區準則
如果您有任何疑問,請隨時打開問題或dicussion。
加入我們的Discord服務器進行討論。
通過[email protected]給我們發送電子郵件。
Lakesoul根據Apache許可證v2.0開放。