中文介绍
Lakesoul是一个云本地湖泊框架,可支持可扩展的元数据管理,酸性交易,高效且灵活的UPSERT操作,模式演化以及统一的流媒体和批处理处理。
Lakesoul支持多个计算引擎读写湖仓库表数据,包括Spark,Flink,Presto和Pytorch,并支持多个计算模式,例如批处理,流,MPP和AI。 Lakesoul支持HDFS和S3等存储系统。

Lakesoul最初是由Dmetasoul Company创建的,自2023年5月以来,被捐赠给Linux Foundation AI&Data作为沙盒项目。
Lakesoul为行和列实现增量UPSERT,并允许并发更新。
Lakesoul使用LSM-Tree类似结构来支持带有主键的哈希分区表的更新,并在提供优化的读取性能(请参阅性能基准)的同时,获得了很高的写入吞吐量。 Lakesoul尺度元数据管理并通过使用PostgreSQL实现酸控制。
Lakesoul使用Rust实现本机元数据层和IO层,并提供C/Java/Python接口来支持多个计算框架(例如大数据和AI)的连接。
Lakesoul支持并发批处理或流式读写。读写和写作都支持CDC语义,以及自动架构的演变和加剧的保证,构建实时数据仓库非常容易。
Lakesoul支持多工作空间和RBAC。 Lakesoul使用Postgres的RBAC和行级安全策略来实施元数据的许可隔离。与Hadoop用户和组一起,可以实现物理数据隔离。 Lakesoul的许可隔离对于SQL/Java/Python Jobs有效。
Lakesoul支持自动分解压实,自动餐桌生命周期维护以及自动冗余数据清洁,降低操作成本并提高可用性。
更详细的功能请参阅我们的文档页面:文档
按照快速启动快速设置测试环境。
请在文档网站中找到教程:
请在Doc网站上找到使用文档:用法DOC
快速开始
教程
使用文档
社区准则
如果您有任何疑问,请随时打开问题或dicussion。
加入我们的Discord服务器进行讨论。
通过[email protected]给我们发送电子邮件。
Lakesoul根据Apache许可证v2.0开放。