中文介绍
Lakesoul은 Cloud-Native Lakehouse 프레임 워크로 확장 가능한 메타 데이터 관리, 산성 트랜잭션, 효율적이고 유연한 상향 조작, 스키마 진화 및 통합 스트리밍 및 배치 처리를 지원합니다.
Lakesoul은 Spark, Flink, Presto 및 Pytorch를 포함한 Lake Warehouse 테이블 데이터를 읽고 작성하기 위해 여러 컴퓨팅 엔진을 지원하며 Batch, Stream, MPP 및 AI와 같은 여러 컴퓨팅 모드를 지원합니다. Lakesoul은 HDF 및 S3와 같은 스토리지 시스템을 지원합니다.

Lakesoul은 원래 Dmetasoul Company에 의해 만들어졌으며 2023 년 5 월부터 샌드 박스 프로젝트로 Linux Foundation AI & Data에 기부되었습니다.
Lakesoul은 행과 열 모두에 대한 증분 업 서브를 구현하고 동시 업데이트를 허용합니다.
Lakesoul은 LSM-Tree Like Structure를 사용하여 기본 키가있는 해시 파티셔닝 테이블의 업데이트를 지원하며 읽기 성능에 대한 최적화 된 병합을 제공하면서 매우 높은 쓰기 처리량을 달성합니다 (성능 벤치 마크 참조). Lakesoul은 메타 데이터 관리를 스케일하고 PostgreSQL을 사용하여 산 제어를 달성합니다.
Lakesoul은 Rust를 사용하여 기본 메타 데이터 레이어와 IO 계층을 구현하고 C/Java/Python 인터페이스를 제공하여 빅 데이터 및 AI와 같은 여러 컴퓨팅 프레임 워크의 연결을 지원합니다.
Lakesoul은 동시 배치 또는 스트리밍 읽기 및 쓰기를 지원합니다. 읽기 및 쓰기는 CDC 시맨틱을 지원하며 자동 스키마 진화 및 악한 보증과 함께 실시간 데이터웨어 하우스를 쉽게 구축 할 수 있습니다.
Lakesoul은 멀티 워크 스페이스 및 RBAC를 지원합니다. Lakesoul은 Postgres의 RBAC 및로드 레벨 보안 정책을 사용하여 메타 데이터에 대한 권한 분리를 구현합니다. Hadoop 사용자 및 그룹과 함께 물리적 데이터 격리를 얻을 수 있습니다. Lakesoul의 허가 격리는 SQL/Java/Python 작업에 효과적입니다.
Lakesoul은 자동 분리 된 압축, 자동 테이블 수명주기 유지 보수 및 자동 중복 데이터 청소를 지원하여 운영 비용을 줄이고 유용성을 향상시킵니다.
보다 자세한 기능은 문서 페이지 : 문서를 참조하십시오.
빠른 시작을 따라 테스트 env를 빠르게 설정하십시오.
DOC 사이트에서 자습서를 찾으십시오.
DOC 사이트 : 사용법 문서에서 사용법 문서를 찾으십시오
快速开始
教程
使用文档
커뮤니티 지침
궁금한 점이 있으면 문제 나 결정을 열어주십시오.
토론을 위해 Discord 서버에 가입하십시오.
[email protected]으로 이메일을 보내주십시오.
Lakesoul은 Apache License v2.0에 따라 OpenSourced입니다.