中文介绍
O Lakesoul é uma estrutura de Lakehouse nativa em nuvem que suporta gerenciamento de metadados escaláveis, transações ácidas, operação eficiente e flexível da operação, evolução do esquema e processamento unificado de streaming e lote.
O Lakesoul suporta vários mecanismos de computação para ler e escrever dados da tabela de armazém do lago, incluindo Spark, Flink, Presto e Pytorch, e suporta vários modos de computação, como lote, fluxo, MPP e IA. O Lakesoul suporta sistemas de armazenamento como HDFs e S3.

O Lakesoul foi originalmente criado pela DMetasoul Company e doado à Linux Foundation AI & Data como um projeto de sandbox desde maio de 2023.
O Lakesoul implementa o aumento incremental da linha e da coluna e permite atualizações simultâneas.
O Lakesoul usa a estrutura LSM-Tree para suportar atualizações na tabela de particionamento de hash com a chave primária e atinge a taxa de transferência de gravação muito alta, fornecendo mesclagem otimizada no desempenho de leitura (consulte os benchmarks de desempenho). O gerenciamento de metadados das escalas da lagaLes e alcança o controle de ácido usando o PostgreSQL.
O Lakesoul usa a ferrugem para implementar a camada de metadados nativos e a camada de IO e fornece interfaces c/java/python para suportar a conexão de várias estruturas de computação, como big data e IA.
O Lakesoul suporta lote simultâneo ou streaming de leitura e gravação. Tanto a leitura quanto a gravação suporta a semântica do CDC e, juntamente com a evolução do esquema automático e a garantia de exacly-ONCE, a construção de data warehouses em tempo real é facilitada.
O Lakesoul suporta Multi-Workspace e RBAC. O Lakesoul usa as políticas de segurança do RBAC e do nível de linha do Postgres para implementar o isolamento de permissão para metadados. Juntamente com usuários e grupos do Hadoop, o isolamento de dados físicos pode ser alcançado. O isolamento de permissão da Lakesoul é eficaz para trabalhos de SQL/Java/Python.
O Lakesoul suporta compactação desagregada automática, manutenção automática do ciclo de vida da tabela e limpeza automática de dados redundantes, reduzindo os custos de operação e melhorando a usabilidade.
Recursos mais detalhados, consulte nossa página do documento: documentações
Siga o início rápido para configurar rapidamente um teste de teste.
Encontre tutoriais no site do DOC:
Encontre documentações de uso no site Doc: Uso Doc
快速开始
教程
使用文档
Diretrizes da comunidade
Por favor, sinta -se à vontade para abrir um problema ou DiCussion se tiver alguma dúvida.
Junte -se ao nosso servidor Discord para discussões.
Envie um email para [email protected].
O Lakesoul é o OpenSurced sob a Apache License v2.0.