中文介绍
LakeSoul es un marco de lakehouse nativo de nube que admite el manejo de metadatos escalables, transacciones ácidas, operación eficiente y flexible de Upsert, evolución de esquemas y procesamiento de transmisión y lote unificados.
LakeSoul admite múltiples motores de computación para leer y escribir datos de la tabla de almacén del lago, incluidos Spark, Flink, Presto y Pytorch, y admite múltiples modos informáticos como Batch, Stream, MPP e IA. Lakesoul admite sistemas de almacenamiento como HDFS y S3.

LakeSoul fue creado originalmente por Dmeteasoul Company y fue donado a Linux Foundation AI & Data como un proyecto de Sandbox desde mayo de 2023.
Lakesoul implementa subserts incrementales para la fila y la columna y permite actualizaciones concurrentes.
LakeSoul utiliza la estructura de LSM-Tree para admitir actualizaciones en la tabla de partición hash con la clave primaria, y logra un rendimiento de escritura muy alto al tiempo que proporciona fusión optimizada en el rendimiento de lectura (consulte los puntos de referencia de rendimiento). Lakesoul escala el manejo de metadatos y logra el control de ácido mediante el uso de PostgreSQL.
LakeSoul usa Rust para implementar la capa de metadatos nativos y la capa IO, y proporciona interfaces C/Java/Python para admitir la conexión de múltiples marcos informáticos como Big Data e IA.
LakeSoul admite lotes concurrentes o transmisión de lectura y escritura. Tanto la lectura como la escritura admiten la semántica de los CDC, y junto con la evolución del esquema automotriz y la garantía excepcional, la construcción de almacenes de datos en tiempo real se facilita.
LakeSoul es compatible con Multi-Workspace y RBAC. LakeSoul utiliza las políticas de seguridad RBAC y de nivel de fila de Postgres para implementar el aislamiento de permisos para metadatos. Junto con los usuarios y grupos de Hadoop, se puede lograr el aislamiento de datos físicos. El aislamiento del permiso de Lakesoul es efectivo para los trabajos SQL/Java/Python.
LakeSoul admite compactación automática desglosada, mantenimiento automático del ciclo de vida de la tabla y limpieza automática de datos redundantes, reduciendo los costos de operación y la mejora de la usabilidad.
Características más detalladas Consulte nuestra página DOC: Documentos
Siga el comienzo rápido para configurar rápidamente una prueba env.
Encuentre tutoriales en el sitio DOC:
Encuentre documentos de uso en el sitio de DOC: Uso DOC
快速开始
教程
使用文档
Directrices de la comunidad
No dude en abrir un problema o una dicusión si tiene alguna pregunta.
Únase a nuestro servidor Discord para discusiones.
Envíenos un correo electrónico a [email protected].
LakeSoul se abre a la licencia Apache v2.0.