中文介绍
Lakesoul est un cadre Lakehouse natif du cloud qui prend en charge la gestion des métadonnées évolutives, les transactions acides, le fonctionnement efficace et flexible, l'évolution du schéma et le streaming unifié et le traitement par lots.
Lakesoul prend en charge plusieurs moteurs informatiques pour lire et écrire les données de la table de l'entrepôt de lac, y compris Spark, Flink, Presto et Pytorch, et prend en charge plusieurs modes informatiques tels que le lot, le flux, le MPP et l'IA. Lakesoul prend en charge les systèmes de stockage tels que les HDF et S3.

Lakesoul a été créé à l'origine par Dmetasoul Company et a été donné à Linux Foundation AI & Data en tant que projet de bac à sable depuis mai 2023.
Lakesoul implémente les upsert incrémentiels pour la ligne et la colonne et permet des mises à jour simultanées.
Lakesoul utilise la structure de type LSM Tree pour soutenir les mises à jour sur la table de partitionnement de hachage avec une clé primaire, et réalise un débit d'écriture très élevé tout en fournissant une fusion optimisée sur les performances de lecture (reportez-vous à des références de performances). Lakesoul évolue la gestion des métadonnées et atteint le contrôle d'acide en utilisant PostgreSQL.
Lakesoul utilise Rust pour implémenter la couche de métadonnées natives et la couche IO, et fournit des interfaces C / Java / Python pour prendre en charge la connexion de plusieurs cadres informatiques tels que les mégadonnées et l'IA.
Lakesoul prend en charge un lot ou un streaming simultané lisez et écrivez. La lecture et l'écriture prennent en charge la sémantique CDC, et avec l'évolution du schéma automatique et la garantie exactivement-once, la construction des entrepôts de données en temps réel est facilitée.
Lakesoul prend en charge le multi-workspace et RBAC. Lakesoul utilise les politiques de sécurité RBAC et au niveau des lignes de Postgres pour mettre en œuvre l'isolement de l'autorisation pour les métadonnées. Avec les utilisateurs et les groupes de Hadoop, l'isolement physique des données peut être réalisé. L'isolement de la permission de Lakesoul est efficace pour les travaux SQL / Java / Python.
Lakesoul prend en charge le compactage désagrégé automatique, la maintenance automatique du cycle de vie de la table et le nettoyage automatique des données redondantes, la réduction des coûts de fonctionnement et l'amélioration de l'utilisabilité.
Fonctionnalités plus détaillées Veuillez vous référer à notre page DOC: documentations
Suivez le démarrage rapide pour configurer rapidement un test de test.
Veuillez trouver des tutoriels sur le site DOC:
Veuillez trouver des documents d'utilisation dans le site du DOC: Utilisation Doc
快速开始
教程
使用文档
Lignes directrices communautaires
N'hésitez pas à ouvrir un problème ou une dicussion si vous avez des questions.
Rejoignez notre serveur Discord pour des discussions.
Envoyez-nous un courriel à [email protected].
Lakesoul est ouvert sous la licence Apache v2.0.