
Cloud-native, mit KI betriebene Dokumentenverarbeitungspipelines auf AWS.

Besuchen Sie unsere Dokumentation, die alle Informationen enthält, die zum Verständnis des Projekts erforderlich sind und schnell mit dem Aufbau beginnen!
Project Lakechain ist ein experimentelles Framework, das auf dem AWS Cloud Development Kit (CDK) basiert, mit dem skalierbare Dokumentenverarbeitungspipelines auf AWS mithilfe von Infrastruktur-As-Code einfach ausdrückt und bereitgestellt werden können. Es betont die Modularität von Pipelines und bietet 40+ Bereitschaft, um Komponenten für Prototyping -Komplex -Dokument -Pipelines zu verwenden, die auf Millionen von Dokumenten über die Box skalieren können.
Dieses Projekt wurde entwickelt, um AWS-Kunden zu helfen, verschiedene Arten von Pipelines der Dokumentverarbeitung zu erstellen und zu skalieren, die eine breite Palette von Anwendungsfällen umfassen, einschließlich Metadatenextraktion , Dokumentenkonvertierung , NLP-Analyse , Textzusammenfassungen , Übersetzungen , Audio-Transkriptionen , Computer Vision , Pipelines der Abrufenvergrößerung der Generation und vielem mehr!
? Im Folgenden finden Sie ein Beispiel für eine Pipeline, in der die AWS -Infrastruktur bereitgestellt wird, um Audiodateien automatisch in S3 in nur wenigen Codezeilen zu transkribieren. Skalen zu Millionen von Dokumenten.

Siehe Lizenz.