A pesar del avance del modelo de base, que puede generar una declaración SQL compleja, el problema principal es que el modelo de base carece de la comprensión del esquema de datos de la organización. Cada organización tiene una convensión de nomenclatura diferente, como tal, necesitamos una forma de alimentar el esquema de datos y hacer que el modelo de base lo comprenda. Este repositorio proporciona el ejemplo de caso de uso del uso de capacidades multimodales de Claude antrópico para hacer NLQ (o consulta de lenguaje natural). Al alimentar el diagrama de relación de entidad de la base de datos (o ERD) en el canal de imagen y la pregunta del usuario en el canal de texto, Anthrope Claude Foundation Model puede comprender su esquema de datos y usar esa información para generar el SQL específico de acuerdo con la pregunta del usuario.
Este repositorio proporciona el ejemplo de extremo a extremo para obtener la pregunta del usuario, generar consulta SQL, consultar el lago de datos usando Amazon Athena y generar resultados más naturales en lugar de respuestas similares a la mesa de Amazon Athena.
Python y boto3 SDK, consulte aquí para la documentación Boto3boto3 actualizada (puede hacerlo mediante pip install --upgrade boto3 )
A continuación se muestra el diagrama de arquitectura de esta solución.

Ver contribuyendo para más información.
Esta biblioteca tiene licencia bajo la licencia MIT-0. Ver el archivo de licencia.