Descarga amazon sagemaker personalized generative ai - Descarga de código fuente amazon sagemaker personalized generative ai

amazon sagemaker personalized generative ai

Otro código fuente

1.0.0

Descargar

Aplicaciones de SaaS generativas de IA personalizadas en Amazon en Amazon Sagemaker

Este proyecto permite el ajuste y el servicio de modelos AI generativos hiperpersonalizados a escala en AWS. Abordamos las necesidades de los proveedores de SaaS y las nuevas empresas B2C que buscan escalar rápidamente. Proponemos una arquitectura que aproveche a Amazon Sagemaker para racionalizar el modelo de AI ajustado y despliegue, permitiendo un desarrollo más rápido, mejor calidad del servicio y rentabilidad; y puntos finales multimodelo (MME) para el alojamiento en tiempo real, que proporcionan una forma escalable, de baja latencia y rentable de desplegar miles de modelos de aprendizaje profundo detrás de un solo punto final. Para más detalles, consulte esta publicación de blog.

Requisitos de configuración

Nodo 18+
Instale CDK con NPM npm install -g aws-cdk
Instalar poesía: https://python-poetry.org/docs/#installation

Poetry Instalar Linux, MacOS, Windows (WSL)

curl -sSL https://install.python-poetry.org | python3 -

Instalar dependencias con poesía

 poetry install

Configurar python env en shell

 poetry shell

En este punto, ahora puede sintetizar la plantilla de CloudFormation para este código.

 $ cdk synth

Para agregar dependencias adicionales, por ejemplo, otras bibliotecas de CDK, solo use poetry add yourpackage

Comandos útiles

cdk ls Lista todas las pilas en la aplicación
cdk synth emite la plantilla de formación de nubes sintetizada
cdk deploy implementar esta pila en su cuenta/región predeterminada de AWS
cdk diff Compare la pila implementada con el estado actual
cdk docs Open Documentation CDK

Arquitectura

La arquitectura descrita implica un sistema para casos generativos de uso de IA, con un enfoque en la generación personalizada de texto a imagen como ejemplo, utilizando la difusión estable V2-1. Los componentes clave de esta arquitectura son los siguientes:

API de capacitación y alojamiento de Sagemaker : estas API proporcionan trabajos de capacitación totalmente administrados y capacidades de implementación de modelos. Permiten que los equipos de movimiento rápido se concentren más en las características del producto y la diferenciación. Los trabajos de capacitación de Sagemaker, que siguen a un paradigma de "lanzamiento y olvido", son adecuados para trabajos de ajuste finos concurrentes transitorios durante la incorporación del usuario.
Alojamiento habilitado para GPU : Sagemaker admite opciones de alojamiento habilitadas para GPU para implementar modelos de aprendizaje profundo a escala. Esto incluye la integración del servidor de inferencia Nvidia Triton en el ecosistema de Sagemaker. Sagemaker también ofrece soporte de GPU para puntos finales de múltiples modelos (MME), que permiten el despliegue de miles de modelos de aprendizaje profundo detrás de un solo punto final, asegurando la escalabilidad, la baja latencia y la rentabilidad.
Nivel de infraestructura : en el nivel de infraestructura, la arquitectura se basa en las mejores opciones de cómputo de clase, como el tipo de instancia G5, equipado con GPU NVIDIA A10G Tensor Core (exclusivo de AWS). Este tipo de instancia ofrece una relación de precio-rendimiento favorable tanto para la capacitación de modelos como para el alojamiento, ofreciendo una potencia de cómputo eficiente por dólar gastado.

La arquitectura es particularmente adecuada para los casos de uso de generación de texto a imagen. Divide el flujo de trabajo de la solución en dos fases principales:

Fase A (incorporación del usuario) : en esta fase, los usuarios pueden solicitar la creación de uno o más modelos personalizados y ajustados. Pueden verificar el estado de disponibilidad de sus modelos en todo momento, para saber cuándo ha terminado la capacitación.
Fase B (inferencia a pedido) : después de ajustar, el modelo está listo para la generación de imágenes en tiempo real a pedido por parte de los usuarios finales.

Cómo llamar a la puerta de enlace de la API con Postman

Para interactuar con su puerta de enlace API implementada utilizando AWS CDK, siga estos pasos:

Abra Costman e importe la colección desde la documentation de la carpeta.
Establezca el método de solicitud (por ejemplo, get, publica) e ingrese el punto final de URL de la puerta de enlace API.
Si su API requiere autenticación, configure los encabezados o tokens necesarios.
Agregue los parámetros o datos de solicitud requeridos.
Haga clic en "Enviar" para realizar la solicitud y recibir la respuesta.
Nota: Asegúrese de que sus recursos de AWS y API Gateway estén configurados correctamente para manejar la solicitud.

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2025-03-07
tamaño 8.36MB
Proviene de Github

Aplicaciones relacionadas

awesome generative ai guide

2024-11-05
krita ai diffusion

2024-11-03
amazon ssm agent

2024-11-03
Mejorador de fotos con IA

2023-07-14
Jaspe IA

2023-04-12
IA alienígena

2022-07-29

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo