Descargar redis nvidia recsys - Descargar el código fuente redis nvidia recsys

redis nvidia recsys

Otro código fuente

1.0.0

Descargar

Sistemas de recomendación con Nvidia Merlin y Redis

Este repositorio contiene los activos que complementan el artículo " fuera de línea en línea: almacenamiento de características para sistemas de recomendaciones en tiempo real con Nvidia Merlin " escrito originalmente para el blog de desarrolladores de NVIDIA.

Arquitecturas del sistema de recomendación

Brindamos ejemplos de arquitecturas de sistemas de recomendación y proporcionamos instrucciones de implementación en la nube para el uso de producción. Cada uno de los ejemplos se basa en Redis y el Marco Nvidia Merlin que proporciona una serie de bloques de construcción para crear sistemas de recomendación.

Hay 3 ejemplos dentro de este repositorio

Recomendaciones de lotes fuera de línea
Sistemas de recomendación en línea
Modelos de recomendación a gran escala con Hugectr

La gran escala se expande en la segunda arquitectura para los casos de uso que exigen capacitación o inferencia a gran escala (> 1 GPU).

Cada uno de los ejemplos está diseñado para ejecutarse localmente en un sistema habilitado para la GPU de NVIDIA con Docker y Docker-Compose. Recomendamos ejecutar todo lo siguiente en una instancia de nube con una GPU NVIDIA (idealmente el AWS Pytorch ami)

Sin embargo, también proporcionamos un conjunto de scripts de terraza y cuadernos Ansible que pueden implementar la infraestructura necesaria para ejecutar los ejemplos en instancias de AWS.

1. Recomendaciones de lotes fuera de línea

Los sistemas de recomendación "fuera de línea" utilizan la computación por lotes para procesar grandes cantidades de datos y luego almacenarlos para una recuperación posterior. El diagrama anterior muestra un ejemplo de dicho sistema que utiliza un enfoque de dos torres para generar recomendaciones y luego las almacena dentro de una base de datos Redis para una recuperación posterior.

El cuaderno fuera de línea proporciona métodos para construir este tipo de sistema de recomendación, así como trenes y exporta los modelos necesarios para ejecutar el sistema de recomendaciones en línea en la siguiente sección.

Para ejecutar el cuaderno, ejecute lo siguiente

$ cd offline-batch-recsys/
$ docker compose up # -d to daemonize

Luego abra el enlace generado por Jupyter en un navegador.

2. Sistemas de recomendación en línea

Un sistema de recomendaciones "en línea" genera recomendaciones a pedido. A diferencia de los sistemas orientados a lotes, los sistemas en línea están limitados por la latencia. Al diseñar estos sistemas, la cantidad de tiempo para producir recomendaciones es probablemente el factor más importante. Comúnmente limitado alrededor de 100-300 ms, cada parte del sistema necesita componentes que no solo son eficientes sino escalables para millones de usuarios y elementos. La creación de un sistema de recomendación en línea tiene significativamente más restricciones que los sistemas por lotes, sin embargo, el resultado a menudo son mejores recomendaciones ya que la información (características) se puede actualizar en tiempo real. El diagrama anterior muestra un ejemplo de esta arquitectura.

El ejemplo anterior de las recomendaciones por lotes genera los modelos y conjuntos de datos para este cuaderno, pero también puede descargar activos previamente capacitados con la CLI de AWS de la siguiente manera

 aws s3 cp s3://redisventures/merlin/merlin-recsys-data.zip ./data

Para ejecutar el cuaderno, ejecute lo siguiente

$ cd online-multi-stage-recsys/
$ docker compose up # -d to daemonize

Esta sección contiene dos cuadernos: uno para implementar el almacén de funciones (Redis) y crear el índice Vector (Redis) y otro para definir y ejecutar el modelo de conjunto para ejecutar toda la tubería (Triton).

Nota: Asegúrese de ejecutar el primer cuaderno antes del segundo o el modelo no se ejecutará.

3. Modelos de recomendación a gran escala con Hugectr

El último cuaderno que muestra cómo manejar conjuntos de datos muy grandes cuando los modelos de entrenamiento como DLRM para sistemas de recomendación. Las grandes empresas a menudo tienen millones de usuarios y artículos. Toda la tabla de incrustación de un modelo puede no encajar en una sola GPU. Para esto, Nvidia creó el marco de Hugectr.

Hugectrías es parte de un marco Nvidia Merlin y agrega instalaciones para capacitación distribuida y servicio de modelos de recomendación. El cuaderno detallado aquí se centra en la implementación y el servicio de Hugectrías y proporciona una versión previa al DLRM que puede usarse para el ejemplo. Puede encontrar más información sobre la capacitación distribuida con Hugectremect.

Para ejecutar el cuaderno local, ejecute lo siguiente

$ cd large-scale-recsys/
$ docker compose up # -d to daemonize

4. Implementación en la nube

Esta carpeta incluye scripts de terraza y libros de jugadas ansibles que implementan

Software Redis Enterprise
Instancias de GPU para la inferencia de tritón para servir
Instancia de Grafana y Prometeo para monitorear
Una VPN
Registros de DNS

Todo en Amazon Web Services.

Los ejemplos presentados en este repositorio se pueden ejecutar en la infraestructura terraformada con cambios mínimos. Este es un método rápido para implementar esta infraestructura para probar las tuberías del sistema de recomendación detalladas aquí. Vea el ReadMe dentro del depósito de nubes para obtener más información.

Recursos

Modelos previamente capacitados

Los modelos de este tutorial se pueden recuperar con la AWS CLI ejecutando

 aws s3 cp s3://redisventures/merlin/merlin-recsys-data.zip ./data

Repositorios

El siguiente enlace de repostorios al código/activos utilizados en artículos y cuadernos

Redis Ventures
Feast Github
Nvtabular
Auge
Modelos de Merlín
Sistemas de Merlín
Transformers4Rec

Cuadernos inspiradores

Los cuadernos aquí se basan en el trabajo de muchos cuadernos preexistentes como

Ejemplos de backend de Hugectremect
Ejemplos de Hugectremect
Ejemplos de Merlín
Implementación de RECSYS de varias etapas

Artículos y otras lecturas recomendadas

Recomendamos encarecidamente leer

Diseño de sistemas de aprendizaje automático
Artículo de DLRM
Merlín HPS
Ir más allá de la conversación de modelos de recomendación
Notas WDL
Cómo construir un dlrm
Papel monolítico

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2025-05-26
tamaño 32.81MB
Proviene de Github

Aplicaciones relacionadas

redis rs

2024-11-11
GitHub sgrebnov/cordova plugin background download

2024-11-05
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Complemento de caché Redis de Imperial CMS

2024-02-01
paquete de instalación de redis 3.0.5

2022-11-03
Herramienta de gestión de interfaz WEB de Redis phpRedisAdmin

2011-08-03

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo