redis nvidia recsys Téléchargement - redis nvidia recsys Code source Télécharger

redis nvidia recsys

Autre code source

1.0.0

Télécharger

Systèmes de recommandation avec Nvidia Merlin et Redis

Ce référentiel contient les actifs qui complètent l'article " Offline to Online: Feature Storage pour les systèmes de recommandation en temps réel avec Nvidia Merlin " Écrit à l'origine pour le blog de développeur NVIDIA.

Architectures du système de recommandation

Nous fournissons des exemples d'architectures de système de recommandation et fournissons des instructions de déploiement de cloud pour l'utilisation de la production. Chacun des exemples s'appuie sur Redis et le cadre Nvidia Merlin qui fournit un certain nombre de blocs de construction pour créer des systèmes de recommandation.

Il y a 3 exemples dans ce référentiel

Recommandations de lots hors ligne
Systèmes de recommandation en ligne
Modèles de recommandation à grande échelle avec HugECT

La grande échelle développe la deuxième architecture pour les cas d'utilisation qui exigent une formation ou une inférence à grande échelle (> 1 GPU).

Chacun des exemples est conçu pour s'exécuter localement sur un système compatible NVIDIA GPU avec Docker et Docker-Compose. Nous vous recommandons d'exécuter tous les éléments suivants sur une instance cloud avec un GPU Nvidia (idéalement le AWS Pytorch Ami)

Cependant, nous fournissons également un ensemble de scripts Terraform et de cahiers anibles qui peuvent déployer l'infrastructure nécessaire pour exécuter les exemples sur les instances AWS.

1. Recommandations de lots hors ligne

Les systèmes de recommandation "hors ligne" utilisent l'informatique par lots pour traiter de grandes quantités de données, puis les stocker pour une récupération ultérieure. Le diagramme ci-dessus montre un exemple d'un tel système qui utilise une approche à deux points pour générer des recommandations, puis les stocke dans une base de données Redis pour une récupération ultérieure.

Le cahier hors ligne fournit des méthodes pour construire ce type de système de recommandation ainsi que des trains et exportations des modèles nécessaires à l'exécution du système de recommandation en ligne dans la section suivante.

Pour exécuter le cahier, exécutez ce qui suit

$ cd offline-batch-recsys/
$ docker compose up # -d to daemonize

Ouvrez ensuite le lien généré par Jupyter dans un navigateur.

2. Systèmes de recommandation en ligne

Un système de recommandation "en ligne" génère des recommandations à la demande. Contrairement aux systèmes axés sur les lots, les systèmes en ligne sont liés à la latence. Lors de la conception de ces systèmes, la durée pour produire des recommandations est probablement le facteur le plus important. Courpué autour de 100 à 300 ms, chaque partie du système a besoin de composants qui sont non seulement efficaces mais évolutifs à des millions d'utilisateurs et d'éléments. La création d'un système de recommandation en ligne a beaucoup plus de contraintes que les systèmes de lots, cependant, le résultat est souvent de meilleures recommandations car les informations (fonctionnalités) peuvent être mises à jour en temps réel. Le diagramme ci-dessus montre un exemple de cette architecture.

L'exemple précédent pour les recommandations par lots génère les modèles et les ensembles de données pour ce cahier, mais vous pouvez également télécharger des actifs pré-formés avec l'AWS CLI comme suit

 aws s3 cp s3://redisventures/merlin/merlin-recsys-data.zip ./data

Pour exécuter le cahier, exécutez ce qui suit

$ cd online-multi-stage-recsys/
$ docker compose up # -d to daemonize

Cette section contient deux ordinateurs portables: un pour le déploiement du magasin de fonctionnalités (redis) et la création de l'index vectoriel (redis) et un autre pour définir et exécuter le modèle d'ensemble pour exécuter l'intégralité du pipeline (Triton).

Remarque: assurez-vous d'exécuter le premier ordinateur portable avant le second ou le modèle ne s'exécutera pas.

3. Modèles de recommandation à grande échelle avec HugECTER

Le dernier cahier qui montre comment gérer de très grands ensembles de données lors de la formation de modèles comme DLRM pour les systèmes de recommandation. Les grandes entreprises comptent souvent des millions d'utilisateurs et d'articles. L'ensemble du tableau d'intégration d'un modèle peut ne pas tenir sur un seul GPU. Pour cela, NVIDIA a créé le Framework Hugecct.

Hugectr fait partie d'un cadre Nvidia Merlin et ajoute des installations pour la formation distribuée et le service de modèles de recommandation. Le cahier détaillé ici se concentre sur le déploiement et la portion de Hugectr et fournit une version pré-formée de DLRM qui peut être utilisée pour l'exemple. Plus d'informations sur la formation distribuée avec Hugectrage peuvent être trouvées ici.

Pour exécuter le cahier local, exécutez ce qui suit

$ cd large-scale-recsys/
$ docker compose up # -d to daemonize

4. Déploiement du cloud

Ce dossier comprend des scripts Terraform et des livres de jeu anibles qui déploient

Reded Enterprise Software
Instances GPU pour le service d'inférence Triton
Instance Grafana et Prometheus pour la surveillance
Un VPN
DNS Records

Tous sur Amazon Web Services.

Les exemples présentés dans ce référentiel peuvent tous être exécutés sur l'infrastructure terraformée avec un minimum de changements. Il s'agit d'une méthode rapide pour déployer cette infrastructure pour essayer les pipelines du système de recommandation détaillées ici. Voir le ReadMe dans le déploiement du cloud pour en savoir plus.

Ressources

Modèles pré-formés

Les modèles de ce tutoriel peuvent être récupérés avec la CLI AWS en fonctionnant

 aws s3 cp s3://redisventures/merlin/merlin-recsys-data.zip ./data

Référentiels

Le lien des repostoires suivants vers le code / les actifs utilisés dans les articles et les cahiers

Redis Ventures
Fête Github
Nvtabulaire
Émissaire
Modèles Merlin
Systèmes Merlin
Transformers4rec

Cahiers inspirants

Les cahiers ici s'appuient sur le travail de nombreux cahiers préexistants tels que

Exemples de backend Hugectr
Exemples HUGECTR
Exemples de Merlin
Déploiement de Recsys en plusieurs étapes

Articles et autres lectures recommandées

Nous recommandons fortement la lecture

Conception de systèmes d'apprentissage automatique
Article DLRM
Merlin HPS
Aller au-delà des modèles de recommandation Talk
Notes WDL
Comment construire un DLRM
Papier monolithe

Développer

Informations supplémentaires

Version 1.0.0
Type Autre code source
Date de mise à jour 2025-05-26
taille 32.81MB
Provenant de Github

Applications connexes

redis rs

2024-11-11
GitHub sgrebnov/cordova plugin background download

2024-11-05
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Plugin de cache Redis Imperial CMS

2024-02-01
paquet d'installation Redis 3.0.5

2022-11-03
Outil de gestion d'interface WEB Redis phpRedisAdmin

2011-08-03

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout