redis nvidia recsys Download - redis nvidia recsys Quellcode Download

redis nvidia recsys

Anderer Quellcode

1.0.0

Herunterladen

Empfehlungssysteme mit Nvidia Merlin und Redis

Dieses Repository enthält die Vermögenswerte, die den Artikel " Offline to Online: Feature-Speicher für Echtzeit-Empfehlungssysteme mit NVIDIA Merlin " ergänzen, die ursprünglich für den NVIDIA Developer-Blog geschrieben wurden.

Empfehlungssystemarchitekturen

Wir geben Beispiele für Empfehlungssystemarchitekturen und bieten Cloud -Bereitstellungsanweisungen für die Produktionsnutzung an. Jedes der Beispiele stützt sich auf Redis und den Nvidia Merlin -Framework, das eine Reihe von Bausteinen zum Erstellen von Empfehlungssystemen bietet.

Es gibt 3 Beispiele in diesem Repository

Offline -Batch -Empfehlungen
Online -Empfehlungssysteme
Großräumige Empfehlungsmodelle mit Übersicht

Der große Maßstab erweitert die zweite Architektur für Anwendungsfälle, in denen ein großes (> 1 GPU) Training oder Inferenz benötigt wird.

Jedes der Beispiele ist so konzipiert, dass sie lokal auf einem NVIDIA-GPU-fähigen System mit Docker und Docker-Compose ausgeführt werden. Wir empfehlen, alle Folgenden in einer Cloud -Instanz mit einer NVIDIA -GPU (idealerweise The AWS Pytorch AMI) auszuführen.

Wir bieten jedoch auch eine Reihe von Terraformskripten und Ansible -Notebooks, mit denen die Infrastruktur bereitgestellt werden kann, die zur Ausführung der Beispiele zu AWS -Instanzen erforderlich ist.

1. Offline -Batch -Empfehlungen

Empfehlungssysteme "Offline" verwenden Batch Computing, um große Datenmengen zu verarbeiten und sie dann für das spätere Abrufen zu speichern. Das obige Diagramm zeigt ein Beispiel für ein solches System, das einen Zwei-Turm-Ansatz verwendet, um Empfehlungen zu erzeugen und sie dann in einer Redis-Datenbank für ein späteres Abrufen zu speichern.

Das Offline -Notizbuch bietet Methoden zum Aufbau dieser Art von Empfehlungssystem sowie Züge und exportiert die Modelle, die für die Ausführung des Online -Empfehlungssystems im folgenden Abschnitt erforderlich sind.

Führen Sie Folgendes aus, um das Notizbuch auszuführen, um Folgendes auszuführen

$ cd offline-batch-recsys/
$ docker compose up # -d to daemonize

Öffnen Sie dann den von Jupyter in einem Browser generierten Link.

2. Online -Empfehlungssysteme

Ein "Online" -Erempfehlungssystem generiert Empfehlungen on-Demand. Im Gegensatz zu batchorientierten Systemen sind Online-Systeme mit Latenz und begrenzt. Bei der Gestaltung dieser Systeme ist die Zeitspanne für die Erstellung von Empfehlungen wahrscheinlich der wichtigste Faktor. Jeder Teil des Systems wird üblicherweise um 100-300 ms eingedeckt und benötigt Komponenten, die nicht nur effizient, sondern auch für Millionen von Benutzern und Elementen skalierbar sind. Das Erstellen eines Online-Empfehlungssystems hat wesentlich mehr Einschränkungen als Batch-Systeme. Das Ergebnis ist jedoch häufig bessere Empfehlungen, da in Echtzeit aktualisiert werden kann. Das obige Diagramm zeigt ein Beispiel für diese Architektur.

Das vorherige Beispiel für Batch-Empfehlungen generiert die Modelle und Datensätze für dieses Notebook

 aws s3 cp s3://redisventures/merlin/merlin-recsys-data.zip ./data

Führen Sie Folgendes aus, um das Notizbuch auszuführen, um Folgendes auszuführen

$ cd online-multi-stage-recsys/
$ docker compose up # -d to daemonize

Dieser Abschnitt enthält zwei Notizbücher: eine für die Bereitstellung des Feature Store (REDIS) und zum Erstellen des Vector Index (REDIS) und eines zum Definieren und Ausführen des Ensemble -Modells, um die gesamte Pipeline (Triton) auszuführen.

Hinweis: Stellen Sie sicher, dass Sie das erste Notizbuch vor dem zweiten ausführen oder das Modell wird nicht ausgeführt.

3.. Große Empfehlungsmodelle mit Übersicht

Das letzte Notizbuch, das zeigt, wie Sie mit sehr großen Datensätzen umgehen, wenn Trainingsmodelle wie DLRM für Empfehlungssysteme. Große Unternehmen haben oft Millionen von Benutzern und Elementen. Die gesamte Einbettungstabelle eines Modells passt möglicherweise nicht auf eine einzelne GPU. Dafür erstellte Nvidia das Übersichts -Framework.

Hugecr ist Teil eines Nvidia Merlin -Frameworks und fügt Einrichtungen für verteilte Schulungen und Servierungen von Empfehlungsmodellen hinzu. Das hier beschriebene Notizbuch konzentriert sich auf die Bereitstellung und das Servieren von Übersicht und bietet eine vorgebildete Version von DLRM, die für das Beispiel verwendet werden kann. Weitere Informationen zum verteilten Training mit Übersicht finden Sie hier.

Führen Sie Folgendes aus, um das lokale Notizbuch auszuführen

$ cd large-scale-recsys/
$ docker compose up # -d to daemonize

4. Cloud -Bereitstellung

Dieser Ordner enthält Terraformskripte und ansible Playbooks, die bereitgestellt werden

Redis Enterprise Software
GPU -Instanzen für Triton -Inferenz.
Grafana und Prometheus -Instanz zur Überwachung
Ein VPN
DNS -Aufzeichnungen

Alles auf Amazon Web Services.

Die in diesem Repository vorgestellten Beispiele können alle auf der terraformierten Infrastruktur mit minimalen Änderungen durchgeführt werden. Dies ist eine schnelle Methode, um diese Infrastruktur bereitzustellen, um die hier detaillierten Empfehlungssystemepipelines auszuprobieren. Weitere weitere Informationen finden Sie in der Readme im Cloud-Deployment.

Ressourcen

Vorausgebildete Modelle

Die Modelle in diesem Tutorial können mit der AWS CLI durch Laufen abgerufen werden

 aws s3 cp s3://redisventures/merlin/merlin-recsys-data.zip ./data

Repositorys

Der folgende Repostories -Link zu Code/Assets, die in Artikeln und Notizbüchern verwendet werden

Redis Ventures
Festgithub
Nvtabular
Huge
Merlin -Modelle
Merlin -Systeme
Transformators4Rec

Inspirierende Notizbücher

Die Notizbücher hier bauen auf der Arbeit vieler bereits bestehender Notizbücher wie auf

Beispiele für Hiege -Backend -Beispiele
Huhnbeispiele
Merlin Beispiele
Bereitstellung mehrstufiger Recsys

Artikel und andere empfohlene Lesen

Wir empfehlen sehr

Entwerfen von maschinellem Lernsystemen
DLRM -Artikel
Merlin HPS
Übergehen über Empfehlungsmodelle über das Gespräch über Empfehlungsmodelle
WDL -Notizen
Wie man einen DLRM baut
Monolith -Papier

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ Anderer Quellcode
Aktualisierungszeit 2025-05-26
Größe 32.81MB
Kommt von Github

Ähnliche Anwendungen

redis rs

2024-11-11
GitHub sgrebnov/cordova plugin background download

2024-11-05
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Imperial CMS Redis Cache Plugin

2024-02-01
Redis-Installationspaket 3.0.5

2022-11-03
Redis WEB-Schnittstellenverwaltungstool phpRedisAdmin

2011-08-03

redis nvidia recsys

Empfehlungssysteme mit Nvidia Merlin und Redis

Empfehlungssystemarchitekturen

1. Offline -Batch -Empfehlungen

2. Online -Empfehlungssysteme

3.. Große Empfehlungsmodelle mit Übersicht

4. Cloud -Bereitstellung

Ressourcen

Vorausgebildete Modelle

Repositorys

Inspirierende Notizbücher

Artikel und andere empfohlene Lesen

redis rs

GitHub sgrebnov/cordova plugin background download

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

Imperial CMS Redis Cache Plugin

Redis-Installationspaket 3.0.5

Redis WEB-Schnittstellenverwaltungstool phpRedisAdmin

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express