Téléchargement training operator - Téléchargement du code source training operator

training operator

Autre code source

v1.8.1 release

Télécharger

Opérateur de formation Kubeflow

Statut de construction

Aperçu

L'opérateur de formation Kubeflow est un projet natif de Kubernetes pour les modèles de réglage fin et évolutif de l'apprentissage automatique (ML) créés avec divers cadres ML tels que Pytorch, Tensorflow, Huggingface, Jax, Deeppeed, Xgboost, Paddlepadddle et autres.

Vous pouvez exécuter des tâches informatiques hautes performances (HPC) avec l'opérateur de formation et MPIJob car il prend en charge l'interface de passage de messages (MPI) sur Kubernetes qui est fortement utilisé pour HPC. L'opérateur de formation implémente la version API V1 de l'opérateur MPI. Pour la version MPI Operator V2, veuillez suivre ce guide pour installer MPI Operator V2.

L'opérateur de formation vous permet d'utiliser des charges de travail Kubernetes pour former efficacement vos grands modèles via des API de ressources personnalisées Kubernetes ou en utilisant le SDK de l'opérateur de formation Python.

Condition préalable

Veuillez consulter la documentation officielle de Kubeflow pour les conditions préalables pour installer l'opérateur de formation.

Installation

Veuillez suivre le guide de l'opérateur de formation de Kubeflow pour les instructions détaillées sur la façon d'installer l'opérateur de formation.

Installation du plan de commande

Exécutez la commande suivante pour installer la dernière version stable du plan de contrôle de l'opérateur de formation: v1.8.0 .

kubectl apply --server-side=true -k " github.com/kubeflow/training-operator.git/manifests/overlays/standalone?ref=v1.8.0 "

Exécutez la commande suivante pour installer les dernières modifications du plan de contrôle de l'opérateur de formation:

kubectl apply --server-side=true -k " github.com/kubeflow/training-operator/manifests/overlays/standalone "

Installation du SDK Python

L'opérateur de formation met en œuvre un SDK Python pour simplifier la création d'une formation distribuée et des travaux de réglage fin pour les scientifiques des données.

Exécutez la commande suivante pour installer la dernière version stable du SDK de formation:

 pip install -U kubeflow-training

Commencer

Veuillez vous référer au Guide de démarrage pour créer rapidement votre premier travail de formation distribué à l'aide du SDK Python.

Si vous souhaitez travailler directement avec les ressources personnalisées de Kubernetes fournies par l'opérateur de formation, suivez le guide Pytorchjob MNIST.

Communauté

Les liens suivants fournissent des informations sur la façon de s'impliquer dans la communauté:

Assistez à la réunion de la communauté des groupes de travail en automobile et à la formation.
Rejoignez notre canal Slack #kubeflow-training .
Découvrez qui utilise l'opérateur de formation.

Cela fait partie de Kubeflow, alors veuillez consulter ReadMe dans Kubeflow / Kubeflow pour entrer en contact avec la communauté.

Contributif

Veuillez vous référer au guide de contribution.

Modifier le journal

Veuillez vous référer au Changelog.

Matrice de version

Le tableau suivant répertorie les quelques versions les plus récentes de l'opérateur.

Version de l'opérateur	Version API	Version kubernetes
`v1.4.x`	`v1`	1.23+
`v1.5.x`	`v1`	1.23+
`v1.6.x`	`v1`	1.23+
`v1.7.x`	`v1`	1.25+
`v1.8.x`	`v1`	1.27+
`latest` (chef maître)	`v1`	1.27+

Référence

Pour une référence complète des définitions de ressources personnalisées, veuillez vous référer à la définition de l'API.

Définition de l'API TensorFlow
Définition de l'API Pytorch
Définition de l'API xgboost
Définition de l'API MPI
Définition de l'API à palette
Définition de l'API JAX

Pour plus de détails sur les API des ressources personnalisées de l'opérateur de formation, reportez-vous à la documentation API suivante

Reconnaissance

Ce projet a été initialement lancé en tant qu'opérateur de formation distribué pour TensorFlow et plus tard, nous avons fusionné les efforts d'autres opérateurs de formation de Kubeflow pour offrir une expérience unifiée et simplifiée aux utilisateurs et aux développeurs. Nous sommes très reconnaissants à tous ceux qui ont déposé des problèmes ou aidé à les résoudre, à poser et à répondre à des questions, et ont fait partie des discussions inspirantes. Nous tenons également à remercier tous ceux qui ont contribué et ont maintenu les opérateurs d'origine.

Opérateur de Pytorch: liste des contributeurs et des responsables.
Opérateur MPI: Liste des contributeurs et maintenants.
Opérateur XGBOost: Liste des contributeurs et maintenants.
Bibliothèque commune: liste des contributeurs et des maintenseurs.

Développer

Informations supplémentaires

Version v1.8.1 release
Type Autre code source
Date de mise à jour 2025-02-24
taille 3.14MB
Provenant de Github

Applications connexes

GitHub sgrebnov/cordova plugin background download

2024-11-05
prometheus operator

2024-11-02
Jeu APP d'entraînement cérébral TBT (entraînement cérébral)

2023-12-06
Entraînement à la réaction des kickers muraux

2023-11-01
Formation au festival de rêve d'idole

2023-08-15
Formation d'ensemble

2023-08-15

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Autre code source

1.0.0
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Autre code source

1.0.0

Actualités connexes Tout