pytorch widedeep Download - pytorch widedeep Source Code Download

pytorch-oweep

Un package flexible pour l'apprentissage multimodal-profondeur pour combiner des données tabulaires avec du texte et des images utilisant des modèles larges et profonds à Pytorch

Documentation: https://pytorch-wideep.readthedocs.io

Postes et tutoriels compagnon: Infinitomle

Expériences et comparaison avec LightGBM : Tabulardl vs LightGBM

Slack : Si vous voulez contribuer ou simplement discuter avec nous, rejoignez Slack

Le contenu de ce document est organisé comme suit:

pytorch-oweep
- Introduction
- Architectures
- La composante deeptabular
- Le module rec
- Texte et images
- Installation
  - Installation du développeur
- Démarrage rapide
- Essai
- Comment contribuer
- Remerciements
- Licence
- Citer
  - Bibtex
  - Apa

Introduction

pytorch-widedeep est basé sur l'algorithme large et profond de Google, ajusté pour les ensembles de données multimodaux.

En termes généraux, pytorch-widedeep est un package pour utiliser l'apprentissage en profondeur avec des données tabulaires. En particulier, est destiné à faciliter la combinaison du texte et des images avec des données tabulaires correspondantes à l'aide de modèles larges et profonds. Dans cet esprit, il existe un certain nombre d'architectures qui peuvent être implémentées avec la bibliothèque. Les principaux composants de ces architectures sont illustrés dans la figure ci-dessous:

En termes de mathématiques et en suivant la notation dans l'article, l'expression de l'architecture sans composante deephead peut être formulée comme:

Lorsque σ est la fonction sigmoïde, «w» sont les matrices de poids appliquées au modèle large et aux activations finales des modèles profonds, «a» sont ces activations finales, φ (x) sont les transformations de produit transversal des caractéristiques d'origine «x» et, et «b» est le terme de biais. Dans le cas où vous vous demandez ce que sont les «transformations transversales» , voici un devis tiré directement de l'article: «Pour les caractéristiques binaires, une transformation transversale (par exemple,« et (genre = femme, langage = en) »est 1 si et seulement si les caractéristiques constituantes (« genre = femme »et« langue = en ») sont toutes 1 et 0 autrement».

Il est parfaitement possible d'utiliser des modèles personnalisés (et pas nécessairement ceux de la bibliothèque) tant que les modèles personnalisés ont une propriété appelée output_dim avec la taille de la dernière couche d'activations, afin que WideDeep puisse être construit. Des exemples sur la façon d'utiliser des composants personnalisés peuvent être trouvés dans le dossier Exemples et la section ci-dessous.

Architectures

La bibliothèque pytorch-widedeep propose un certain nombre d'architectures différentes. Dans cette section, nous en montrerons certains sous leur forme la plus simple (c'est-à-dire avec les valeurs de paramètres par défaut dans la plupart des cas) avec leurs extraits de code correspondants. Notez que tous les extraits sous Shoud fonctionnent localement. Pour une explication plus détaillée des différents composants et de leurs paramètres, veuillez vous référer à la documentation.

Pour les exemples ci-dessous, nous utiliserons un ensemble de données de jouets généré comme suit:

 import os
import random

import numpy as np
import pandas as pd
from PIL import Image
from faker import Faker


def create_and_save_random_image ( image_number , size = ( 32 , 32 )):

    if not os . path . exists ( "images" ):
        os . makedirs ( "images" )

    array = np . random . randint ( 0 , 256 , ( size [ 0 ], size [ 1 ], 3 ), dtype = np . uint8 )

    image = Image . fromarray ( array )

    image_name = f"image_ { image_number } .png"
    image . save ( os . path . join ( "images" , image_name ))

    return image_name


fake = Faker ()

cities = [ "New York" , "Los Angeles" , "Chicago" , "Houston" ]
names = [ "Alice" , "Bob" , "Charlie" , "David" , "Eva" ]

data = {
    "city" : [ random . choice ( cities ) for _ in range ( 100 )],
    "name" : [ random . choice ( names ) for _ in range ( 100 )],
    "age" : [ random . uniform ( 18 , 70 ) for _ in range ( 100 )],
    "height" : [ random . uniform ( 150 , 200 ) for _ in range ( 100 )],
    "sentence" : [ fake . sentence () for _ in range ( 100 )],
    "other_sentence" : [ fake . sentence () for _ in range ( 100 )],
    "image_name" : [ create_and_save_random_image ( i ) for i in range ( 100 )],
    "target" : [ random . choice ([ 0 , 1 ]) for _ in range ( 100 )],
}

df = pd . DataFrame ( data )

Cela créera une dataframe de 100 lignes et un DIR dans votre dossier local, appelé images avec 100 images aléatoires (ou images avec juste du bruit).

Peut-être que l'architecture la plus simple ne serait qu'un composant, wide , deeptabular , deeptext ou deepimage , ce qui est également possible, mais commençons les exemples avec une architecture large et profonde standard. De là, comment construire un modèle composé d'un seul composant sera simple.

Notez que les exemples illustrés ci-dessous seraient presque identiques en utilisant l'un des modèles disponibles dans la bibliothèque. Par exemple, TabMlp peut être remplacé par TabResnet , TabNet , TabTransformer , etc. De même, BasicRNN peut être remplacé par AttentiveRNN , StackedAttentiveRNN ou HFModel avec leurs paramètres correspondants et leur préprocesseur dans le cas des modèles de visage étreintes.

1. Composant de large et tabulaire (aka Deeptabular)

 from pytorch_widedeep . preprocessing import TabPreprocessor , WidePreprocessor
from pytorch_widedeep . models import Wide , TabMlp , WideDeep
from pytorch_widedeep . training import Trainer

# Wide
wide_cols = [ "city" ]
crossed_cols = [( "city" , "name" )]
wide_preprocessor = WidePreprocessor ( wide_cols = wide_cols , crossed_cols = crossed_cols )
X_wide = wide_preprocessor . fit_transform ( df )
wide = Wide ( input_dim = np . unique ( X_wide ). shape [ 0 ])

# Tabular
tab_preprocessor = TabPreprocessor (
    embed_cols = [ "city" , "name" ], continuous_cols = [ "age" , "height" ]
)
X_tab = tab_preprocessor . fit_transform ( df )
tab_mlp = TabMlp (
    column_idx = tab_preprocessor . column_idx ,
    cat_embed_input = tab_preprocessor . cat_embed_input ,
    continuous_cols = tab_preprocessor . continuous_cols ,
    mlp_hidden_dims = [ 64 , 32 ],
)

# WideDeep
model = WideDeep ( wide = wide , deeptabular = tab_mlp )

# Train
trainer = Trainer ( model , objective = "binary" )

trainer . fit (
    X_wide = X_wide ,
    X_tab = X_tab ,
    target = df [ "target" ]. values ,
    n_epochs = 1 ,
    batch_size = 32 ,
)

2. Données tabulaires et texte

 from pytorch_widedeep . preprocessing import TabPreprocessor , TextPreprocessor
from pytorch_widedeep . models import TabMlp , BasicRNN , WideDeep
from pytorch_widedeep . training import Trainer

# Tabular
tab_preprocessor = TabPreprocessor (
    embed_cols = [ "city" , "name" ], continuous_cols = [ "age" , "height" ]
)
X_tab = tab_preprocessor . fit_transform ( df )
tab_mlp = TabMlp (
    column_idx = tab_preprocessor . column_idx ,
    cat_embed_input = tab_preprocessor . cat_embed_input ,
    continuous_cols = tab_preprocessor . continuous_cols ,
    mlp_hidden_dims = [ 64 , 32 ],
)

# Text
text_preprocessor = TextPreprocessor (
    text_col = "sentence" , maxlen = 20 , max_vocab = 100 , n_cpus = 1
)
X_text = text_preprocessor . fit_transform ( df )
rnn = BasicRNN (
    vocab_size = len ( text_preprocessor . vocab . itos ),
    embed_dim = 16 ,
    hidden_dim = 8 ,
    n_layers = 1 ,
)

# WideDeep
model = WideDeep ( deeptabular = tab_mlp , deeptext = rnn )

# Train
trainer = Trainer ( model , objective = "binary" )

trainer . fit (
    X_tab = X_tab ,
    X_text = X_text ,
    target = df [ "target" ]. values ,
    n_epochs = 1 ,
    batch_size = 32 ,
)

3. Tabulaire et texte avec une tête FC en haut via le param head_hidden_dims à WideDeep

 from pytorch_widedeep . preprocessing import TabPreprocessor , TextPreprocessor
from pytorch_widedeep . models import TabMlp , BasicRNN , WideDeep
from pytorch_widedeep . training import Trainer

# Tabular
tab_preprocessor = TabPreprocessor (
    embed_cols = [ "city" , "name" ], continuous_cols = [ "age" , "height" ]
)
X_tab = tab_preprocessor . fit_transform ( df )
tab_mlp = TabMlp (
    column_idx = tab_preprocessor . column_idx ,
    cat_embed_input = tab_preprocessor . cat_embed_input ,
    continuous_cols = tab_preprocessor . continuous_cols ,
    mlp_hidden_dims = [ 64 , 32 ],
)

# Text
text_preprocessor = TextPreprocessor (
    text_col = "sentence" , maxlen = 20 , max_vocab = 100 , n_cpus = 1
)
X_text = text_preprocessor . fit_transform ( df )
rnn = BasicRNN (
    vocab_size = len ( text_preprocessor . vocab . itos ),
    embed_dim = 16 ,
    hidden_dim = 8 ,
    n_layers = 1 ,
)

# WideDeep
model = WideDeep ( deeptabular = tab_mlp , deeptext = rnn , head_hidden_dims = [ 32 , 16 ])

# Train
trainer = Trainer ( model , objective = "binary" )

trainer . fit (
    X_tab = X_tab ,
    X_text = X_text ,
    target = df [ "target" ]. values ,
    n_epochs = 1 ,
    batch_size = 32 ,
)

4. Colonnes de texte tabulaire et multiple qui sont transmises directement à WideDeep

 from pytorch_widedeep . preprocessing import TabPreprocessor , TextPreprocessor
from pytorch_widedeep . models import TabMlp , BasicRNN , WideDeep
from pytorch_widedeep . training import Trainer


# Tabular
tab_preprocessor = TabPreprocessor (
    embed_cols = [ "city" , "name" ], continuous_cols = [ "age" , "height" ]
)
X_tab = tab_preprocessor . fit_transform ( df )
tab_mlp = TabMlp (
    column_idx = tab_preprocessor . column_idx ,
    cat_embed_input = tab_preprocessor . cat_embed_input ,
    continuous_cols = tab_preprocessor . continuous_cols ,
    mlp_hidden_dims = [ 64 , 32 ],
)

# Text
text_preprocessor_1 = TextPreprocessor (
    text_col = "sentence" , maxlen = 20 , max_vocab = 100 , n_cpus = 1
)
X_text_1 = text_preprocessor_1 . fit_transform ( df )
text_preprocessor_2 = TextPreprocessor (
    text_col = "other_sentence" , maxlen = 20 , max_vocab = 100 , n_cpus = 1
)
X_text_2 = text_preprocessor_2 . fit_transform ( df )
rnn_1 = BasicRNN (
    vocab_size = len ( text_preprocessor_1 . vocab . itos ),
    embed_dim = 16 ,
    hidden_dim = 8 ,
    n_layers = 1 ,
)
rnn_2 = BasicRNN (
    vocab_size = len ( text_preprocessor_2 . vocab . itos ),
    embed_dim = 16 ,
    hidden_dim = 8 ,
    n_layers = 1 ,
)

# WideDeep
model = WideDeep ( deeptabular = tab_mlp , deeptext = [ rnn_1 , rnn_2 ])

# Train
trainer = Trainer ( model , objective = "binary" )

trainer . fit (
    X_tab = X_tab ,
    X_text = [ X_text_1 , X_text_2 ],
    target = df [ "target" ]. values ,
    n_epochs = 1 ,
    batch_size = 32 ,
)

5. Données tabulaires et plusieurs colonnes de texte qui sont fusionnées via la classe ModelFuser de la bibliothèque

 from pytorch_widedeep . preprocessing import TabPreprocessor , TextPreprocessor
from pytorch_widedeep . models import TabMlp , BasicRNN , WideDeep , ModelFuser
from pytorch_widedeep import Trainer

# Tabular
tab_preprocessor = TabPreprocessor (
    embed_cols = [ "city" , "name" ], continuous_cols = [ "age" , "height" ]
)
X_tab = tab_preprocessor . fit_transform ( df )
tab_mlp = TabMlp (
    column_idx = tab_preprocessor . column_idx ,
    cat_embed_input = tab_preprocessor . cat_embed_input ,
    continuous_cols = tab_preprocessor . continuous_cols ,
    mlp_hidden_dims = [ 64 , 32 ],
)

# Text
text_preprocessor_1 = TextPreprocessor (
    text_col = "sentence" , maxlen = 20 , max_vocab = 100 , n_cpus = 1
)
X_text_1 = text_preprocessor_1 . fit_transform ( df )
text_preprocessor_2 = TextPreprocessor (
    text_col = "other_sentence" , maxlen = 20 , max_vocab = 100 , n_cpus = 1
)
X_text_2 = text_preprocessor_2 . fit_transform ( df )

rnn_1 = BasicRNN (
    vocab_size = len ( text_preprocessor_1 . vocab . itos ),
    embed_dim = 16 ,
    hidden_dim = 8 ,
    n_layers = 1 ,
)
rnn_2 = BasicRNN (
    vocab_size = len ( text_preprocessor_2 . vocab . itos ),
    embed_dim = 16 ,
    hidden_dim = 8 ,
    n_layers = 1 ,
)

models_fuser = ModelFuser ( models = [ rnn_1 , rnn_2 ], fusion_method = "mult" )

# WideDeep
model = WideDeep ( deeptabular = tab_mlp , deeptext = models_fuser )

# Train
trainer = Trainer ( model , objective = "binary" )

trainer . fit (
    X_tab = X_tab ,
    X_text = [ X_text_1 , X_text_2 ],
    target = df [ "target" ]. values ,
    n_epochs = 1 ,
    batch_size = 32 ,
)

6. Colonnes de texte tabulaires et multiples, avec une colonne d'image. Les colonnes de texte sont fusionnées via le ModelFuser de la bibliothèque, puis tous fusionnés via le parament Deephead à WideDeep qui est un ModelFuser personnalisé codé par l'utilisateur

Il s'agit peut-être de la solution la moins élégante car elle implique un composant personnalisé par l'utilisateur et la coupe du tenseur «entrant». À l'avenir, nous inclurons un TextAndImageModelFuser pour rendre ce processus plus simple. Pourtant, n'est pas vraiment compliqué et c'est un bon exemple de la façon d'utiliser des composants personnalisés dans pytorch-widedeep .

Notez que la seule exigence pour le composant personnalisé est qu'il a une propriété appelée output_dim qui renvoie la taille de la dernière couche d'activations. En d'autres termes, il n'a pas besoin de hériter de BaseWDModelComponent . Cette classe de base vérifie simplement l'existence de ces propriétés et évite certaines erreurs de frappe en interne.

 import torch

from pytorch_widedeep . preprocessing import TabPreprocessor , TextPreprocessor , ImagePreprocessor
from pytorch_widedeep . models import TabMlp , BasicRNN , WideDeep , ModelFuser , Vision
from pytorch_widedeep . models . _base_wd_model_component import BaseWDModelComponent
from pytorch_widedeep import Trainer

# Tabular
tab_preprocessor = TabPreprocessor (
    embed_cols = [ "city" , "name" ], continuous_cols = [ "age" , "height" ]
)
X_tab = tab_preprocessor . fit_transform ( df )
tab_mlp = TabMlp (
    column_idx = tab_preprocessor . column_idx ,
    cat_embed_input = tab_preprocessor . cat_embed_input ,
    continuous_cols = tab_preprocessor . continuous_cols ,
    mlp_hidden_dims = [ 16 , 8 ],
)

# Text
text_preprocessor_1 = TextPreprocessor (
    text_col = "sentence" , maxlen = 20 , max_vocab = 100 , n_cpus = 1
)
X_text_1 = text_preprocessor_1 . fit_transform ( df )
text_preprocessor_2 = TextPreprocessor (
    text_col = "other_sentence" , maxlen = 20 , max_vocab = 100 , n_cpus = 1
)
X_text_2 = text_preprocessor_2 . fit_transform ( df )
rnn_1 = BasicRNN (
    vocab_size = len ( text_preprocessor_1 . vocab . itos ),
    embed_dim = 16 ,
    hidden_dim = 8 ,
    n_layers = 1 ,
)
rnn_2 = BasicRNN (
    vocab_size = len ( text_preprocessor_2 . vocab . itos ),
    embed_dim = 16 ,
    hidden_dim = 8 ,
    n_layers = 1 ,
)
models_fuser = ModelFuser (
    models = [ rnn_1 , rnn_2 ],
    fusion_method = "mult" ,
)

# Image
image_preprocessor = ImagePreprocessor ( img_col = "image_name" , img_path = "images" )
X_img = image_preprocessor . fit_transform ( df )
vision = Vision ( pretrained_model_setup = "resnet18" , head_hidden_dims = [ 16 , 8 ])

# deephead (custom model fuser)
class MyModelFuser ( BaseWDModelComponent ):
    """
    Simply a Linear + Relu sequence on top of the text + images followed by a
    Linear -> Relu -> Linear for the concatenation of tabular slice of the
    tensor and the output of the text and image sequential model
    """
    def __init__ (
        self ,
        tab_incoming_dim : int ,
        text_incoming_dim : int ,
        image_incoming_dim : int ,
        output_units : int ,
    ):

        super ( MyModelFuser , self ). __init__ ()

        self . tab_incoming_dim = tab_incoming_dim
        self . text_incoming_dim = text_incoming_dim
        self . image_incoming_dim = image_incoming_dim
        self . output_units = output_units
        self . text_and_image_fuser = torch . nn . Sequential (
            torch . nn . Linear ( text_incoming_dim + image_incoming_dim , output_units ),
            torch . nn . ReLU (),
        )
        self . out = torch . nn . Sequential (
            torch . nn . Linear ( output_units + tab_incoming_dim , output_units * 4 ),
            torch . nn . ReLU (),
            torch . nn . Linear ( output_units * 4 , output_units ),
        )

    def forward ( self , X : torch . Tensor ) -> torch . Tensor :
        tab_slice = slice ( 0 , self . tab_incoming_dim )
        text_slice = slice (
            self . tab_incoming_dim , self . tab_incoming_dim + self . text_incoming_dim
        )
        image_slice = slice (
            self . tab_incoming_dim + self . text_incoming_dim ,
            self . tab_incoming_dim + self . text_incoming_dim + self . image_incoming_dim ,
        )
        X_tab = X [:, tab_slice ]
        X_text = X [:, text_slice ]
        X_img = X [:, image_slice ]
        X_text_and_image = self . text_and_image_fuser ( torch . cat ([ X_text , X_img ], dim = 1 ))
        return self . out ( torch . cat ([ X_tab , X_text_and_image ], dim = 1 ))

    @ property
    def output_dim ( self ):
        return self . output_units


deephead = MyModelFuser (
    tab_incoming_dim = tab_mlp . output_dim ,
    text_incoming_dim = models_fuser . output_dim ,
    image_incoming_dim = vision . output_dim ,
    output_units = 8 ,
)

# WideDeep
model = WideDeep (
    deeptabular = tab_mlp ,
    deeptext = models_fuser ,
    deepimage = vision ,
    deephead = deephead ,
)

# Train
trainer = Trainer ( model , objective = "binary" )

trainer . fit (
    X_tab = X_tab ,
    X_text = [ X_text_1 , X_text_2 ],
    X_img = X_img ,
    target = df [ "target" ]. values ,
    n_epochs = 1 ,
    batch_size = 32 ,
)

7. Un modèle à deux points

Il s'agit d'un modèle populaire dans le contexte des systèmes de recommandation. Disons que nous avons un ensemble de données tabulaire formé mes triplets (fonctionnalités utilisateur, fonctionnalités de l'élément, cible). Nous pouvons créer un modèle à deux hautes où les fonctionnalités de l'utilisateur et de l'élément sont passées à travers deux modèles distincts, puis "fusionnés" via un produit DOT.

 import numpy as np
import pandas as pd

from pytorch_widedeep import Trainer
from pytorch_widedeep . preprocessing import TabPreprocessor
from pytorch_widedeep . models import TabMlp , WideDeep , ModelFuser

# Let's create the interaction dataset
# user_features dataframe
np . random . seed ( 42 )
user_ids = np . arange ( 1 , 101 )
ages = np . random . randint ( 18 , 60 , size = 100 )
genders = np . random . choice ([ "male" , "female" ], size = 100 )
locations = np . random . choice ([ "city_a" , "city_b" , "city_c" , "city_d" ], size = 100 )
user_features = pd . DataFrame (
    { "id" : user_ids , "age" : ages , "gender" : genders , "location" : locations }
)

# item_features dataframe
item_ids = np . arange ( 1 , 101 )
prices = np . random . uniform ( 10 , 500 , size = 100 ). round ( 2 )
colors = np . random . choice ([ "red" , "blue" , "green" , "black" ], size = 100 )
categories = np . random . choice ([ "electronics" , "clothing" , "home" , "toys" ], size = 100 )

item_features = pd . DataFrame (
    { "id" : item_ids , "price" : prices , "color" : colors , "category" : categories }
)

# Interactions dataframe
interaction_user_ids = np . random . choice ( user_ids , size = 1000 )
interaction_item_ids = np . random . choice ( item_ids , size = 1000 )
purchased = np . random . choice ([ 0 , 1 ], size = 1000 , p = [ 0.7 , 0.3 ])
interactions = pd . DataFrame (
    {
        "user_id" : interaction_user_ids ,
        "item_id" : interaction_item_ids ,
        "purchased" : purchased ,
    }
)
user_item_purchased = interactions . merge (
    user_features , left_on = "user_id" , right_on = "id"
). merge ( item_features , left_on = "item_id" , right_on = "id" )

# Users
tab_preprocessor_user = TabPreprocessor (
    cat_embed_cols = [ "gender" , "location" ],
    continuous_cols = [ "age" ],
)
X_user = tab_preprocessor_user . fit_transform ( user_item_purchased )
tab_mlp_user = TabMlp (
    column_idx = tab_preprocessor_user . column_idx ,
    cat_embed_input = tab_preprocessor_user . cat_embed_input ,
    continuous_cols = [ "age" ],
    mlp_hidden_dims = [ 16 , 8 ],
    mlp_dropout = [ 0.2 , 0.2 ],
)

# Items
tab_preprocessor_item = TabPreprocessor (
    cat_embed_cols = [ "color" , "category" ],
    continuous_cols = [ "price" ],
)
X_item = tab_preprocessor_item . fit_transform ( user_item_purchased )
tab_mlp_item = TabMlp (
    column_idx = tab_preprocessor_item . column_idx ,
    cat_embed_input = tab_preprocessor_item . cat_embed_input ,
    continuous_cols = [ "price" ],
    mlp_hidden_dims = [ 16 , 8 ],
    mlp_dropout = [ 0.2 , 0.2 ],
)

two_tower_model = ModelFuser ([ tab_mlp_user , tab_mlp_item ], fusion_method = "dot" )

model = WideDeep ( deeptabular = two_tower_model )

trainer = Trainer ( model , objective = "binary" )

trainer . fit (
    X_tab = [ X_user , X_item ],
    target = interactions . purchased . values ,
    n_epochs = 1 ,
    batch_size = 32 ,
)

8. Tabulaire avec une perte multi-cible

Celui-ci est "un bonus" pour illustrer l'utilisation de pertes multi-cibles, plus qu'une architecture différente.

 from pytorch_widedeep . preprocessing import TabPreprocessor , TextPreprocessor , ImagePreprocessor
from pytorch_widedeep . models import TabMlp , BasicRNN , WideDeep , ModelFuser , Vision
from pytorch_widedeep . losses_multitarget import MultiTargetClassificationLoss
from pytorch_widedeep . models . _base_wd_model_component import BaseWDModelComponent
from pytorch_widedeep import Trainer

# let's add a second target to the dataframe
df [ "target2" ] = [ random . choice ([ 0 , 1 ]) for _ in range ( 100 )]

# Tabular
tab_preprocessor = TabPreprocessor (
    embed_cols = [ "city" , "name" ], continuous_cols = [ "age" , "height" ]
)
X_tab = tab_preprocessor . fit_transform ( df )
tab_mlp = TabMlp (
    column_idx = tab_preprocessor . column_idx ,
    cat_embed_input = tab_preprocessor . cat_embed_input ,
    continuous_cols = tab_preprocessor . continuous_cols ,
    mlp_hidden_dims = [ 64 , 32 ],
)

# 'pred_dim=2' because we have two binary targets. For other types of targets,
#  please, see the documentation
model = WideDeep ( deeptabular = tab_mlp , pred_dim = 2 ).

loss = MultiTargetClassificationLoss ( binary_config = [ 0 , 1 ], reduction = "mean" )

# When a multi-target loss is used, 'custom_loss_function' must not be None.
# See the docs
trainer = Trainer ( model , objective = "multitarget" , custom_loss_function = loss )

trainer . fit (
    X_tab = X_tab ,
    target = df [[ "target" , "target2" ]]. values ,
    n_epochs = 1 ,
    batch_size = 32 ,
)

La composante `deeptabular`

Il est important de souligner à nouveau que chaque composant individuel, wide , deeptabular , deeptext et deepimage , peut être utilisé de manière indépendante et isolée. Par exemple, on pourrait utiliser uniquement wide , ce qui est simplement dans un modèle linéaire. En fait, l'une des fonctionnalités les plus intéressantes de pytorch-widedeep serait l'utilisation de la composante deeptabular en soi, c'est-à-dire ce que l'on pourrait normalement qualifier l'apprentissage en profondeur des données tabulaires. Actuellement, pytorch-widedeep propose les différents modèles suivants pour ce composant:

Large : un modèle linéaire simple où les non-linéarités sont capturées via des transformations de produits croisés, comme expliqué précédemment.
TABMLP : Un MLP simple qui reçoit des intégres représentant les caractéristiques catégorielles, concaténées avec les caractéristiques continues, qui peuvent également être intégrées.
TabResnet : similaire au modèle précédent, mais les incorporations sont passées à travers une série de blocs de resnet construits avec des couches denses.
Tabnet : les détails sur tabnet peuvent être trouvés dans tabnet: apprentissage tabulaire interprétable attentif

Deux modèles basés sur l'attention plus simples que nous appelons:

ContextAntentionMlp : MLP avec mécanisme d'attention "en haut" qui est basé sur les réseaux d'attention hiérarchiques pour la classification des documents
SelfAcTententionMLP : MLP avec un mécanisme d'attention qui est une version simplifiée d'un bloc de transformateur que nous appelons "l'auto-atténuer de la clé de requête".

La famille Tabformer , IE Transformers pour les données tabulaires:

TabTransformateur : les détails sur le TabTransformateur peuvent être trouvés dans TabTransformateur: Modélisation des données tabulaires à l'aide d'incorporation contextuelle.
Saint : Les détails sur Saint peuvent être trouvés dans Saint: Amélioration des réseaux de neurones pour les données tabulaires via l'attention des lignes et la pré-formation contrastive.
Transformateur FT : les détails sur le transformateur FT peuvent être trouvés dans la révision des modèles d'apprentissage en profondeur pour les données tabulaires.
TabFastFormer : adaptation du FastFormer pour les données tabulaires. Les détails sur le Fasformer peuvent être trouvés dans FastFormers: modèles de transformateurs très efficaces pour la compréhension du langage naturel
Tabpercever : adaptation du percepteur pour les données tabulaires. Les détails sur le percepteur peuvent être trouvés dans le percepteur: perception générale avec une attention itérative

Et des modèles DL probabilistes pour les données tabulaires basées sur l'incertitude de poids dans les réseaux de neurones:

Bayesian : adaptation probabiliste du modèle Wide .
BAYESIANTABMLP : Adaptation probabiliste du modèle TabMlp

Notez que bien qu'il existe des publications scientifiques pour le Tabtransformateur, Saint et FT-transformateur, le Tabfasfformer et Tabperceiver sont notre propre adaptation de ces algorithmes pour les données tabulaires.

De plus, la pré-entraînement autopératisée peut être utilisée pour tous les modèles deeptabular , à l'exception du TabPerceiver . La pré-formation auto-supervisée peut être utilisée via deux méthodes ou routines que nous appelons: Méthode d'encodeur-décodeur et méthode de déni de contrastement. Veuillez consulter la documentation et les exemples pour plus de détails sur cette fonctionnalité, et toutes les autres options de la bibliothèque.

Le module `rec`

Ce module a été introduit comme extension des composants existants de la bibliothèque, abordant les questions et les problèmes liés aux systèmes de recommandation. Bien qu'il soit toujours en développement actif, il comprend actuellement un nombre sélectionné de modèles de recommandation puissants.

Il convient de noter que cette bibliothèque a déjà soutenu la mise en œuvre de divers algorithmes de recommandation à l'aide de composants existants. Par exemple, des modèles comme le filtrage collaboratif large et profond, à deux points ou neuronal peuvent être construits en utilisant les fonctionnalités de base de la bibliothèque.

Les algorithmes de recommandation dans le module rec sont:

AUTOINT: Apprentissage automatique des fonctionnalités via des réseaux de neurones auto-attentifs
DeepFM: un réseau neuronal basé sur la machine de factorisation pour la prédiction CTR
(Deep) Machine de factorisation de conscience sur le terrain (FFM): une version en profondeur de l'algorithme présentée dans les machines de factorisation consciente du terrain dans un système publicitaire en ligne réel
xdeepfm: combinant des interactions de fonctionnalités explicites et implicites pour les systèmes de recommandation
Réseau d'intérêt profond pour la prévision du taux de clics
Réseau profond et croisé pour les prévisions de clics publicitaires
DCN V2: Amélioration du réseau profond et croisé et des leçons pratiques pour l'apprentissage à l'échelle du Web pour classer les systèmes
Vers une prévision de taux de clics plus profonde, plus légère et interprétable
Un modèle de base basé sur un transformateur pour recommandation où le problème est confronté comme séquence.

Voir les exemples pour plus de détails sur la façon d'utiliser ces modèles.

Texte et images

Pour le composant texte, deeptext , la bibliothèque propose les modèles suivants:

BasicRnn : un simple RNN 2. ATTENTIVERNN : un RNN avec un mécanisme d'attention basé sur les réseaux d'attention hiérarchiques pour DocumentClassification
EmpiledAttenvernn : une pile d'attendrornns
HFMODEL : un emballage autour des modèles basés sur des transfomères de visage étreignant. À l'heure actuelle, seuls les modèles des familles Bert, Roberta, Distilbert, Albert et Electra sont soutenus. En effet, cette bibliothèque est conçue pour résoudre les tâches de classification et de régression et ce sont les modèles les plus «populaires» uniquement encodeur, qui se sont avérés être ceux qui fonctionnent le mieux pour ces tâches. S'il y a une demande pour d'autres modèles, ils seront inclus à l'avenir.

Pour le composant d'image, deepimage , la bibliothèque prend en charge les modèles des familles suivantes: 'Resnet', 'Shufflenet', 'Resnext', 'Wide_resnet', 'Regnet', 'DenseNet', 'Mobilenetv3', 'MobileNetv2', 'Mnasnet', 'MobileNetV3' et 'MobileNetV2', ', Mnasnet', 'MobileNetV3' et 'MobileNetV2',. Ceux-ci sont proposés via torchvision et enveloppés dans la classe Vision .

Installation

Installer à l'aide de PIP:

pip install pytorch-widedeep

Ou installer directement à partir de github

pip install git+https://github.com/jrzaurin/pytorch-widedeep.git

Installation du développeur

 # Clone the repository
git clone https://github.com/jrzaurin/pytorch-widedeep
cd pytorch-widedeep

# Install in dev mode
pip install -e .

Démarrage rapide

Voici un exemple de bout en bout d'une classification binaire avec l'ensemble de données adulte en utilisant les paramètres Wide et DeepDense et par défaut.

Construire un modèle large (linéaire) et profond avec pytorch-widedeep :

 import numpy as np
import torch
from sklearn . model_selection import train_test_split

from pytorch_widedeep import Trainer
from pytorch_widedeep . preprocessing import WidePreprocessor , TabPreprocessor
from pytorch_widedeep . models import Wide , TabMlp , WideDeep
from pytorch_widedeep . metrics import Accuracy
from pytorch_widedeep . datasets import load_adult


df = load_adult ( as_frame = True )
df [ "income_label" ] = ( df [ "income" ]. apply ( lambda x : ">50K" in x )). astype ( int )
df . drop ( "income" , axis = 1 , inplace = True )
df_train , df_test = train_test_split ( df , test_size = 0.2 , stratify = df . income_label )

# Define the 'column set up'
wide_cols = [
    "education" ,
    "relationship" ,
    "workclass" ,
    "occupation" ,
    "native-country" ,
    "gender" ,
]
crossed_cols = [( "education" , "occupation" ), ( "native-country" , "occupation" )]

cat_embed_cols = [
    "workclass" ,
    "education" ,
    "marital-status" ,
    "occupation" ,
    "relationship" ,
    "race" ,
    "gender" ,
    "capital-gain" ,
    "capital-loss" ,
    "native-country" ,
]
continuous_cols = [ "age" , "hours-per-week" ]
target = "income_label"
target = df_train [ target ]. values

# prepare the data
wide_preprocessor = WidePreprocessor ( wide_cols = wide_cols , crossed_cols = crossed_cols )
X_wide = wide_preprocessor . fit_transform ( df_train )

tab_preprocessor = TabPreprocessor (
    cat_embed_cols = cat_embed_cols , continuous_cols = continuous_cols  # type: ignore[arg-type]
)
X_tab = tab_preprocessor . fit_transform ( df_train )

# build the model
wide = Wide ( input_dim = np . unique ( X_wide ). shape [ 0 ], pred_dim = 1 )
tab_mlp = TabMlp (
    column_idx = tab_preprocessor . column_idx ,
    cat_embed_input = tab_preprocessor . cat_embed_input ,
    continuous_cols = continuous_cols ,
)
model = WideDeep ( wide = wide , deeptabular = tab_mlp )

# train and validate
trainer = Trainer ( model , objective = "binary" , metrics = [ Accuracy ])
trainer . fit (
    X_wide = X_wide ,
    X_tab = X_tab ,
    target = target ,
    n_epochs = 5 ,
    batch_size = 256 ,
)

# predict on test
X_wide_te = wide_preprocessor . transform ( df_test )
X_tab_te = tab_preprocessor . transform ( df_test )
preds = trainer . predict ( X_wide = X_wide_te , X_tab = X_tab_te )

# Save and load

# Option 1: this will also save training history and lr history if the
# LRHistory callback is used
trainer . save ( path = "model_weights" , save_state_dict = True )

# Option 2: save as any other torch model
torch . save ( model . state_dict (), "model_weights/wd_model.pt" )

# From here in advance, Option 1 or 2 are the same. I assume the user has
# prepared the data and defined the new model components:
# 1. Build the model
model_new = WideDeep ( wide = wide , deeptabular = tab_mlp )
model_new . load_state_dict ( torch . load ( "model_weights/wd_model.pt" ))

# 2. Instantiate the trainer
trainer_new = Trainer ( model_new , objective = "binary" )

# 3. Either start the fit or directly predict
preds = trainer_new . predict ( X_wide = X_wide , X_tab = X_tab , batch_size = 32 )

Bien sûr, on peut faire beaucoup plus . Voir le dossier Exemples, la documentation ou les publications compagnon pour une meilleure compréhension du contenu du package et de ses fonctionnalités.

Essai

 pytest tests

Comment contribuer

Vérifiez la page contributive.

Remerciements

Cette bibliothèque prend une série d'autres bibliothèques, donc je pense qu'il est juste juste de les mentionner ici dans le ReadMe (des mentions spécifiques sont également incluses dans le code).

La structure et le code Callbacks et Initializers s'inspirent de la bibliothèque torchsample , qui en soi est partiellement inspirée par Keras .

La classe TextProcessor de cette bibliothèque utilise le Tokenizer et Vocab de fastai . Le code à utils.fastai_transforms est une adaptation mineure de leur code, il fonctionne donc dans cette bibliothèque. À mon expérience, leur Tokenizer est le meilleur de la classe.

La classe ImageProcessor de cette bibliothèque utilise le code du livre fantastique de Deep Learning for Computer Vision (DL4CV) d'Adrian Rosebrock.

Licence

Ce travail est à double licence sous Apache 2.0 et MIT (ou toute version ultérieure). Vous pouvez choisir entre l'un d'eux si vous utilisez ce travail.

SPDX-License-Identifier: Apache-2.0 AND MIT

Citer

Bibtex

 @article{Zaurin_pytorch-widedeep_A_flexible_2023,
author = {Zaurin, Javier Rodriguez and Mulinka, Pavol},
doi = {10.21105/joss.05027},
journal = {Journal of Open Source Software},
month = jun,
number = {86},
pages = {5027},
title = {{pytorch-widedeep: A flexible package for multimodal deep learning}},
url = {https://joss.theoj.org/papers/10.21105/joss.05027},
volume = {8},
year = {2023}
}

Apa

 Zaurin, J. R., & Mulinka, P. (2023). pytorch-widedeep: A flexible package for
multimodal deep learning. Journal of Open Source Software, 8(86), 5027.
https://doi.org/10.21105/joss.05027

Développer

pytorch widedeep

pytorch-oweep

Introduction

Architectures

La composante `deeptabular`

Le module `rec`

Texte et images

Installation

Installation du développeur

Démarrage rapide

Essai

Comment contribuer

Remerciements

Licence

Citer

Bibtex

Apa

GitHub sgrebnov/cordova plugin background download

Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

pytorch image models

Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

chat.petals.dev

GPT Prompt Templates

GPTyped

ToDo Co

Python Portfolio

datamule python

Google Dorks

shepherd

mongo express

pytorch widedeep

pytorch-oweep

Introduction

Architectures

La composante deeptabular

Le module rec

Texte et images

Installation

Installation du développeur

Démarrage rapide

Essai

Comment contribuer

Remerciements

Licence

Citer

Bibtex

Apa

La composante `deeptabular`

Le module `rec`