Download pytorch widedeep - pytorch widedeep Código do Download

Pytorch-WiefeDeep

Um pacote flexível para aprendizado de profundidade multimodal para combinar dados tabulares com texto e imagens usando modelos largos e profundos em Pytorch

Documentação: https://pytorch-wieDeep.readthedocs.io

Postagens e tutoriais complementares: Infinitoml

Experimentos e comparação com LightGBM : Tabulardl vs LightGBM

Slack : se você deseja contribuir ou apenas conversar conosco, junte -se ao Slack

O conteúdo deste documento está organizado da seguinte forma:

Pytorch-WiefeDeep
- Introdução
- Arquiteturas
- O componente deeptabular
- O módulo rec
- Texto e imagens
- Instalação
  - Desenvolvedor instalação
- Início rápido
- Teste
- Como contribuir
- Agradecimentos
- Licença
- Citar
  - Bibtex
  - APA

Introdução

pytorch-widedeep é baseado no amplo e profundo algoritmo do Google, ajustado para conjuntos de dados multimodais.

Em termos gerais, pytorch-widedeep é um pacote para usar o aprendizado profundo com dados tabulares. Em particular, destina -se a facilitar a combinação de texto e imagens com dados tabulares correspondentes usando modelos amplos e profundos. Com isso em mente, existem várias arquiteturas que podem ser implementadas com a biblioteca. Os principais componentes dessas arquiteturas são mostrados na figura abaixo:

Em termos matemáticos, e seguindo a notação no artigo, a expressão para a arquitetura sem um componente deephead pode ser formulada como:

Onde σ é a função sigmóide, 'W' são as matrizes de peso aplicadas ao modelo amplo e às ativações finais dos modelos profundos, 'a' são essas ativações finais, φ (x) são as transformações cruzadas dos recursos originais 'x' e e 'b' é o termo de preconceito. Caso você esteja se perguntando o que são "transformações de produto cruzado" , aqui está uma citação retirada diretamente do artigo: "Para recursos binários, uma transformação de produto cruzado (por exemplo," e ((gênero = feminino, idioma = en) ") é 1 se e somente se os recursos constituintes (" gênero = feminino "e" idioma = EN ") são todos 1 e 0 de outra forma".

É perfeitamente possível usar modelos personalizados (e não necessariamente aqueles na biblioteca), desde que os modelos personalizados tenham uma propriedade chamada output_dim com o tamanho da última camada de ativações, para que o WideDeep possa ser construído. Exemplos sobre como usar componentes personalizados podem ser encontrados na pasta Exemplos e na seção abaixo.

Arquiteturas

A Biblioteca pytorch-widedeep oferece várias arquiteturas diferentes. Nesta seção, mostraremos alguns deles em sua forma mais simples (ou seja, com valores de parâmetros padrão na maioria dos casos) com seus trechos de código correspondentes. Observe que todos os trechos abaixo do Shoud são executados localmente. Para uma explicação mais detalhada dos diferentes componentes e de seus parâmetros, consulte a documentação.

Para os exemplos abaixo, usaremos um conjunto de dados de brinquedos gerado da seguinte maneira:

 import os
import random

import numpy as np
import pandas as pd
from PIL import Image
from faker import Faker


def create_and_save_random_image ( image_number , size = ( 32 , 32 )):

    if not os . path . exists ( "images" ):
        os . makedirs ( "images" )

    array = np . random . randint ( 0 , 256 , ( size [ 0 ], size [ 1 ], 3 ), dtype = np . uint8 )

    image = Image . fromarray ( array )

    image_name = f"image_ { image_number } .png"
    image . save ( os . path . join ( "images" , image_name ))

    return image_name


fake = Faker ()

cities = [ "New York" , "Los Angeles" , "Chicago" , "Houston" ]
names = [ "Alice" , "Bob" , "Charlie" , "David" , "Eva" ]

data = {
    "city" : [ random . choice ( cities ) for _ in range ( 100 )],
    "name" : [ random . choice ( names ) for _ in range ( 100 )],
    "age" : [ random . uniform ( 18 , 70 ) for _ in range ( 100 )],
    "height" : [ random . uniform ( 150 , 200 ) for _ in range ( 100 )],
    "sentence" : [ fake . sentence () for _ in range ( 100 )],
    "other_sentence" : [ fake . sentence () for _ in range ( 100 )],
    "image_name" : [ create_and_save_random_image ( i ) for i in range ( 100 )],
    "target" : [ random . choice ([ 0 , 1 ]) for _ in range ( 100 )],
}

df = pd . DataFrame ( data )

Isso criará um quadro de dados de 100 linhas e um dir na sua pasta local, chamados images com 100 imagens aleatórias (ou imagens com apenas ruído).

Talvez a arquitetura mais simples seja apenas um componente, wide , deeptabular , deeptext ou deepimage por conta própria, o que também é possível, mas vamos iniciar os exemplos com uma arquitetura ampla e profunda padrão. A partir daí, como construir um modelo composto apenas de um componente será direto.

Observe que os exemplos mostrados abaixo seriam quase idênticos usando qualquer um dos modelos disponíveis na biblioteca. Por exemplo, TabMlp pode ser substituído pelo TabResnet , TabNet , TabTransformer , etc. Da mesma forma, BasicRNN pode ser substituído por AttentiveRNN , StackedAttentiveRNN ou HFModel com seus parâmetros e pré -processador correspondentes no caso dos modelos de face abraçados.

1. Componente de largura e tabular (também conhecido como DeepTabular)

 from pytorch_widedeep . preprocessing import TabPreprocessor , WidePreprocessor
from pytorch_widedeep . models import Wide , TabMlp , WideDeep
from pytorch_widedeep . training import Trainer

# Wide
wide_cols = [ "city" ]
crossed_cols = [( "city" , "name" )]
wide_preprocessor = WidePreprocessor ( wide_cols = wide_cols , crossed_cols = crossed_cols )
X_wide = wide_preprocessor . fit_transform ( df )
wide = Wide ( input_dim = np . unique ( X_wide ). shape [ 0 ])

# Tabular
tab_preprocessor = TabPreprocessor (
    embed_cols = [ "city" , "name" ], continuous_cols = [ "age" , "height" ]
)
X_tab = tab_preprocessor . fit_transform ( df )
tab_mlp = TabMlp (
    column_idx = tab_preprocessor . column_idx ,
    cat_embed_input = tab_preprocessor . cat_embed_input ,
    continuous_cols = tab_preprocessor . continuous_cols ,
    mlp_hidden_dims = [ 64 , 32 ],
)

# WideDeep
model = WideDeep ( wide = wide , deeptabular = tab_mlp )

# Train
trainer = Trainer ( model , objective = "binary" )

trainer . fit (
    X_wide = X_wide ,
    X_tab = X_tab ,
    target = df [ "target" ]. values ,
    n_epochs = 1 ,
    batch_size = 32 ,
)

2. Dados tabulares e de texto

 from pytorch_widedeep . preprocessing import TabPreprocessor , TextPreprocessor
from pytorch_widedeep . models import TabMlp , BasicRNN , WideDeep
from pytorch_widedeep . training import Trainer

# Tabular
tab_preprocessor = TabPreprocessor (
    embed_cols = [ "city" , "name" ], continuous_cols = [ "age" , "height" ]
)
X_tab = tab_preprocessor . fit_transform ( df )
tab_mlp = TabMlp (
    column_idx = tab_preprocessor . column_idx ,
    cat_embed_input = tab_preprocessor . cat_embed_input ,
    continuous_cols = tab_preprocessor . continuous_cols ,
    mlp_hidden_dims = [ 64 , 32 ],
)

# Text
text_preprocessor = TextPreprocessor (
    text_col = "sentence" , maxlen = 20 , max_vocab = 100 , n_cpus = 1
)
X_text = text_preprocessor . fit_transform ( df )
rnn = BasicRNN (
    vocab_size = len ( text_preprocessor . vocab . itos ),
    embed_dim = 16 ,
    hidden_dim = 8 ,
    n_layers = 1 ,
)

# WideDeep
model = WideDeep ( deeptabular = tab_mlp , deeptext = rnn )

# Train
trainer = Trainer ( model , objective = "binary" )

trainer . fit (
    X_tab = X_tab ,
    X_text = X_text ,
    target = df [ "target" ]. values ,
    n_epochs = 1 ,
    batch_size = 32 ,
)

3. Tabular e texto com uma cabeça FC no topo através do param head_hidden_dims no WideDeep

 from pytorch_widedeep . preprocessing import TabPreprocessor , TextPreprocessor
from pytorch_widedeep . models import TabMlp , BasicRNN , WideDeep
from pytorch_widedeep . training import Trainer

# Tabular
tab_preprocessor = TabPreprocessor (
    embed_cols = [ "city" , "name" ], continuous_cols = [ "age" , "height" ]
)
X_tab = tab_preprocessor . fit_transform ( df )
tab_mlp = TabMlp (
    column_idx = tab_preprocessor . column_idx ,
    cat_embed_input = tab_preprocessor . cat_embed_input ,
    continuous_cols = tab_preprocessor . continuous_cols ,
    mlp_hidden_dims = [ 64 , 32 ],
)

# Text
text_preprocessor = TextPreprocessor (
    text_col = "sentence" , maxlen = 20 , max_vocab = 100 , n_cpus = 1
)
X_text = text_preprocessor . fit_transform ( df )
rnn = BasicRNN (
    vocab_size = len ( text_preprocessor . vocab . itos ),
    embed_dim = 16 ,
    hidden_dim = 8 ,
    n_layers = 1 ,
)

# WideDeep
model = WideDeep ( deeptabular = tab_mlp , deeptext = rnn , head_hidden_dims = [ 32 , 16 ])

# Train
trainer = Trainer ( model , objective = "binary" )

trainer . fit (
    X_tab = X_tab ,
    X_text = X_text ,
    target = df [ "target" ]. values ,
    n_epochs = 1 ,
    batch_size = 32 ,
)

4. Colunas de texto tabulares e múltiplas que são passadas diretamente para a WideDeep

 from pytorch_widedeep . preprocessing import TabPreprocessor , TextPreprocessor
from pytorch_widedeep . models import TabMlp , BasicRNN , WideDeep
from pytorch_widedeep . training import Trainer


# Tabular
tab_preprocessor = TabPreprocessor (
    embed_cols = [ "city" , "name" ], continuous_cols = [ "age" , "height" ]
)
X_tab = tab_preprocessor . fit_transform ( df )
tab_mlp = TabMlp (
    column_idx = tab_preprocessor . column_idx ,
    cat_embed_input = tab_preprocessor . cat_embed_input ,
    continuous_cols = tab_preprocessor . continuous_cols ,
    mlp_hidden_dims = [ 64 , 32 ],
)

# Text
text_preprocessor_1 = TextPreprocessor (
    text_col = "sentence" , maxlen = 20 , max_vocab = 100 , n_cpus = 1
)
X_text_1 = text_preprocessor_1 . fit_transform ( df )
text_preprocessor_2 = TextPreprocessor (
    text_col = "other_sentence" , maxlen = 20 , max_vocab = 100 , n_cpus = 1
)
X_text_2 = text_preprocessor_2 . fit_transform ( df )
rnn_1 = BasicRNN (
    vocab_size = len ( text_preprocessor_1 . vocab . itos ),
    embed_dim = 16 ,
    hidden_dim = 8 ,
    n_layers = 1 ,
)
rnn_2 = BasicRNN (
    vocab_size = len ( text_preprocessor_2 . vocab . itos ),
    embed_dim = 16 ,
    hidden_dim = 8 ,
    n_layers = 1 ,
)

# WideDeep
model = WideDeep ( deeptabular = tab_mlp , deeptext = [ rnn_1 , rnn_2 ])

# Train
trainer = Trainer ( model , objective = "binary" )

trainer . fit (
    X_tab = X_tab ,
    X_text = [ X_text_1 , X_text_2 ],
    target = df [ "target" ]. values ,
    n_epochs = 1 ,
    batch_size = 32 ,
)

5. Dados tabulares e várias colunas de texto que são fundidas por meio da classe ModelFuser da biblioteca

 from pytorch_widedeep . preprocessing import TabPreprocessor , TextPreprocessor
from pytorch_widedeep . models import TabMlp , BasicRNN , WideDeep , ModelFuser
from pytorch_widedeep import Trainer

# Tabular
tab_preprocessor = TabPreprocessor (
    embed_cols = [ "city" , "name" ], continuous_cols = [ "age" , "height" ]
)
X_tab = tab_preprocessor . fit_transform ( df )
tab_mlp = TabMlp (
    column_idx = tab_preprocessor . column_idx ,
    cat_embed_input = tab_preprocessor . cat_embed_input ,
    continuous_cols = tab_preprocessor . continuous_cols ,
    mlp_hidden_dims = [ 64 , 32 ],
)

# Text
text_preprocessor_1 = TextPreprocessor (
    text_col = "sentence" , maxlen = 20 , max_vocab = 100 , n_cpus = 1
)
X_text_1 = text_preprocessor_1 . fit_transform ( df )
text_preprocessor_2 = TextPreprocessor (
    text_col = "other_sentence" , maxlen = 20 , max_vocab = 100 , n_cpus = 1
)
X_text_2 = text_preprocessor_2 . fit_transform ( df )

rnn_1 = BasicRNN (
    vocab_size = len ( text_preprocessor_1 . vocab . itos ),
    embed_dim = 16 ,
    hidden_dim = 8 ,
    n_layers = 1 ,
)
rnn_2 = BasicRNN (
    vocab_size = len ( text_preprocessor_2 . vocab . itos ),
    embed_dim = 16 ,
    hidden_dim = 8 ,
    n_layers = 1 ,
)

models_fuser = ModelFuser ( models = [ rnn_1 , rnn_2 ], fusion_method = "mult" )

# WideDeep
model = WideDeep ( deeptabular = tab_mlp , deeptext = models_fuser )

# Train
trainer = Trainer ( model , objective = "binary" )

trainer . fit (
    X_tab = X_tab ,
    X_text = [ X_text_1 , X_text_2 ],
    target = df [ "target" ]. values ,
    n_epochs = 1 ,
    batch_size = 32 ,
)

6. colunas de texto tabular e múltipla, com uma coluna de imagem. As colunas de texto são fundidas através do ModelFuser da biblioteca e, em seguida, todas fundidas através do paramental Deephead em WideDeep , que é um ModelFuser personalizado codificado pelo usuário

Essa é talvez a solução menos elegante, pois envolve um componente personalizado pelo usuário e cortando o tensor 'recebido'. No futuro, incluiremos um TextAndImageModelFuser para tornar esse processo mais direto. Ainda assim, não é realmente complicado e é um bom exemplo de como usar componentes personalizados no pytorch-widedeep .

Observe que o único requisito para o componente personalizado é que ele possui uma propriedade chamada output_dim que retorna o tamanho da última camada de ativações. Em outras palavras, ele não precisa herdar da BaseWDModelComponent . Essa classe base simplesmente verifica a existência de tal propriedade e evita alguns erros de digitação internamente.

 import torch

from pytorch_widedeep . preprocessing import TabPreprocessor , TextPreprocessor , ImagePreprocessor
from pytorch_widedeep . models import TabMlp , BasicRNN , WideDeep , ModelFuser , Vision
from pytorch_widedeep . models . _base_wd_model_component import BaseWDModelComponent
from pytorch_widedeep import Trainer

# Tabular
tab_preprocessor = TabPreprocessor (
    embed_cols = [ "city" , "name" ], continuous_cols = [ "age" , "height" ]
)
X_tab = tab_preprocessor . fit_transform ( df )
tab_mlp = TabMlp (
    column_idx = tab_preprocessor . column_idx ,
    cat_embed_input = tab_preprocessor . cat_embed_input ,
    continuous_cols = tab_preprocessor . continuous_cols ,
    mlp_hidden_dims = [ 16 , 8 ],
)

# Text
text_preprocessor_1 = TextPreprocessor (
    text_col = "sentence" , maxlen = 20 , max_vocab = 100 , n_cpus = 1
)
X_text_1 = text_preprocessor_1 . fit_transform ( df )
text_preprocessor_2 = TextPreprocessor (
    text_col = "other_sentence" , maxlen = 20 , max_vocab = 100 , n_cpus = 1
)
X_text_2 = text_preprocessor_2 . fit_transform ( df )
rnn_1 = BasicRNN (
    vocab_size = len ( text_preprocessor_1 . vocab . itos ),
    embed_dim = 16 ,
    hidden_dim = 8 ,
    n_layers = 1 ,
)
rnn_2 = BasicRNN (
    vocab_size = len ( text_preprocessor_2 . vocab . itos ),
    embed_dim = 16 ,
    hidden_dim = 8 ,
    n_layers = 1 ,
)
models_fuser = ModelFuser (
    models = [ rnn_1 , rnn_2 ],
    fusion_method = "mult" ,
)

# Image
image_preprocessor = ImagePreprocessor ( img_col = "image_name" , img_path = "images" )
X_img = image_preprocessor . fit_transform ( df )
vision = Vision ( pretrained_model_setup = "resnet18" , head_hidden_dims = [ 16 , 8 ])

# deephead (custom model fuser)
class MyModelFuser ( BaseWDModelComponent ):
    """
    Simply a Linear + Relu sequence on top of the text + images followed by a
    Linear -> Relu -> Linear for the concatenation of tabular slice of the
    tensor and the output of the text and image sequential model
    """
    def __init__ (
        self ,
        tab_incoming_dim : int ,
        text_incoming_dim : int ,
        image_incoming_dim : int ,
        output_units : int ,
    ):

        super ( MyModelFuser , self ). __init__ ()

        self . tab_incoming_dim = tab_incoming_dim
        self . text_incoming_dim = text_incoming_dim
        self . image_incoming_dim = image_incoming_dim
        self . output_units = output_units
        self . text_and_image_fuser = torch . nn . Sequential (
            torch . nn . Linear ( text_incoming_dim + image_incoming_dim , output_units ),
            torch . nn . ReLU (),
        )
        self . out = torch . nn . Sequential (
            torch . nn . Linear ( output_units + tab_incoming_dim , output_units * 4 ),
            torch . nn . ReLU (),
            torch . nn . Linear ( output_units * 4 , output_units ),
        )

    def forward ( self , X : torch . Tensor ) -> torch . Tensor :
        tab_slice = slice ( 0 , self . tab_incoming_dim )
        text_slice = slice (
            self . tab_incoming_dim , self . tab_incoming_dim + self . text_incoming_dim
        )
        image_slice = slice (
            self . tab_incoming_dim + self . text_incoming_dim ,
            self . tab_incoming_dim + self . text_incoming_dim + self . image_incoming_dim ,
        )
        X_tab = X [:, tab_slice ]
        X_text = X [:, text_slice ]
        X_img = X [:, image_slice ]
        X_text_and_image = self . text_and_image_fuser ( torch . cat ([ X_text , X_img ], dim = 1 ))
        return self . out ( torch . cat ([ X_tab , X_text_and_image ], dim = 1 ))

    @ property
    def output_dim ( self ):
        return self . output_units


deephead = MyModelFuser (
    tab_incoming_dim = tab_mlp . output_dim ,
    text_incoming_dim = models_fuser . output_dim ,
    image_incoming_dim = vision . output_dim ,
    output_units = 8 ,
)

# WideDeep
model = WideDeep (
    deeptabular = tab_mlp ,
    deeptext = models_fuser ,
    deepimage = vision ,
    deephead = deephead ,
)

# Train
trainer = Trainer ( model , objective = "binary" )

trainer . fit (
    X_tab = X_tab ,
    X_text = [ X_text_1 , X_text_2 ],
    X_img = X_img ,
    target = df [ "target" ]. values ,
    n_epochs = 1 ,
    batch_size = 32 ,
)

7. Um modelo de duas torres

Este é um modelo popular no contexto dos sistemas de recomendação. Digamos que tenhamos um conjunto de dados tabular formado meus triplos (recursos do usuário, recursos do item, destino). Podemos criar um modelo de duas torre, onde os recursos do usuário e do item são passados por dois modelos separados e depois "fundidos" por meio de um produto DOT.

 import numpy as np
import pandas as pd

from pytorch_widedeep import Trainer
from pytorch_widedeep . preprocessing import TabPreprocessor
from pytorch_widedeep . models import TabMlp , WideDeep , ModelFuser

# Let's create the interaction dataset
# user_features dataframe
np . random . seed ( 42 )
user_ids = np . arange ( 1 , 101 )
ages = np . random . randint ( 18 , 60 , size = 100 )
genders = np . random . choice ([ "male" , "female" ], size = 100 )
locations = np . random . choice ([ "city_a" , "city_b" , "city_c" , "city_d" ], size = 100 )
user_features = pd . DataFrame (
    { "id" : user_ids , "age" : ages , "gender" : genders , "location" : locations }
)

# item_features dataframe
item_ids = np . arange ( 1 , 101 )
prices = np . random . uniform ( 10 , 500 , size = 100 ). round ( 2 )
colors = np . random . choice ([ "red" , "blue" , "green" , "black" ], size = 100 )
categories = np . random . choice ([ "electronics" , "clothing" , "home" , "toys" ], size = 100 )

item_features = pd . DataFrame (
    { "id" : item_ids , "price" : prices , "color" : colors , "category" : categories }
)

# Interactions dataframe
interaction_user_ids = np . random . choice ( user_ids , size = 1000 )
interaction_item_ids = np . random . choice ( item_ids , size = 1000 )
purchased = np . random . choice ([ 0 , 1 ], size = 1000 , p = [ 0.7 , 0.3 ])
interactions = pd . DataFrame (
    {
        "user_id" : interaction_user_ids ,
        "item_id" : interaction_item_ids ,
        "purchased" : purchased ,
    }
)
user_item_purchased = interactions . merge (
    user_features , left_on = "user_id" , right_on = "id"
). merge ( item_features , left_on = "item_id" , right_on = "id" )

# Users
tab_preprocessor_user = TabPreprocessor (
    cat_embed_cols = [ "gender" , "location" ],
    continuous_cols = [ "age" ],
)
X_user = tab_preprocessor_user . fit_transform ( user_item_purchased )
tab_mlp_user = TabMlp (
    column_idx = tab_preprocessor_user . column_idx ,
    cat_embed_input = tab_preprocessor_user . cat_embed_input ,
    continuous_cols = [ "age" ],
    mlp_hidden_dims = [ 16 , 8 ],
    mlp_dropout = [ 0.2 , 0.2 ],
)

# Items
tab_preprocessor_item = TabPreprocessor (
    cat_embed_cols = [ "color" , "category" ],
    continuous_cols = [ "price" ],
)
X_item = tab_preprocessor_item . fit_transform ( user_item_purchased )
tab_mlp_item = TabMlp (
    column_idx = tab_preprocessor_item . column_idx ,
    cat_embed_input = tab_preprocessor_item . cat_embed_input ,
    continuous_cols = [ "price" ],
    mlp_hidden_dims = [ 16 , 8 ],
    mlp_dropout = [ 0.2 , 0.2 ],
)

two_tower_model = ModelFuser ([ tab_mlp_user , tab_mlp_item ], fusion_method = "dot" )

model = WideDeep ( deeptabular = two_tower_model )

trainer = Trainer ( model , objective = "binary" )

trainer . fit (
    X_tab = [ X_user , X_item ],
    target = interactions . purchased . values ,
    n_epochs = 1 ,
    batch_size = 32 ,
)

8. Tabular com uma perda de vários alvos

Este é "um bônus" para ilustrar o uso de perdas com vários alvos, mais do que uma arquitetura diferente.

 from pytorch_widedeep . preprocessing import TabPreprocessor , TextPreprocessor , ImagePreprocessor
from pytorch_widedeep . models import TabMlp , BasicRNN , WideDeep , ModelFuser , Vision
from pytorch_widedeep . losses_multitarget import MultiTargetClassificationLoss
from pytorch_widedeep . models . _base_wd_model_component import BaseWDModelComponent
from pytorch_widedeep import Trainer

# let's add a second target to the dataframe
df [ "target2" ] = [ random . choice ([ 0 , 1 ]) for _ in range ( 100 )]

# Tabular
tab_preprocessor = TabPreprocessor (
    embed_cols = [ "city" , "name" ], continuous_cols = [ "age" , "height" ]
)
X_tab = tab_preprocessor . fit_transform ( df )
tab_mlp = TabMlp (
    column_idx = tab_preprocessor . column_idx ,
    cat_embed_input = tab_preprocessor . cat_embed_input ,
    continuous_cols = tab_preprocessor . continuous_cols ,
    mlp_hidden_dims = [ 64 , 32 ],
)

# 'pred_dim=2' because we have two binary targets. For other types of targets,
#  please, see the documentation
model = WideDeep ( deeptabular = tab_mlp , pred_dim = 2 ).

loss = MultiTargetClassificationLoss ( binary_config = [ 0 , 1 ], reduction = "mean" )

# When a multi-target loss is used, 'custom_loss_function' must not be None.
# See the docs
trainer = Trainer ( model , objective = "multitarget" , custom_loss_function = loss )

trainer . fit (
    X_tab = X_tab ,
    target = df [[ "target" , "target2" ]]. values ,
    n_epochs = 1 ,
    batch_size = 32 ,
)

O componente `deeptabular`

É importante enfatizar novamente que cada componente individual, wide , deeptabular , deeptext e deepimage , possa ser usado de forma independente e isoladamente. Por exemplo, pode -se usar apenas wide , o que está simplesmente em um modelo linear. De fato, uma das funcionalidades mais interessantes do pytorch-widedeep seria o uso do componente deeptabular por conta própria, ou seja, o que normalmente se referiria como aprendizado profundo para dados tabulares. Atualmente, pytorch-widedeep oferece os seguintes modelos diferentes para esse componente:

Amplo : um modelo linear simples, onde as não linearidades são capturadas por meio de transformações de produto cruzado, conforme explicado antes.
TABMLP : Um MLP simples que recebe incorporações representando os recursos categóricos, concatenado com os recursos contínuos, que também podem ser incorporados.
Tabresnet : semelhante ao modelo anterior, mas as incorporações são passadas por uma série de blocos de resnet construídos com camadas densas.
Tabnet : Detalhes sobre Tabnet podem ser encontrados no Tabnet: aprendizado tabular interpretável atencioso

Dois modelos mais simples baseados em atenção que chamamos:

ContextattionMlp : MLP com mecanismo de atenção "no topo", baseado em redes de atenção hierárquica para classificação de documentos
SelfAttionMLP : MLP com um mecanismo de atenção que é uma versão simplificada de um bloco de transformadores que nos referimos como "auto-atimento da chave de consulta".

A família Tabformer , ou seja, transformadores para dados tabulares:

TabTransFormer : Detalhes sobre o TabTransformer podem ser encontrados no Tabtransformer: Modelagem de dados tabulares usando incorporação contextual.
SAINT : Detalhes sobre Saint podem ser encontrados em Saint: Redes Neurais Melhoradas para Dados Tabulares via atenção da linha e pré-treinamento contrastante.
FT-Transformer : Detalhes sobre o transformador FT podem ser encontrados na revisitando modelos de aprendizado profundo para dados tabulares.
TabFastformer : Adaptação do FastFormer para dados tabulares. Detalhes sobre o Fasformer podem ser encontrados em FastFormers: modelos de transformadores altamente eficientes para compreensão da linguagem natural
TabPerceiver : Adaptação do Perceptor para dados tabulares. Detalhes sobre o Perceptor podem ser encontrados no Perceptor: Percepção Geral com atenção iterativa

E modelos DL probabilísticos para dados tabulares com base na incerteza de peso nas redes neurais:

Bayesianwide : adaptação probabilística do modelo Wide .
BayesiantAbmlp : adaptação probabilística do modelo TabMlp

Observe que, embora existam publicações científicas para o TabTransformer, Saint e FT-Transformer, o Tabfasfformer e o TabPerceiver são nossa própria adaptação desses algoritmos para dados tabulares.

Além disso, o pré-treinamento auto-supervisionado pode ser usado para todos os modelos deeptabular , com exceção do TabPerceiver . O pré-treinamento auto-supervisionado pode ser usado por meio de dois métodos ou rotinas que encaminhamos como: método do codificador-decodificador e método de denociação de recreção. Consulte a documentação e os exemplos para obter detalhes sobre essa funcionalidade e todas as outras opções da biblioteca.

O módulo `rec`

Este módulo foi introduzido como uma extensão dos componentes existentes na biblioteca, abordando questões e questões relacionadas aos sistemas de recomendação. Embora ainda esteja em desenvolvimento ativo, atualmente inclui um número seleto de modelos de recomendação poderosos.

Vale a pena notar que essa biblioteca já suportou a implementação de vários algoritmos de recomendação usando componentes existentes. Por exemplo, modelos como filtragem colaborativa larga e profunda, duas torres ou neurais podem ser construídos usando as principais funcionalidades da biblioteca.

Os algoritmos de recomendação no módulo rec são:

Autoint: aprendizado automático de interação com recursos através de redes neurais auto-atentas
DeepFM: uma rede neural baseada em máquina de fator-máquina para previsão de CTR
Máquina de fatorização (FFM) (profunda): Uma versão de aprendizado profundo do algoritmo apresentado em máquinas de fatorização com reconhecimento de campo em um sistema de publicidade on-line do mundo real
XDEEPFM: Combinando interações de recursos explícitas e implícitas para sistemas de recomendação
Rede de juros profundos para previsão da taxa de cliques
Rede profunda e cruzada para previsões de cliques de anúncios
DCN V2: Rede profunda e cruzada aprimorada e lições práticas para o aprendizado em escala na Web para classificar sistemas
Para prever a previsão da taxa de cliques mais profunda, mais leve e interpretável
Um modelo básico baseado em transformador para recomendação, onde o problema é enfrentado como uma sequência.

Veja os exemplos para obter detalhes sobre como usar esses modelos.

Texto e imagens

Para o componente de texto, deeptext , a biblioteca oferece os seguintes modelos:

Basicrnn : um simples RNN 2. ATTENTIVERNN : um RNN com um mecanismo de atenção baseado nas redes de atenção hierárquica para documentação
Empilhado
HFMODEL : Um invólucro em torno de abraçar modelos baseados em transfômeros. No momento, apenas modelos das famílias Bert, Roberta, Distilbert, Albert e Electra são suportados. Isso ocorre porque esta biblioteca foi projetada para abordar as tarefas de classificação e regressão e esses são os modelos de codificador mais "populares", que provaram ser aqueles que funcionam melhor para essas tarefas. Se houver demanda por outros modelos, eles serão incluídos no futuro.

Para o componente de imagem, deepimage , a biblioteca suporta modelos das seguintes famílias: 'Resnet', 'Shufflenet', 'Resnext', 'wide_resnet', 'Regnet', 'DenseNet', 'MobileNetv3', 'MobileNetv2', 'mnasnet', 'eficientes. Eles são oferecidos via torchvision e envolvidos na classe Vision .

Instalação

Instale usando PIP:

pip install pytorch-widedeep

Ou instale diretamente do github

pip install git+https://github.com/jrzaurin/pytorch-widedeep.git

Desenvolvedor instalação

 # Clone the repository
git clone https://github.com/jrzaurin/pytorch-widedeep
cd pytorch-widedeep

# Install in dev mode
pip install -e .

Início rápido

Aqui está um exemplo de ponta a ponta de uma classificação binária com o conjunto de dados adulto usando configurações de Wide e DeepDense e padrão.

Construindo um modelo largo (linear) e profundo com pytorch-widedeep :

 import numpy as np
import torch
from sklearn . model_selection import train_test_split

from pytorch_widedeep import Trainer
from pytorch_widedeep . preprocessing import WidePreprocessor , TabPreprocessor
from pytorch_widedeep . models import Wide , TabMlp , WideDeep
from pytorch_widedeep . metrics import Accuracy
from pytorch_widedeep . datasets import load_adult


df = load_adult ( as_frame = True )
df [ "income_label" ] = ( df [ "income" ]. apply ( lambda x : ">50K" in x )). astype ( int )
df . drop ( "income" , axis = 1 , inplace = True )
df_train , df_test = train_test_split ( df , test_size = 0.2 , stratify = df . income_label )

# Define the 'column set up'
wide_cols = [
    "education" ,
    "relationship" ,
    "workclass" ,
    "occupation" ,
    "native-country" ,
    "gender" ,
]
crossed_cols = [( "education" , "occupation" ), ( "native-country" , "occupation" )]

cat_embed_cols = [
    "workclass" ,
    "education" ,
    "marital-status" ,
    "occupation" ,
    "relationship" ,
    "race" ,
    "gender" ,
    "capital-gain" ,
    "capital-loss" ,
    "native-country" ,
]
continuous_cols = [ "age" , "hours-per-week" ]
target = "income_label"
target = df_train [ target ]. values

# prepare the data
wide_preprocessor = WidePreprocessor ( wide_cols = wide_cols , crossed_cols = crossed_cols )
X_wide = wide_preprocessor . fit_transform ( df_train )

tab_preprocessor = TabPreprocessor (
    cat_embed_cols = cat_embed_cols , continuous_cols = continuous_cols  # type: ignore[arg-type]
)
X_tab = tab_preprocessor . fit_transform ( df_train )

# build the model
wide = Wide ( input_dim = np . unique ( X_wide ). shape [ 0 ], pred_dim = 1 )
tab_mlp = TabMlp (
    column_idx = tab_preprocessor . column_idx ,
    cat_embed_input = tab_preprocessor . cat_embed_input ,
    continuous_cols = continuous_cols ,
)
model = WideDeep ( wide = wide , deeptabular = tab_mlp )

# train and validate
trainer = Trainer ( model , objective = "binary" , metrics = [ Accuracy ])
trainer . fit (
    X_wide = X_wide ,
    X_tab = X_tab ,
    target = target ,
    n_epochs = 5 ,
    batch_size = 256 ,
)

# predict on test
X_wide_te = wide_preprocessor . transform ( df_test )
X_tab_te = tab_preprocessor . transform ( df_test )
preds = trainer . predict ( X_wide = X_wide_te , X_tab = X_tab_te )

# Save and load

# Option 1: this will also save training history and lr history if the
# LRHistory callback is used
trainer . save ( path = "model_weights" , save_state_dict = True )

# Option 2: save as any other torch model
torch . save ( model . state_dict (), "model_weights/wd_model.pt" )

# From here in advance, Option 1 or 2 are the same. I assume the user has
# prepared the data and defined the new model components:
# 1. Build the model
model_new = WideDeep ( wide = wide , deeptabular = tab_mlp )
model_new . load_state_dict ( torch . load ( "model_weights/wd_model.pt" ))

# 2. Instantiate the trainer
trainer_new = Trainer ( model_new , objective = "binary" )

# 3. Either start the fit or directly predict
preds = trainer_new . predict ( X_wide = X_wide , X_tab = X_tab , batch_size = 32 )

Claro, pode -se fazer muito mais . Consulte a pasta Exemplos, a documentação ou as postagens complementares para obter uma melhor compreensão do conteúdo do pacote e de suas funcionalidades.

Teste

 pytest tests

Como contribuir

Verifique a página contribuinte.

Agradecimentos

Esta biblioteca retira de uma série de outras bibliotecas, então acho que é justo mencioná -las aqui no ReadMe (menções específicas também estão incluídas no código).

Os Callbacks e a estrutura e o código Initializers são inspirados na biblioteca torchsample , que por si só parcialmente inspirada pelas Keras .

A classe TextProcessor nesta biblioteca usa o Tokenizer e Vocab do fastai . O código em utils.fastai_transforms é uma adaptação menor de seu código para que funcione nessa biblioteca. Para minha experiência, o Tokenizer é o melhor da aula.

A classe ImageProcessor nesta biblioteca usa o código do livro Fantastic Deep Learning for Computer Vision (DL4CV) de Adrian Rosebrock.

Licença

Este trabalho é licenciado duplo no Apache 2.0 e MIT (ou em qualquer versão posterior). Você pode escolher entre um deles se usar este trabalho.

SPDX-License-Identifier: Apache-2.0 AND MIT

Citar

Bibtex

 @article{Zaurin_pytorch-widedeep_A_flexible_2023,
author = {Zaurin, Javier Rodriguez and Mulinka, Pavol},
doi = {10.21105/joss.05027},
journal = {Journal of Open Source Software},
month = jun,
number = {86},
pages = {5027},
title = {{pytorch-widedeep: A flexible package for multimodal deep learning}},
url = {https://joss.theoj.org/papers/10.21105/joss.05027},
volume = {8},
year = {2023}
}

APA

 Zaurin, J. R., & Mulinka, P. (2023). pytorch-widedeep: A flexible package for
multimodal deep learning. Journal of Open Source Software, 8(86), 5027.
https://doi.org/10.21105/joss.05027

Expandir

pytorch widedeep

Pytorch-WiefeDeep

Introdução

Arquiteturas

O componente `deeptabular`

O módulo `rec`

Texto e imagens

Instalação

Desenvolvedor instalação

Início rápido

Teste

Como contribuir

Agradecimentos

Licença

Citar

Bibtex

APA

GitHub sgrebnov/cordova plugin background download

Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

pytorch image models

Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

chat.petals.dev

GPT Prompt Templates

GPTyped

ToDo Co

Python Portfolio

datamule python

Google Dorks

shepherd

mongo express

pytorch widedeep

Pytorch-WiefeDeep

Introdução

Arquiteturas

O componente deeptabular

O módulo rec

Texto e imagens

Instalação

Desenvolvedor instalação

Início rápido

Teste

Como contribuir

Agradecimentos

Licença

Citar

Bibtex

APA

O componente `deeptabular`

O módulo `rec`