Dassl.pytorch Download - Dassl.pytorch Download de código fonte

Dassl.pytorch

Pitão

1.0.0

Baixar

DASSL

Introdução

O DASSL é uma caixa de ferramentas Pytorch desenvolvida inicialmente para o nosso Projeto Domínio Adaptive Ensemble Learning (DAEL) para apoiar a pesquisa em adaptação e generalização de domínio-como em Dael, estudamos como unificar esses dois problemas em uma única estrutura de aprendizagem. Dado que a adaptação do domínio está intimamente relacionada ao aprendizado semi-supervisionado-ambos estudam como explorar dados não marcados-também incorporamos componentes que apóiam a pesquisa para o último.

Por que o nome "Dassl"? O DASSL combina as iniciais da adaptação do domínio (DA) e do aprendizado semi-supervisionado (SSL), que parece natural e informativo.

O DASSL possui um design modular e interfaces unificadas, permitindo prototipagem rápida e experimentação de novos métodos DA/DG/SSL. Com o DASSL, um novo método pode ser implementado com apenas algumas linhas de código. Não acredita? Dê uma olhada na pasta do motor, que contém as implementações de muitos métodos existentes (então você voltará e estrelará este repositório). :-)

Basicamente, Dassl é perfeito para fazer pesquisas nas seguintes áreas:

Adaptação de domínio
Generalização do domínio
Aprendizado semi-supervisionado

Mas, graças ao design interessante, o DASSL também pode ser usado como uma base de código para desenvolver qualquer projeto de aprendizado profundo, como esse. :-)

Uma desvantagem do DASSL é que ainda não (ainda não é o treinamento de multi-GPU distribuído (hmm) (o DASSL usa DataParallel para embrulhar um modelo, que é menos eficiente que DistributedDataParallel ).

Não fornecemos documentações detalhadas para o DASSL, ao contrário de outro projeto nosso. Isso ocorre porque o DASSL é desenvolvido para fins de pesquisa e, como pesquisador, achamos importante poder ler o código-fonte e o incentivamos a fazê-lo-definitivamente não porque somos preguiçosos. :-)

O que há de novo

[Outubro de 2022] Novo artigo "Generalização do domínio no dispositivo" está fora! Código, modelos e conjuntos de dados: https://github.com/kaiyangzhou/on-device-dg.

Mais

[Jun 2022] v0.6.0 : faça cfg.TRAINER.METHOD_NAME consistente com o nome da classe do método.
[Jun 2022] Um novo método de adaptação de domínio CDAC (CVPR'21) é adicionado por Shreejal Trivedi. Veja aqui para mais detalhes.
[Jun 2022] Adiciona três conjuntos de dados do Wilds Benchmark: iwildcam, fmow e Camelyon17. Veja aqui para mais detalhes.
[Maio de 2022] Um novo método de generalização de domínio DDG desenvolvido pelo Zhishu Sun e para aparecer em Ijcai'22 é adicionado a este repo. Veja aqui para mais detalhes.
[Março de 2022] Um novo método de generalização de domínio EFDM desenvolvido por Yabin Zhang (PolyU) e para aparecer no CVPR'22 é adicionado a este repositório. Veja aqui para mais detalhes.
[Fev 2022] Caso você não saiba, uma aula no domínio de pintura do DomainNet (as divisões oficiais) possui apenas imagens de teste (sem imagens de treinamento), o que pode afetar o desempenho. Consulte a Seção 4.A em nosso artigo para obter mais detalhes.
[Outubro de 2021] v0.5.0 : alterações importantes feitas no transforms.py . 1) center_crop se torna uma transformação padrão no teste (aplicado após redimensionar a borda menor em um determinado tamanho para manter a proporção da imagem). 2) Para treinamento, Resize(cfg.INPUT.SIZE) é desativado quando random_crop ou random_resized_crop são usados. Essas alterações não farão diferença nas transformações de treinamento usadas nos arquivos de configuração existentes, nem nas transformações de teste, a menos que as imagens brutas não sejam quadradas (a única diferença é que agora a proporção da imagem é respeitada).
[Outubro de 2021] v0.4.3 : Copie os atributos no self.dm (Data Manager) para ser SimpleTrainer e tornar self.dm opcional, o que significa que a partir de agora você pode criar carregadores de dados a partir de qualquer fonte que desejar, em vez de ser forçado a usar DataManager .
[Setembro 2021] v0.4.2 : Uma atualização importante é definir drop_last=is_train and len(data_source)>=batch_size ao construir um carregador de dados para evitar 0 comprimentos.

Visão geral

Dassl implementou os seguintes métodos:

Adaptação de domínio de fonte única
- Clustering adaptativo de domínio cruzado para adaptação semi -supervisionada de domínio (CVPR'21) [DASSL/MOTOR/DA/CDAC.PY]
- Adaptação de domínio semi-supervisionada via Minimax Entropy (ICCV'19) [Dassl/Engine/da/mme.py]
- Discrepância do classificador máximo para adaptação de domínio não supervisionada (CVPR'18) [DASSL/MOTOR/DA/MCD.PY]
- Auto-negação para a adaptação do domínio visual (ICLR'18) [DASSL/MOTOR/DA/Self_ENSEMBLE.PY]
- Revisitando a normalização do lote para adaptação prática do domínio (ICLR-W'17) [Dassl/Engine/da/adabn.py]
- Adaptação de domínio discriminatório adversário (CVPR'17) [Dassl/Engine/da/adda.py]
- Treinamento de Domain-Adversarial de Redes Neurais (JMLR'16) [DASSL/MOTOR/DA/DANN.PY]
Adaptação de domínio de várias fontes
- Aadaptativa de domínio Aprendizagem [DASSL/Engine/da/dael.py]
- Momento correspondente à adaptação de domínio de várias fontes (ICCV'19) [DASSL/MOTOR/DA/M3SDA.PY]
Generalização do domínio
- Generalização de domínio dinâmico (ijcai'22) [Dassl/Modeling/Backbone/Resnet_Dynamic.py] [Dassl/Engine/DG/Domain_Mix.py]
- Correspondência exata de distribuição de recursos para transferência de estilo arbitrário e generalização de domínio (CVPR'22) [DASSL/MODELAGEM/OPS/EFDMIX.PY]
- Generalização de domínio com mixstyle (iclr'21) [Dassl/Modeling/Ops/MixStyle.py]
- Geração de imagem de domínio profundo para generalização de domínio (AAAI'20) [DASSL/MOTOR/DG/DDAIG.PY]
- Generalização entre domínios via treinamento em gradiente cruzado (ICLR'18) [DASSL/MOTOR/DG/Crossgrad.py]
Aprendizado semi-supervisionado
- FixMatch: simplificando o aprendizado semi-supervisionado com consistência e confiança [DASSL/MOTOR/SSL/FIXMATCH.PY]
- MixMatch: Uma abordagem holística do aprendizado semi-supervisionado (Neurips'19) [Dassl/Engine/SSL/MixMatch.py]
- Os professores médios são melhores modelos: metas de consistência com média de peso melhoram os resultados de aprendizado profundo semi-supervisionado (Neurips'17) [DASSL/MOTOR/SSL/MEAVEL_TEACHER.PY]
- Aprendizagem semi-supervisionada por minimização da entropia (Neurips'04) [DASSL/MOTOR/SSL/entmin.py]

Sinta -se à vontade para fazer um PR para adicionar seus métodos aqui para facilitar a referência para os outros!

DASSL suporta os seguintes conjuntos de dados:

Adaptação de domínio
- Office-31
- Escritório em casa
- Visda17
- CIFAR10-STL10
- Digit-5
- Domainnet
- minidomainnet
Generalização do domínio
- Pacs
- VLCs
- Escritório em casa
- Digits-dg
- Dígito-single
- CIFAR-10-C
- CIFAR-100-C
- iwildcam-wilds
- CAMELYON17-WILLS
- Fmow-wilds
Aprendizado semi-supervisionado
- Cifar10/100
- Svhn
- STL10

Comece

Instalação

Verifique se o CONDA está instalado corretamente.

 # Clone this repo
git clone https://github.com/KaiyangZhou/Dassl.pytorch.git
cd Dassl.pytorch/

# Create a conda environment
conda create -y -n dassl python=3.8

# Activate the environment
conda activate dassl

# Install torch (requires version >= 1.8.1) and torchvision
# Please refer to https://pytorch.org/ if you need a different cuda version
conda install pytorch torchvision cudatoolkit=10.2 -c pytorch

# Install dependencies
pip install -r requirements.txt

# Install this library (no need to re-build if the source code is modified)
python setup.py develop

Siga as instruções nos conjuntos de dados.md para pré -processar os conjuntos de dados.

Treinamento

A interface principal é implementada em tools/train.py , o que basicamente faz

Inicialize a configuração com cfg = setup_cfg(args) , onde args contém a entrada da linha de comando (consulte tools/train.py para a lista de argumentos de entrada);
Instanciar um trainer com build_trainer(cfg) que carrega o conjunto de dados e cria um modelo de rede neural profundo;
Call trainer.train() para treinamento e avaliação do modelo.

Abaixo, fornecemos um exemplo para treinar uma linha de base somente fonte no conjunto de dados de adaptação de domínio popular, Office-31,

CUDA_VISIBLE_DEVICES=0 python tools/train.py 
--root $DATA 
--trainer SourceOnly 
--source-domains amazon 
--target-domains webcam 
--dataset-config-file configs/datasets/da/office31.yaml 
--config-file configs/trainers/da/source_only/office31.yaml 
--output-dir output/source_only_office31

$DATA indicam o local onde os conjuntos de dados são instalados. --dataset-config-file carrega a configuração comum para o conjunto de dados (Office-31 neste caso), como tamanho da imagem e arquitetura do modelo. --config-file carrega a configuração específica do algoritmo, como hiper-parâmetros e parâmetros de otimização.

Para usar várias fontes, a saber, a tarefa de adaptação de domínio de várias fontes, é preciso apenas adicionar mais fontes a --source-domains . Por exemplo, para treinar uma linha de base somente de fonte no Minidomainnet, pode-se fazer

CUDA_VISIBLE_DEVICES=0 python tools/train.py 
--root $DATA 
--trainer SourceOnly 
--source-domains clipart painting real 
--target-domains sketch 
--dataset-config-file configs/datasets/da/mini_domainnet.yaml 
--config-file configs/trainers/da/source_only/mini_domainnet.yaml 
--output-dir output/source_only_minidn

Após o acabamento do treinamento, os pesos do modelo serão salvos no diretório de saída especificado, juntamente com um arquivo de log e um arquivo de tensorboard para visualização.

Para imprimir os resultados salvos no arquivo de log (para que você não precise passar exaustivamente por todos os arquivos de log e calcular a média/std sozinho), você pode usar tools/parse_test_res.py . A instrução pode ser encontrada no código.

Para outros treinadores, como MCD , você pode definir --trainer MCD , mantendo o arquivo de configuração inalterado, ou seja, usando os mesmos parâmetros de treinamento que SourceOnly (no caso mais simples). Para modificar os hiper-parâmetros no MCD, como N_STEP_F (número de etapas para atualizar o extrator de recurso), você pode anexar TRAINER.MCD.N_STEP_F 4 aos argumentos de entrada existentes (caso contrário, o valor padrão será usado). Como alternativa, você pode criar um novo arquivo de configuração .yaml para armazenar sua configuração personalizada. Veja aqui uma lista completa de hiper-parâmetros específicos do algoritmo.

Teste

O teste de modelo pode ser feito usando --eval-only , que pede ao código para executar trainer.test() . Você também precisa fornecer o modelo treinado e especificar qual arquivo de modelo (ou seja, salvo em qual época) usar. Por exemplo, para usar model.pth.tar-20 salvo em output/source_only_office31/model , você pode fazer

CUDA_VISIBLE_DEVICES=0 python tools/train.py 
--root $DATA 
--trainer SourceOnly 
--source-domains amazon 
--target-domains webcam 
--dataset-config-file configs/datasets/da/office31.yaml 
--config-file configs/trainers/da/source_only/office31.yaml 
--output-dir output/source_only_office31_test 
--eval-only 
--model-dir output/source_only_office31 
--load-epoch 20

Observe que --model-dir toma como entrada o caminho do diretório especificado em --output-dir no estágio de treinamento.

Escreva um novo treinador

Uma boa prática é passar pelo dassl/engine/trainer.py para obter a Familar com as classes de treinadores base, que fornecem funções genéricas e loops de treinamento. Para escrever uma classe de treinador para adaptação de domínio ou aprendizado semi-supervisionado, a nova classe pode subclasse TrainerXU . Para generalização do domínio, a nova classe pode subclasse TrainerX . Em particular, TrainerXU e TrainerX diferem principalmente no uso de um carregador de dados para dados não marcados. Com as classes base, um novo treinador pode precisar implementar apenas o método forward_backward() , que executa a computação de perdas e a atualização do modelo. Consulte dassl/enigne/da/source_only.py por exemplo.

Adicione um novo backbone/cabeça/rede

backbone corresponde a um modelo de rede neural convolucional que executa a extração de recursos. head (que é um módulo opcional) é montada na parte superior da backbone para processamento adicional, que pode ser, por exemplo, um MLP. backbone e head são blocos básicos de construção para construir um SimpleNet() (consulte dassl/engine/trainer.py ), que serve como modelo principal para uma tarefa. network contém modelos de rede neural personalizados, como um gerador de imagens.

Para adicionar um novo módulo, ou seja, uma espinha dorsal/cabeça/rede, você precisa primeiro registrar o módulo usando o registry correspondente, ou seja, BACKBONE_REGISTRY para backbone , HEAD_REGISTRY for head e NETWORK_RESIGTRY for network . Observe que, para um novo backbone , exigimos que o modelo subclasse Backbone , conforme definido no dassl/modeling/backbone/backbone.py e especifique o atributo self._out_features .

Fornecemos um exemplo abaixo sobre como adicionar uma nova backbone .

 from dassl . modeling import Backbone , BACKBONE_REGISTRY

class MyBackbone ( Backbone ):

    def __init__ ( self ):
        super (). __init__ ()
        # Create layers
        self . conv = ...

        self . _out_features = 2048

    def forward ( self , x ):
        # Extract and return features

@ BACKBONE_REGISTRY . register ()
def my_backbone ( ** kwargs ):
    return MyBackbone ()

Em seguida, você pode definir MODEL.BACKBONE.NAME como my_backbone para usar sua própria arquitetura. Para mais detalhes, consulte o código -fonte em dassl/modeling .

Adicione um conjunto de dados

Um exemplo de estrutura de código é mostrado abaixo. Certifique -se de subclasse DatasetBase e registrar o conjunto de dados com @DATASET_REGISTRY.register() . Tudo o que você precisa é carregar train_x , train_u (opcional), val (opcional) e test , entre os quais train_u e val não podem ser None ou simplesmente ignorado. Cada uma dessas variáveis contém uma lista de objetos Datum . Um objeto Datum (implementado aqui) contém informações para uma única imagem, como impath (string) e label (int).

 from dassl . data . datasets import DATASET_REGISTRY , Datum , DatasetBase

@ DATASET_REGISTRY . register ()
class NewDataset ( DatasetBase ):

    dataset_dir = ''

    def __init__ ( self , cfg ):
        
        train_x = ...
        train_u = ...  # optional, can be None
        val = ...  # optional, can be None
        test = ...

        super (). __init__ ( train_x = train_x , train_u = train_u , val = val , test = test )

Sugerimos que você dê uma olhada no código dos conjuntos de dados em alguns projetos como esse, que é construído sobre o DASSL.

Pesquisa relevante

Gostaríamos de compartilhar aqui nossa pesquisa relevante para Dassl.

Generalização do domínio no dispositivo
Generalização de domínio: uma pesquisa (TPAMI 2022)
Aprendizagem de conjunto adaptativo de domínio (dica 2021)
MixStyle Neural Redes para generalização e adaptação de domínio
Generalização de domínio semi-supervisionada com estocástica Stylematch
Generalização de domínio com o MixStyle (ICLR 2021)
Aprendendo a gerar novos domínios para generalização do domínio (ECCV 2020)
Geração de imagem de domínio profundo para generalização de imagens para generalização do domínio (AAAI 2020)

Citação

Se você achar este código útil para sua pesquisa, dê crédito ao artigo a seguir

 @article{zhou2022domain,
  title={Domain generalization: A survey},
  author={Zhou, Kaiyang and Liu, Ziwei and Qiao, Yu and Xiang, Tao and Loy, Chen Change},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  year={2022},
  publisher={IEEE}
}

@article{zhou2021domain,
  title={Domain adaptive ensemble learning},
  author={Zhou, Kaiyang and Yang, Yongxin and Qiao, Yu and Xiang, Tao},
  journal={IEEE Transactions on Image Processing},
  volume={30},
  pages={8008--8018},
  year={2021},
  publisher={IEEE}
}

Expandir

Informações adicionais

Versão 1.0.0
Tipo Pitão
Data da Última Atualização 2025-07-11
tamanho 175.6KB
Vindo de Github

Aplicativos Relacionados

Lib.Net.Http.WebPush

2024-11-10
pytorch image models

2024-11-03
MEDO 3

2022-09-05
RUSE

2022-08-20
COMA

2022-08-11
ZAR

2022-07-30

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ToDo Co

Pitão

1.0.0
Python Portfolio

Pitão
Ferramenta de gráfico de dados de código aberto Redash v24.10.0

Pitão

24.10.0
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos