Descargar Dassl.pytorch - Dassl.pytorch Código fuente de descarga

Dassl.pytorch

Pitón

1.0.0

Descargar

Dassl

Introducción

DASSL es una caja de herramientas de Pytorch desarrollada inicialmente para nuestro Proyecto Dominio Adaptive Ensemble Learning (DAEL) para apoyar la investigación en la adaptación y generalización del dominio, ya que en Dael estudiamos cómo unificar estos dos problemas en un solo marco de aprendizaje. Dado que la adaptación del dominio está estrechamente relacionada con el aprendizaje semi-supervisado, ambos estudian cómo explotar los datos no etiquetados, también incorporamos componentes que apoyan la investigación para este último.

¿Por qué el nombre "Dassl"? DASSL combina las iniciales de adaptación de dominio (DA) y aprendizaje semi-supervisado (SSL), que suena natural e informativo.

DASSL tiene un diseño modular e interfaces unificadas, lo que permite la prototipos rápidos y la experimentación de nuevos métodos DA/DG/SSL. Con DASSL, se puede implementar un nuevo método con solo unas pocas líneas de código. ¿No crees? Eche un vistazo a la carpeta del motor, que contiene las implementaciones de muchos métodos existentes (luego volverá y protagonizará este repositorio). :-)

Básicamente, DASSL es perfecto para investigar en las siguientes áreas:

Adaptación de dominio
Generalización del dominio
Aprendizaje semi-supervisado

Pero, gracias al diseño ordenado, DASSL también se puede usar como una base de código para desarrollar cualquier proyecto de aprendizaje profundo, como este. :-)

Un inconveniente de DASSL es que no es (todavía? Hmm) admite el entrenamiento multi-GPU distribuido (DASSL usa DataParallel para envolver un modelo, que es menos eficiente que DistributedDataParallel ).

No proporcionamos documentos detallados para DASSL, a diferencia de otro proyecto nuestro. Esto se debe a que DASSL se desarrolla con fines de investigación y, como investigador, creemos que es importante poder leer el código fuente y lo recomendamos que lo haga, definitivamente no porque seamos perezosos. :-)

Qué hay de nuevo

[Oct 2022] El nuevo artículo "Generalización del dominio en el dispositivo" está fuera! Código, modelos y conjuntos de datos: https://github.com/kaiyangzhou/on-device-dg.

Más

[Jun 2022] v0.6.0 : hacer cfg.TRAINER.METHOD_NAME consistente con el nombre de la clase de método.
[Jun 2022] Shreejal Trivedi agrega un nuevo método de adaptación de dominio (CVPR'21). Vea aquí para más detalles.
[Jun 2022] agrega tres conjuntos de datos del punto de referencia Wilds: IWILDCAM, FMOW y CAMELYON17. Vea aquí para más detalles.
[Mayo de 2022] Un nuevo método de generalización de dominio DDG desarrollado por Zhishu Sun y aparecer en IJCAI'22 se agrega a este repositorio. Vea aquí para más detalles.
[Mar 2022] Se agrega un nuevo método de generalización de dominio desarrollado por Yabin Zhang (Polyu) y aparece en CVPR'22 a este repositorio. Vea aquí para más detalles.
[Febrero de 2022] En caso de que no lo sepa, una clase en el dominio de pintura del dominio de dominio (las divisiones oficiales) solo tiene imágenes de prueba (sin imágenes de capacitación), lo que podría afectar el rendimiento. Consulte la Sección 4.A en nuestro documento para obtener más detalles.
[Oct 2021] v0.5.0 : cambios importantes realizados a transforms.py . 1) center_crop se convierte en una transformación predeterminada en las pruebas (aplicada después de cambiar el tamaño del borde más pequeño a un determinado tamaño para mantener la relación de aspecto de la imagen). 2) Para el entrenamiento, Resize(cfg.INPUT.SIZE) se desactiva cuando se usa random_crop o random_resized_crop . Estos cambios no harán ninguna diferencia en las transformaciones de entrenamiento utilizadas en los archivos de configuración existentes, ni en las transformaciones de prueba a menos que las imágenes sin procesar no estén al cuadrado (la única diferencia es que ahora se respeta la relación de aspecto de la imagen).
[Oct 2021] v0.4.3 : Copie los atributos en self.dm (administrador de datos) a SimpleTrainer y haga que self.dm sea opcional, lo que significa que a partir de ahora puede crear cargadores de datos de cualquier fuente que desee en lugar de ser obligado a usar DataManager .
[SEP 2021] v0.4.2 : Una actualización importante es establecer drop_last=is_train and len(data_source)>=batch_size al construir un cargador de datos para evitar 0 de longitud.

Descripción general

DASSL ha implementado los siguientes métodos:

Adaptación de dominio de fuente única
- Agrupación adaptativa de dominio cruzado para adaptación de dominio semi supervisado (CVPR'21) [DASSL/MOTER/DA/CDAC.PY]
- Adaptación del dominio semi-supervisado a través de la entropía Minax (ICCV'19) [DASSL/MOTOR/DA/MME.PY]
- Discrepancia del clasificador máximo para la adaptación del dominio no supervisada (CVPR'18) [DASSL/MOTER/DA/MCD.PY]
- Conocimiento de la adaptación de dominio visual (ICLR'18) [Dassl/Engine/Da/Self_ensembling.py]
- Revisando la normalización por lotes para la adaptación práctica del dominio (ICLR-W'17) [DASSL/MOTER/DA/ADABN.PY]
- Adversaria adaptación de dominio discriminativo (CVPR'17) [DASSL/MOTOR/DA/ADDA.PY]
- Entrenamiento de dominio-adversario de redes neuronales (JMLR'16) [DASSL/MOTOR/DA/DANN.PY]
Adaptación de dominio de múltiples fuentes
- Dominio Aadaptive Ensemble Learning [Dassl/Engine/Da/Dael.py]
- Momento de momento para la adaptación de dominio de fuentes múltiples (ICCV'19) [DASSL/MOTOR/DA/M3SDA.PY]
Generalización del dominio
- Generalización de dominio dinámico (IJCAI'22) [DASSL/MODELING/BUTHBONE/RESNET_DYNAMIC.PY] [DASSL/MOTOR/DG/DOMAIN_MIX.PY]
- Magaz de distribución de características exacta para transferencia de estilo arbitraria y generalización de dominio (CVPR'22) [DASSL/MODELING/OPS/EFDMIX.PY]
- Generalización de dominio con MixStyle (ICLR'21) [DASSL/MODELING/OPS/MixStyle.py]
- Generación de imágenes de dominio profundo para la generalización del dominio (AAAI'20) [DASSL/MOTOR/DG/DDAIG.PY]
- Generalizar a través de dominios a través de entrenamiento de gradiente cruzado (ICLR'18) [DASSL/MOTER/DG/Crossgrad.py]
Aprendizaje semi-supervisado
- FixMatch: simplificación del aprendizaje semi-supervisado con consistencia y confianza [dassl/motor/ssl/fixmatch.py]
- MixMatch: un enfoque holístico para el aprendizaje semi-supervisado (Neurips'19) [DASSL/Engine/SSL/MixMatch.py]
- Los maestros medios son mejores modelos a seguir: los objetivos de consistencia promediados por peso mejoran los resultados de aprendizaje profundo semi-supervisado (Neurips'17) [DASSL/Engine/SSL/Mean_Teacher.py]
- Aprendizaje semi-supervisado por minimización de entropía (neurips'04) [dassl/motor/ssl/entmin.py]

¡Siéntase libre de hacer un PR para agregar sus métodos aquí para facilitar que otros comparen!

Dassl admite los siguientes conjuntos de datos:

Adaptación de dominio
- Oficina 31
- Domicilio
- Visda17
- Cifar10-stl10
- Dígito-5
- Dominio del dominio
- minidomainnet
Generalización del dominio
- PACS
- VLCS
- Domicilio
- Dígitos-dg
- Dígito
- CIFAR-10-C
- CIFAR-100-C
- iwildcam-wilds
- Camelyon17-Wilds
- Fmow-wilds
Aprendizaje semi-supervisado
- Cifar10/100
- Svhn
- Stl10

Empezar

Instalación

Asegúrese de que Conda se instale correctamente.

 # Clone this repo
git clone https://github.com/KaiyangZhou/Dassl.pytorch.git
cd Dassl.pytorch/

# Create a conda environment
conda create -y -n dassl python=3.8

# Activate the environment
conda activate dassl

# Install torch (requires version >= 1.8.1) and torchvision
# Please refer to https://pytorch.org/ if you need a different cuda version
conda install pytorch torchvision cudatoolkit=10.2 -c pytorch

# Install dependencies
pip install -r requirements.txt

# Install this library (no need to re-build if the source code is modified)
python setup.py develop

Siga las instrucciones en los conjuntos de datos.md para preprocesar los conjuntos de datos.

Capacitación

La interfaz principal se implementa en tools/train.py , que básicamente hace

Inicialice la configuración con cfg = setup_cfg(args) donde args contiene la entrada de línea de comandos (ver tools/train.py para la lista de argumentos de entrada);
Instanciar un trainer con build_trainer(cfg) que carga el conjunto de datos y construye un modelo de red neuronal profunda;
Llame trainer.train() para capacitar y evaluar el modelo.

A continuación, proporcionamos un ejemplo para capacitar una línea de base exclusiva para la fuente en el popular conjunto de datos de adaptación de dominio, Office-31,

CUDA_VISIBLE_DEVICES=0 python tools/train.py 
--root $DATA 
--trainer SourceOnly 
--source-domains amazon 
--target-domains webcam 
--dataset-config-file configs/datasets/da/office31.yaml 
--config-file configs/trainers/da/source_only/office31.yaml 
--output-dir output/source_only_office31

$DATA denota la ubicación donde se instalan conjuntos de datos. --dataset-config-file carga la configuración común para el conjunto de datos (Office-31 en este caso), como el tamaño de la imagen y la arquitectura del modelo. --config-file carga la configuración específica del algoritmo, como los hiperparámetros y los parámetros de optimización.

Para usar múltiples fuentes, a saber, la tarea de adaptación de dominio de múltiples fuentes, uno solo necesita agregar más fuentes a --source-domains . Por ejemplo, para entrenar una línea de base exclusiva de origen en minidomainnet, uno puede hacer

CUDA_VISIBLE_DEVICES=0 python tools/train.py 
--root $DATA 
--trainer SourceOnly 
--source-domains clipart painting real 
--target-domains sketch 
--dataset-config-file configs/datasets/da/mini_domainnet.yaml 
--config-file configs/trainers/da/source_only/mini_domainnet.yaml 
--output-dir output/source_only_minidn

Después de que termine el entrenamiento, los pesos del modelo se guardarán en el directorio de salida especificado, junto con un archivo de registro y un archivo de tablero tensor para la visualización.

Para imprimir los resultados guardados en el archivo de registro (para que no sea necesario revisar exhaustivamente todos los archivos de registro y calcular la media/ETS por sí misma), puede usar tools/parse_test_res.py . La instrucción se puede encontrar en el código.

Para otros entrenadores, como MCD , puede establecer --trainer MCD mientras mantiene el archivo de configuración sin cambios, es decir, utilizando los mismos parámetros de entrenamiento que SourceOnly (en el caso más simple). Para modificar los hiper-parámetros en MCD, como N_STEP_F (número de pasos para actualizar el extractor de funciones), puede agregar TRAINER.MCD.N_STEP_F 4 a los argumentos de entrada existentes (de lo contrario, el valor predeterminado se usará). Alternativamente, puede crear un nuevo archivo de configuración .yaml para almacenar su configuración personalizada. Consulte aquí para obtener una lista completa de hiper-parametros específicos de algoritmo.

Prueba

Las pruebas de modelo se pueden realizar usando --eval-only , que le pide al código que ejecute trainer.test() . También debe proporcionar el modelo capacitado y especificar qué archivo de modelo (es decir, guardado en qué época) usar. Por ejemplo, para usar model.pth.tar-20 guardado en output/source_only_office31/model , puede hacer

CUDA_VISIBLE_DEVICES=0 python tools/train.py 
--root $DATA 
--trainer SourceOnly 
--source-domains amazon 
--target-domains webcam 
--dataset-config-file configs/datasets/da/office31.yaml 
--config-file configs/trainers/da/source_only/office31.yaml 
--output-dir output/source_only_office31_test 
--eval-only 
--model-dir output/source_only_office31 
--load-epoch 20

Tenga en cuenta que --model-dir toma como entrada la ruta del directorio que se especificó en --output-dir en la etapa de entrenamiento.

Escribe un nuevo entrenador

Una buena práctica es pasar por dassl/engine/trainer.py para ser familiar con las clases de entrenadores base, que proporcionan funciones genéricas y bucles de capacitación. Para escribir una clase de entrenador para la adaptación de dominio o el aprendizaje semi-supervisado, la nueva clase puede subclase TrainerXU . Para la generalización del dominio, la nueva clase puede subclase TrainerX . En particular, TrainerXU y TrainerX difieren principalmente en si el uso de un cargador de datos para datos no etiquetados. Con las clases base, un nuevo entrenador solo puede necesitar implementar el método forward_backward() , que realiza el cálculo de pérdidas y la actualización del modelo. Consulte dassl/enigne/da/source_only.py por ejemplo.

Agregue una nueva columna vertebral/cabeza/red

backbone corresponde a un modelo de red neuronal convolucional que realiza una extracción de características. head (que es un módulo opcional) se monta en la parte posterior de backbone para su posterior procesamiento, lo que puede ser, por ejemplo, un MLP. backbone y head son bloques de construcción básicos para construir un SimpleNet() (ver dassl/engine/trainer.py ) que sirve como el modelo principal para una tarea. network contiene modelos de red neuronales personalizados, como un generador de imágenes.

Para agregar un nuevo módulo, a saber, una columna vertebral/cabeza/red, primero debe registrar el módulo utilizando el registry correspondiente, es decir, BACKBONE_REGISTRY para backbone , HEAD_REGISTRY para head y NETWORK_RESIGTRY para network . Tenga en cuenta que para una nueva backbone , requerimos que el modelo subclase Backbone como se define en dassl/modeling/backbone/backbone.py y especifique el atributo self._out_features .

Proporcionamos un ejemplo a continuación sobre cómo agregar una nueva backbone .

 from dassl . modeling import Backbone , BACKBONE_REGISTRY

class MyBackbone ( Backbone ):

    def __init__ ( self ):
        super (). __init__ ()
        # Create layers
        self . conv = ...

        self . _out_features = 2048

    def forward ( self , x ):
        # Extract and return features

@ BACKBONE_REGISTRY . register ()
def my_backbone ( ** kwargs ):
    return MyBackbone ()

Luego, puede establecer MODEL.BACKBONE.NAME a my_backbone para usar su propia arquitectura. Para obtener más detalles, consulte el código fuente en dassl/modeling .

Agregar un conjunto de datos

A continuación se muestra una estructura de código de ejemplo. Asegúrese de subclase DatasetBase y registre el conjunto de datos con @DATASET_REGISTRY.register() . Todo lo que necesita es cargar train_x , train_u (Opcional), val (opcional) y test , entre los cuales train_u y val podrían ser None o simplemente ignorarse. Cada una de estas variables contiene una lista de objetos Datum . Un objeto Datum (implementado aquí) contiene información para una sola imagen, como impath (String) y label (int).

 from dassl . data . datasets import DATASET_REGISTRY , Datum , DatasetBase

@ DATASET_REGISTRY . register ()
class NewDataset ( DatasetBase ):

    dataset_dir = ''

    def __init__ ( self , cfg ):
        
        train_x = ...
        train_u = ...  # optional, can be None
        val = ...  # optional, can be None
        test = ...

        super (). __init__ ( train_x = train_x , train_u = train_u , val = val , test = test )

Le sugerimos que eche un vistazo al código de conjuntos de datos en algunos proyectos como este, que se basa en DASSL.

Investigación relevante

Nos gustaría compartir aquí nuestra investigación relevante para DASSL.

Generalización del dominio en el dispositivo
Generalización del dominio: una encuesta (TPAMI 2022)
Dominio Adaptive Ensemble Learning (Consejo 2021)
Redes neuronales mixstyle para generalización y adaptación de dominio
Generalización del dominio semi-supervisado con estilematch estocástico
Generalización del dominio con MixStyle (ICLR 2021)
Aprender a generar nuevos dominios para la generalización del dominio (ECCV 2020)
Generación de imágenes de dominio profundo para la generalización del dominio (AAAI 2020)

Citación

Si encuentra este código útil para su investigación, dé crédito al siguiente documento

 @article{zhou2022domain,
  title={Domain generalization: A survey},
  author={Zhou, Kaiyang and Liu, Ziwei and Qiao, Yu and Xiang, Tao and Loy, Chen Change},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  year={2022},
  publisher={IEEE}
}

@article{zhou2021domain,
  title={Domain adaptive ensemble learning},
  author={Zhou, Kaiyang and Yang, Yongxin and Qiao, Yu and Xiang, Tao},
  journal={IEEE Transactions on Image Processing},
  volume={30},
  pages={8008--8018},
  year={2021},
  publisher={IEEE}
}

Expandir

Información adicional

Versión 1.0.0
Tipo Pitón
Fecha de actualización 2025-07-11
tamaño 175.6KB
Proviene de Github

Aplicaciones relacionadas

Lib.Net.Http.WebPush

2024-11-10
pytorch image models

2024-11-03
MIEDO 3

2022-09-05
ARDID

2022-08-20
KOMA

2022-08-11
ZAR

2022-07-30

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ToDo Co

Pitón

1.0.0
Python Portfolio

Pitón
Herramienta de gráficos de datos de código abierto Redash v24.10.0

Pitón

24.10.0
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo