Descargar FlowNetPytorch - Descargar el código fuente de FlowNetPytorch

FlowNetPytorch

Pitón

1.0.0

Descargar

Flownetpytorch

Implementación de Pytorch de Flyet por Dosovitskiy et al.

Este repositorio es una implementación de antorcha de Flowtet, por Alexey Dosovitskiy et al. En Pytorch. Ver implementación de antorcha aquí

Este código se inspira principalmente en el ejemplo oficial de ImageNet. No se ha probado para múltiples GPU, pero debería funcionar al igual que en el código original.

El código proporciona un ejemplo de capacitación, utilizando el conjunto de datos de la silla voladora, con aumento de datos. Se puede agregar una implementación para conjuntos de datos de flujo de escenas en el futuro.

Actualmente se proporcionan dos modelos de red neuronal, junto con su variación de norma por lotes (experimental):

Volantes
Flownetsbn
Flownetc
Flownetcbn

Modelos previos a la aparición

Gracias a Kaixhin, puede descargar una versión previa a la envoltura de Flughets (de Caffe, no de Pytorch) aquí. Esta carpeta también contiene redes entrenadas desde cero.

Nota sobre la carga de las redes

Alimente directamente la red descargada al script, no necesita descomprimirla incluso si su entorno de escritorio le indica.

Nota en las redes de Caffe

Estas redes esperan una entrada BGR (en comparación con RGB en Pytorch). Sin embargo, el orden BGR no es muy importante.

Requisito previo

Estos módulos se pueden instalar con pip

 pytorch >= 1.2
tensorboard-pytorch
tensorboardX >= 1.4
spatial-correlation-sampler>=0.2.1
imageio
argparse
path.py

o

pip install -r requirements.txt

Entrenamiento en el conjunto de datos de la silla voladora

Primero, debe descargar el conjunto de datos de la silla voladora. Es ~ 64 GB grande y le recomendamos que lo ponga en una unidad SSD.

Los hiperparámetros predeterminados proporcionados en main.py son los mismos que en los scripts de entrenamiento de la cafe.

Ejemplo de uso para volantes:

python main.py /path/to/flying_chairs/ -b8 -j8 -a flownets

Recomendamos que establezca J (número de hilos de datos) en alto si utiliza DataAgmation para evitar la carga de datos para retrasar el entrenamiento.

Para obtener más ayuda, puede escribir

python main.py -h

Visualización del entrenamiento

TensorBoard-Pytorch se usa para registrar. Para visualizar el resultado, simplemente escriba

tensorboard --logdir=/path/to/checkpoints

Resultados del entrenamiento

Los modelos se pueden descargar aquí en la carpeta Pytorch.

Los modelos fueron entrenados con opciones predeterminadas a menos que se especifiquen. La deformación del color no se usó.

Arco	tasa de aprendizaje	tamaño por lotes	tamaño de la época	Nombre del archivo	Validación EPE
Volantes	1e-4	8	2700	Flownets_epe1.951.pth.tar	1.951
Volantes bn	1e-3	32	695	FLOWNETS_BN_EPE2.459.pth.tar	2.459
Flownetc	1e-4	8	2700	FLOWNETC_EPE1.766.PTH.TAR	1.766

Nota : Flownets Bn tardó más en entrenar y obtuvo peores resultados. Se recomienda encarecidamente que no lo use para el conjunto de datos de sillas voladoras.

Muestras de validación

La predicción se realiza por volantes.

Código exacto para el flujo óptico -> El mapa de color se puede encontrar aquí

Aporte	predicción	Estrut por tierra

Ejecutar inferencia en un conjunto de pares de imágenes

Si necesita ejecutar la red en sus imágenes, puede descargar una red de petróleo aquí y iniciar el script de inferencia en su carpeta de pares de imágenes.

Su carpeta debe tener todos los pares de imágenes en la misma ubicación, con el patrón de nombre

 {image_name}1.{ext}
{image_name}2.{ext}

python3 run_inference.py /path/to/images/folder /path/to/pretrained

En cuanto al script main.py , hay un menú de ayuda disponible para opciones adicionales.

Nota sobre las funciones de transformación

Para tener transformaciones coherentes entre las entradas y el objetivo, debemos definir nuevas transformaciones que tomen la entrada y el objetivo, ya que se define una nueva variable aleatoria cada vez que se llama a una transformación aleatoria.

Transformaciones de flujo

Para permitir el aumento de datos, hemos considerado la rotación y las traducciones para las entradas y su resultado en el mapa de flujo objetivo. Aquí hay un conjunto de cosas a cuidar para lograr un aumento de datos adecuado

El mapa de flujo está directamente vinculado a IMG1

Si aplica una transformación en IMG1, debe aplicar lo mismo para el mapa de flujo, para obtener puntos de origen coherentes para el flujo.

Traducción entre IMG1 e IMG2

Dada una traducción (tx,ty) aplicada en IMG2, tendremos

 flow[:,:,0] += tx
flow[:,:,1] += ty

Escala

Una escala aplicada tanto en IMG1 como en IMG2 con un zoom parámetros alpha multiplica el flujo por la misma cantidad

 flow *= alpha

Rotación aplicada en ambas imágenes

Una rotación aplicada en ambas imágenes por un ángulo theta también gira los vectores de flujo ( flow[i,j] ) por el mismo ángulo

 for_all i,j flow[i,j] = rotate(flow[i,j], theta)

rotate: x,y,theta ->  (x*cos(theta)-x*sin(theta), y*cos(theta), x*sin(theta))

Rotación aplicada en IMG2

Consideremos una rotación por el ángulo theta del centro de imagen.

Debemos transformar cada vector de flujo en función de las coordenadas donde aterriza. En cada coordenada (i, j) , tenemos:

 flow[i, j, 0] += (cos(theta) - 1) * (j  - w/2 + flow[i, j, 0]) +    sin(theta)    * (i - h/2 + flow[i, j, 1])
flow[i, j, 1] +=   -sin(theta)    * (j  - w/2 + flow[i, j, 0]) + (cos(theta) - 1) * (i - h/2 + flow[i, j, 1])

Expandir

Información adicional

Versión 1.0.0
Tipo Pitón
Fecha de actualización 2025-07-12
tamaño 1.1MB
Proviene de Github

Aplicaciones relacionadas

ToDo Co

2025-03-22
Python Portfolio

2024-11-10
Herramienta de gráficos de datos de código abierto Redash v24.10.0

2024-11-27
datamule python

2024-11-08
plataforma de visualización de datos smartchart v6.9

2024-11-27
Herramienta de prueba de carga de langosta v2.32.0

2024-11-27

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ToDo Co

Pitón

1.0.0
Python Portfolio

Pitón
datamule python

Pitón
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo