FlowNetPytorchダウンロードFlowNetPytorchソースコードダウンロード

FlowNetPytorch

パイソン

1.0.0

ダウンロード

Flownetpytorch

Dosovitskiy et al。

このリポジトリは、Alexey Dosovitskiy et al。によるFlownetのトーチ実装です。 Pytorchで。こちらのトーチの実装を参照してください

このコードは、主に公式のImagenetの例からインスピレーションを受けています。複数のGPUについてはテストされていませんが、元のコードと同様に機能するはずです。

このコードは、フライングチェアデータセットを使用して、データ増強を使用してトレーニングの例を提供します。シーンフローデータセットの実装が将来追加される場合があります。

現在、2つのニューラルネットワークモデルが提供されており、バッチ規範のバリエーション（実験）があります。

飛行
Flownetsbn
FlownetC
flownetcbn

前処理されたモデル

Kaixhinのおかげで、こちらから（Pytorchからではなく、Caffeから）Flowenetsの前版をダウンロードできます。このフォルダーには、トレーニングされたネットワークもゼロから含まれています。

ネットワークの読み込みに注意してください

ダウンロードされたネットワークをスクリプトに直接送ります。デスクトップ環境がそう言っている場合でも、それを非圧縮する必要はありません。

Caffeのネットワークに関するメモ

これらのネットワークは、BGR入力を期待しています（PytorchのRGBと比較）。ただし、BGRの順序はそれほど重要ではありません。

前提条件

これらのモジュールは、 pipでインストールできます

 pytorch >= 1.2
tensorboard-pytorch
tensorboardX >= 1.4
spatial-correlation-sampler>=0.2.1
imageio
argparse
path.py

または

pip install -r requirements.txt

空飛ぶ椅子データセットのトレーニング

まず、フライングチェアデータセットをダウンロードする必要があります。それは〜64GB大きいので、SSDドライブに入れることをお勧めします。

main.pyで提供されるデフォルトのハイパーパラメーターは、Caffeトレーニングスクリプトと同じです。

飛行の例の使用：

python main.py /path/to/flying_chairs/ -b8 -j8 -a flownets

データのロードを避けてトレーニングを遅らせることを避けるために、データを使用している場合は、J（データスレッドの数）を高に設定することをお勧めします。

さらにヘルプについては、入力できます

python main.py -h

視覚化トレーニング

Tensorboard-Pytorchはロギングに使用されます。結果を視覚化するには、単に入力します

tensorboard --logdir=/path/to/checkpoints

トレーニング結果

モデルはPytorchフォルダーからダウンロードできます。

モデルは、指定がない限り、デフォルトオプションでトレーニングされました。色の歪みは使用されませんでした。

アーチ	学習率	バッチサイズ	エポックサイズ	ファイル名	検証EPE
飛行	1E-4	8	2700	flownets_epe1.951.pth.tar	1.951
飛行機bn	1E-3	32	695	flownets_bn_epe2.459.pth.tar	2.459
FlownetC	1E-4	8	2700	Flownetc_epe1.766.pth.tar	1.766

注：Flowenets BNは訓練に時間がかかり、結果が悪化しました。空飛ぶ椅子のデータセットには使用しないことを強くお勧めします。

検証サンプル

予測は飛行によって行われます。

光フローの正確なコード - >カラーマップはこちらにあります

入力	予測	グラウンドトゥルース

画像ペアのセットで推論を実行します

画像でネットワークを実行する必要がある場合は、ここから事前に処理されたネットワークをダウンロードして、画像ペアのフォルダーで推論スクリプトを起動できます。

フォルダは、すべての画像を同じ場所にペアにし、名前パターンを備えている必要があります

 {image_name}1.{ext}
{image_name}2.{ext}

python3 run_inference.py /path/to/images/folder /path/to/pretrained

main.pyスクリプトについては、追加のオプションにヘルプメニューを使用できます。

変換関数に注意してください

入力とターゲットの間にコヒーレントな変換を行うには、ランダム変換が呼び出されるたびに新しいランダム変数が定義されるため、入力とターゲットの両方をとる新しい変換を定義する必要があります。

フロー変換

データの増強を可能にするために、入力の回転と翻訳とその結果をターゲットフローマップで検討しました。適切なデータ増強を達成するために、世話をするもののセットがあります

フローマップはIMG1に直接リンクされています

IMG1に変換を適用する場合、フローマップにまったく同じを適用して、フローのコヒーレントな原点ポイントを取得する必要があります。

IMG1とIMG2の間の翻訳

IMG2に適用された翻訳(tx,ty)を考えると、

 flow[:,:,0] += tx
flow[:,:,1] += ty

規模

ズームパラメーターを使用してIMG1とIMG2の両方に適用されるスケールはalphaに同じ量を掛けます

 flow *= alpha

両方の画像に回転が適用されました

角度thetaによって両方の画像に適用される回転は、同じ角度でフローベクトル（ flow[i,j] ）も回転します

 for_all i,j flow[i,j] = rotate(flow[i,j], theta)

rotate: x,y,theta ->  (x*cos(theta)-x*sin(theta), y*cos(theta), x*sin(theta))

IMG2に適用された回転

画像センターからの角度thetaによる回転を考えてみましょう。

それが着陸する座標に基づいて、各フローベクトルをトランス形成する必要があります。各座標(i, j)には、次のことがあります。

 flow[i, j, 0] += (cos(theta) - 1) * (j  - w/2 + flow[i, j, 0]) +    sin(theta)    * (i - h/2 + flow[i, j, 1])
flow[i, j, 1] +=   -sin(theta)    * (j  - w/2 + flow[i, j, 0]) + (cos(theta) - 1) * (i - h/2 + flow[i, j, 1])

拡大する

追加情報

バージョン 1.0.0
タイプパイソン
更新時間 2025-07-12
サイズ 1.1MB
から Github

FlowNetPytorch

Flownetpytorch

前処理されたモデル

ネットワークの読み込みに注意してください

Caffeのネットワークに関するメモ

前提条件

空飛ぶ椅子データセットのトレーニング

視覚化トレーニング

トレーニング結果

検証サンプル

画像ペアのセットで推論を実行します

変換関数に注意してください

フロー変換

フローマップはIMG1に直接リンクされています

IMG1とIMG2の間の翻訳

規模

両方の画像に回転が適用されました

IMG2に適用された回転

ToDo Co

Python Portfolio

Redash オープンソースデータチャートツール v24.10.0

datamule python

スマートチャートデータ視覚化プラットフォーム v6.9

Locust 負荷テストツール v2.32.0

chat.petals.dev

GPT Prompt Templates

GPTyped

ToDo Co

Python Portfolio

Redash オープンソースデータチャートツール v24.10.0

Google Dorks

shepherd

mongo express