tps_stn_pytorchダウンロードtps_stn_pytorchソースコードダウンロード

tps_stn_pytorch

パイソン

1.0.0

ダウンロード

TPS_STN_PYTORCH

薄いプレートスプライン（TPS）を使用した空間変圧器ネットワーク（STN）のPytorch実装。

導入

STNは、[1]でDeepMindによって提案された強力なニューラルネットワークアーキテクチャです。 STNは、通常の分類ネットワークにフィードされる前に、入力画像を自動的に修正することにより、実際の空間不変性を実現します。 STNの最も驚くべき部分は、エンドツーエンドの差であり、既存のネットワークアーキテクチャ（AlexNet、ResNetなど）に直接プラグインできることです。

元のSTNペーパー[1] 3つの特定の変換形態に関する実験：アフィン変換、射影形質転換、薄板スプライン変換（TPS） 。その中でも、TPSは任意の方法で画像をゆがめることができるため、最も強力な翻訳だと思います。以下に示すように、私は自分のアバターをゆがめることができます

の中へ

TPS-STNはOCRアプリケーションで使用されています[2]。このペーパーでは、TPS-STNは、通常のOCRテキスト認識モデルに供給される前に、歪んだテキスト画像を自動的に修正することです。

依存関係

Python3
Pytorch
Torchvision
numpy
matplotlib
枕 / PIL
Imageio

imageioを使用して、GIFの視覚化を作成します。 pip install imageioでインストールするだけです。

走る

 python mnist_train.py --model unbounded_stn --angle 90 --grid_size 4
python mnist_visualize.py --model unbounded_stn --angle 90 --grid_size 4
python mnist_make_gif.py --model unbounded_stn --angle 90 --grid_size 4

その後、PNGおよびGIF Resutlsは./image/unbounded_stn_angle60_grid4/および./gif/unbounded_stn_angle60_grid4/に保存されます。

モデルアーキテクチャ、MNISTランダム回転角度、TPSグリッドサイズの他の組み合わせを試すことができます。以下の詳細。