
Learn2Learnは、メタ学習研究のソフトウェアライブラリです。
Learn2Learnは、Pytorchの上に構築して、メタ学習研究サイクルの2つの側面を加速します。
Learn2Learnは、既存のアルゴリズムと標準化されたベンチマークの高品質の実装とともに、新しいアルゴリズムとドメインを作成するための低レベルユーティリティと統一インターフェイスを提供します。 Torchvision、Torchaudio、Torchtext、Cherry、および使用している他のPytorchベースのライブラリとの互換性を保持しています。
詳細については、ホワイトペーパー:arxiv:2008.12284を参照してください
概要
learn2learn.data : Tasksetと変換して、Pytorchデータセットから少数のショットタスクを作成します。learn2learn.vision :コンピュータービジョンと少数のショット学習用のモデル、データセット、およびベンチマーク。learn2learn.gym :メタ補強学習の環境とユーティリティ。learn2learn.algorithms :既存のメタ学習アルゴリズムの高レベルラッパー。learn2learn.optim :微分可能な最適化とメタデセントのユーティリティとアルゴリズム。リソース
pip install learn2learn次のスニペットは、Learn2learnの機能をスニークピークします。
より多くのアルゴリズム(Protonets、Anil、Meta-SGD、Reptile、Meta-Curvature、KFO)については、例フォルダーを参照してください。それらのほとんどは、 GBMLラッパーで実装できます。 (ドキュメント)。
maml = l2l . algorithms . MAML ( model , lr = 0.1 )
opt = torch . optim . SGD ( maml . parameters (), lr = 0.001 )
for iteration in range ( 10 ):
opt . zero_grad ()
task_model = maml . clone () # torch.clone() for nn.Modules
adaptation_loss = compute_loss ( task_model )
task_model . adapt ( adaptation_loss ) # computes gradient, update task_model in-place
evaluation_loss = compute_loss ( task_model )
evaluation_loss . backward () # gradients w.r.t. maml.parameters()
opt . step ()LearnableOptimizer Optimizerであらゆる種類の最適化アルゴリズムを学習します。 (例とドキュメント)
linear = nn . Linear ( 784 , 10 )
transform = l2l . optim . ModuleTransform ( l2l . nn . Scale )
metaopt = l2l . optim . LearnableOptimizer ( linear , transform , lr = 0.01 ) # metaopt has .step()
opt = torch . optim . SGD ( metaopt . parameters (), lr = 0.001 ) # metaopt also has .parameters()
metaopt . zero_grad ()
opt . zero_grad ()
error = loss ( linear ( X ), y )
error . backward ()
opt . step () # update metaopt
metaopt . step () # update linear多くの標準化されたデータセット(Omniglot、Mini-/Tiered-Imagenet、FC100、CIFAR-FS)は、 learn2learn.vision.datasetsで容易に入手できます。 (ドキュメント)
dataset = l2l . data . MetaDataset ( MyDataset ()) # any PyTorch dataset
transforms = [ # Easy to define your own transform
l2l . data . transforms . NWays ( dataset , n = 5 ),
l2l . data . transforms . KShots ( dataset , k = 1 ),
l2l . data . transforms . LoadData ( dataset ),
]
taskset = Taskset ( dataset , transforms , num_tasks = 20000 )
for task in taskset :
X , y = task
# Meta-train on the task独自のメタ環境をAsyncVectorEnvと並列化するか、標準化されたものを使用します。 (ドキュメント)
def make_env ():
env = l2l . gym . HalfCheetahForwardBackwardEnv ()
env = cherry . envs . ActionSpaceScaler ( env )
return env
env = l2l . gym . AsyncVectorEnv ([ make_env for _ in range ( 16 )]) # uses 16 threads
for task_config in env . sample_tasks ( 20 ):
env . set_task ( task ) # all threads receive the same task
state = env . reset () # use standard Gym API
action = my_policy ( env )
env . step ( action )Pytorchモジュールの更新を介して学習し、区別します。 (ドキュメント)
model = MyModel ()
transform = l2l . optim . KroneckerTransform ( l2l . nn . KroneckerLinear )
learned_update = l2l . optim . ParameterUpdate ( # learnable update function
model . parameters (), transform )
clone = l2l . clone_module ( model ) # torch.clone() for nn.Modules
error = loss ( clone ( X ), y )
updates = learned_update ( # similar API as torch.autograd.grad
error ,
clone . parameters (),
create_graph = True ,
)
l2l . update_module ( clone , updates = updates )
loss ( clone ( X ), y ). backward () # Gradients w.r.t model.parameters() and learned_update.parameters() Human-Readable Changelogは、changelog.mdファイルで利用できます。
アカデミック出版物のlearn2learnリポジトリを引用するには、次のリファレンスを使用してください。
アーノルド、セバスチャンMR、プラテク・マハジャン、デバジョティ・ダッタ、イアン・バンナー、コンスタンティノス・サイタス・ザルキアス。 2020年。「Learn2Learn:メタ学習研究のライブラリ。」 arxiv [cs.lg]。 http://arxiv.org/abs/2008.12284。
次のBibtexエントリを使用することもできます。
@article { Arnold2020-ss ,
title = " learn2learn: A Library for {Meta-Learning} Research " ,
author = " Arnold, S{'e}bastien M R and Mahajan, Praateek and Datta,
Debajyoti and Bunner, Ian and Zarkias, Konstantinos Saitas " ,
month = aug,
year = 2020 ,
url = " http://arxiv.org/abs/2008.12284 " ,
archivePrefix = " arXiv " ,
primaryClass = " cs.LG " ,
eprint = " 2008.12284 "
}
nn.Moduleをサンキーにして、ステートレスにするために、Learn2learnはステートフルなPytorchのルックアンドフィールを保持します。詳細については、ARXIVペーパーを参照してください。