solo learn下载 - solo learn源代码下载

solo learn

Python

1.0.8

下载

独奏学习

由Pytorch Lightning提供支持的无监督视觉表示的自我监督方法的库。我们旨在在可比的环境中提供SOTA自学方法，同时实施培训技巧。该库是独立的，但是可以使用独奏学习的模型。我们的论文中的更多详细信息。

消息

[2024年1月14日] ：？ 2023年期间的一堆稳定性改进也添加了All4One。
[2023年1月7日] ：？在ImageNet上添加了MAE的结果，检查点和配置。感谢黄金。
[2022年12月31日] ：？闪亮的新徽标！非常感谢路易斯！
[2022年9月27日] ：使用Omegaconf/Hydra的全新配置系统。增加了更清晰和灵活性。新教程将很快跟随！
[8月4日2022] ：？添加了MAE，并支持使用main_linear.py ，Mixup，cutmix和随机增强的骨干。
[2022年7月13日] ：？增加了对H5数据，改进的脚本和数据处理的支持。
[2022年6月26日] ：添加了Moco V3。
[2022年6月10日] ：？改善了拉尔斯。
[2022年6月9日] ：？添加了对WideSnet的支持，SWAV的多功能和均等数据增强。
[5月2日2022] ：？将DALI与数据座包装，添加了用于线性评估的自动简历和WANDB运行简历。
[2022年4月12日] ：？改进了模型的设计，并增加了对培训的支持，并用一小部分数据进行培训。
[4月1日2022] ：？添加了使用频道最后转换的选项，该转换大大减少了训练时间。
[2022年2月4日] ：？纸被JMLR接受了。
[2022年1月31日] ：？加上timm的Convnext支持。
[2021年12月20日] ：？添加了MOCO V2+的Imagenet结果，脚本和检查点。
[DEC 05 2021] ：？与SIMCLR分开的SUPCON并添加了运行。
[DEC 01 2021] ：⛲添加了池形成器。
[2021年11月29日] ： ‼️打破变化！更新您的版本！！！
[2021年11月29日] ：新教程！
[2021年11月29日] ：？添加了离线K-NN和离线UMAP。
[2021年11月29日] ：更新了Pytorch和Pytorch Lightning版本。 10％更快。
[2021年11月29日] ：？添加了行为守则，贡献说明，问题模板和UMAP教程。
[2021年11月23日] ：？添加了Vibcreg。
[2021年10月21日] ：？通过检测V2和自动简历功能添加了对对象识别的支持，该功能会自动尝试恢复撞车/到达超时的实验。
[2021年10月10日] ：？重组的增强管道，以允许更大的灵活性和多功能。还为BYOL添加了多功能。
[2021年9月27日] ：？添加了NNSIAM，NNBYOL，用于实施新方法1和2的新教程，并通过自定义数据和线性评估进行了更多测试和固定问题。
[2021年9月19日] ：？在线添加了K-NN评估。
[2021年9月17日] ：？增加了vit和swin。
[2021年9月13日] ：改进了文档和添加的教程，用于训练和离线线性评估。
[2021年8月13日] ：？ DeepCluster V2现在可用。

路线图和帮助

重做文档以提高清晰度。
更好和最新的教程。
添加与性能相关的测试，以确保方法在更新中执行相同的操作。
添加新方法（持续努力）。

可用的方法

ALL4ONE
巴洛双胞胎
BYOL
DeepCluster V2
恐龙
梅
moco v2+
Moco V3
nnbyol
nnclr
nnsiam
Ressl
simclr
Simsiam
监督对比学习
沃夫
Vibcreg
Vicreg
W-MSE

额外的风味

骨干

重新连接
宽带
VIT
斯文
泳池形式
Consnext

数据

使用Nvidia dali提高了数据处理速度高达100％。
灵活的增强。

评估

通过定型梯度进行在线线性评估，以更容易调试和原型制作（也可选可用于动量主链）。
标准离线线性评估。
在线和离线K-NN评估。
自动特征空间可视化使用UMAP。

训练技巧

Pytorch Lightning的所有津贴（混合精度，梯度积累，剪裁等等）。
频道最后转换
SWAV之后的多编写数据编写：
- 注意：目前，只有SIMCLR，BYOL和SWAV支持这一点。
排除重量衰变和lars的偏见和偏见。
没有用于投影头的LR调度程序（如Simsiam中）。

记录

用挥手在云上登录公制
使用简单的文件组织进行自定义模型检查点。

要求

火炬
火炬
TQDM
Einops
Wandb
pytorch灯
闪电
火炬手
Scipy
蒂姆

选修的：

nvidia-dali
matplotlib
海洋
熊猫
UMAP-LEARN

安装

首先克隆回购。

然后，要使用Dali和/或UMAP支持安装独奏学习，请使用：

pip3 install .[dali,umap,h5] --extra-index-url https://developer.download.nvidia.com/compute/redist

如果不需要DALI/UMAP/H5支持，则可以将存储库安装为：

pip3 install .

用于本地发展：

pip3 install -e .[umap,h5]
# Make sure you have pre-commit hooks installed
pre-commit install

注意：如果您在Dali方面遇到麻烦，请按照其指南进行安装。

注意2：考虑不使用DALI时安装枕头-SIMD以更好地加载时间。

注3：即将上水。

训练

要预处理主干，请按照scripts/pretrain/的众多bash文件之一。我们现在正在使用Hydra来处理配置文件，因此通用语法类似于：

python3 main_pretrain.py 
    # path to training script folder
    --config-path scripts/pretrain/imagenet-100/ 
    # training config name
    --config-name barlow.yaml
    # add new arguments (e.g. those not defined in the yaml files)
    # by doing ++new_argument=VALUE
    # pytorch lightning's arguments can be added here as well.

之后，对于离线线性评估，请按照scripts/linear或scripts/finetune的示例进行列表，以列出整个骨干。

为了进行K-NN评估和UMAP可视化检查scripts/{knn,umap}中的脚本。

注意：文件尝试保持最新状态，并尽可能仔细地遵循每篇论文的推荐参数，但在运行前检查它们。

教程

请查看我们的文档和教程：

概述
离线线性评估
对象检测
添加一种新方法
添加一种新的动量方法
用UMAP可视化功能
离线K-NN

如果您想为独奏学习做出贡献，请确保您了解如何做出贡献和遵守行为准则

模型动物园

可以通过以下表直接下载所有预估计的模型，也可以通过运行以下脚本之一zoo/cifar10.sh ， zoo/cifar100.sh ， zoo/imagenet100.sh和zoo/imagenet.sh来直接下载。

结果

注意：超参数可能不是最好的，我们将最终以较低的性能重新运行。

CIFAR-10

方法	骨干	时代	ACC@1	ACC@5	检查点
ALL4ONE	RESNET18	1000	93.24	99.88	？
巴洛双胞胎	RESNET18	1000	92.10	99.73	？
BYOL	RESNET18	1000	92.58	99.79	？
DeepCluster V2	RESNET18	1000	88.85	99.58	？
恐龙	RESNET18	1000	89.52	99.71	？
moco v2+	RESNET18	1000	92.94	99.79	？
Moco V3	RESNET18	1000	93.10	99.80	？
nnclr	RESNET18	1000	91.88	99.78	？
Ressl	RESNET18	1000	90.63	99.62	？
simclr	RESNET18	1000	90.74	99.75	？
Simsiam	RESNET18	1000	90.51	99.72	？
supcon	RESNET18	1000	93.82	99.65	？
沃夫	RESNET18	1000	89.17	99.68	？
Vibcreg	RESNET18	1000	91.18	99.74	？
Vicreg	RESNET18	1000	92.07	99.74	？
W-MSE	RESNET18	1000	88.67	99.68	？

CIFAR-100

方法	骨干	时代	ACC@1	ACC@5	检查点
ALL4ONE	RESNET18	1000	72.17	93.35	？
巴洛双胞胎	RESNET18	1000	70.90	91.91	？
BYOL	RESNET18	1000	70.46	91.96	？
DeepCluster V2	RESNET18	1000	63.61	88.09	？
恐龙	RESNET18	1000	66.76	90.34	？
moco v2+	RESNET18	1000	69.89	91.65	？
Moco V3	RESNET18	1000	68.83	90.57	？
nnclr	RESNET18	1000	69.62	91.52	？
Ressl	RESNET18	1000	65.92	89.73	？
simclr	RESNET18	1000	65.78	89.04	？
Simsiam	RESNET18	1000	66.04	89.62	？
supcon	RESNET18	1000	70.38	89.57	？
沃夫	RESNET18	1000	64.88	88.78	？
Vibcreg	RESNET18	1000	67.37	90.07	？
Vicreg	RESNET18	1000	68.54	90.83	？
W-MSE	RESNET18	1000	61.33	87.26	？

Imagenet-100

方法	骨干	时代	达利	ACC@1（在线）	ACC@1（离线）	ACC@5（在线）	ACC@5（离线）	检查点
ALL4ONE	RESNET18	400	✔️	81.93	-	96.23	-	？
巴洛双胞胎	RESNET18	400	✔️	80.38	80.16	95.28	95.14	？
BYOL	RESNET18	400	✔️	80.16	80.32	95.02	94.94	？
DeepCluster V2	RESNET18	400		75.36	75.4	93.22	93.10	？
恐龙	RESNET18	400	✔️	74.84	74.92	92.92	92.78	？
恐龙？	vit小	400		63.04	托多	87.72	托多	？
moco v2+	RESNET18	400	✔️	78.20	79.28	95.50	95.18	？
Moco V3	RESNET18	400	✔️	80.36	80.36	95.18	94.96	？
Moco V3	RESNET50	400	✔️	85.48	84.58	96.82	96.70	？
nnclr	RESNET18	400	✔️	79.80	80.16	95.28	95.30	？
Ressl	RESNET18	400	✔️	76.92	78.48	94.20	94.24	？
simclr	RESNET18	400	✔️	77.64	托多	94.06	托多	？
Simsiam	RESNET18	400	✔️	74.54	78.72	93.16	94.78	？
supcon	RESNET18	400	✔️	84.40	托多	95.72	托多	？
沃夫	RESNET18	400	✔️	74.04	74.28	92.70	92.84	？
Vibcreg	RESNET18	400	✔️	79.86	79.38	94.98	94.60	？
Vicreg	RESNET18	400	✔️	79.22	79.40	95.06	95.02	？
W-MSE	RESNET18	400	✔️	67.60	69.06	90.94	91.22	？

高参数进行了大量调节的方法。

？ VIT是非常强大且不稳定的，因此我们正在慢慢运行更大的架构，并且批量较大。 ATM，总批量大小为128，我们需要使用Float32精度。如果您想通过运行来做出贡献，请告诉我们！

成像网

方法	骨干	时代	达利	ACC@1（在线）	ACC@1（离线）	ACC@5（在线）	ACC@5（离线）	检查点	固定检查点
巴洛双胞胎	RESNET50	100	✔️	67.18	67.23	87.69	87.98	？
BYOL	RESNET50	100	✔️	68.63	68.37	88.80	88.66	？
moco v2+	RESNET50	100	✔️	62.61	66.84	85.40	87.60	？
梅	VIT-B/16	100		〜	81.60（填充）	〜	95.50（填充）	？	？

达利的培训效率

我们在具有Intel i9-9820x和两个RTX2080TI的服务器中使用RESNET18报告了某些方法的训练效率。

方法	达利	20个时期的总时间	1个时期的时间	GPU内存（PER GPU）
巴洛双胞胎		1H 38m 27s	4m 55s	5097 MB
	✔️	43m 2s	2m 10s（快56％）	9292 MB
BYOL		1h 38m 46s	4m 56s	5409 MB
	✔️	50m 33s	2M 31S（快49％）	9521 MB
nnclr		1H 38M 30S	4m 55s	5060 mb
	✔️	42m 3s	2m 6s（快64％）	9244 MB

注意：GPU内存的增加不会随着模型而扩展，而是随着工人的数量而缩放。

引用

如果您使用独奏学习，请引用我们的论文：

 @article { JMLR:v23:21-1155 ,
  author  = { Victor Guilherme Turrisi da Costa and Enrico Fini and Moin Nabi and Nicu Sebe and Elisa Ricci } ,
  title   = { solo-learn: A Library of Self-supervised Methods for Visual Representation Learning } ,
  journal = { Journal of Machine Learning Research } ,
  year    = { 2022 } ,
  volume  = { 23 } ,
  number  = { 56 } ,
  pages   = { 1-6 } ,
  url     = { http://jmlr.org/papers/v23/21-1155.html }
}