即使今年发生了世界上发生的一切,我们仍然有机会看到许多令人惊叹的研究。特别是在人工智能领域。更重要的是,今年强调了许多重要方面,例如道德方面,重要偏见等等。人工智能以及我们对人脑及其与AI的联系的理解正在不断发展,在未来的未来中显示出有希望的应用。
这是当年最有趣的研究论文,以防您错过任何一个。简而言之,它基本上是通过发布日期的AI和数据科学最新突破的策划列表,并具有清晰的视频说明,链接到更深入的文章和代码(如果适用)。享受阅读!
对每篇论文的完整引用在此存储库的末尾列出。
维护者-Louisfb01
订阅我的时事通讯 - AI中的最新更新每周都会解释。
?检查2021仓库!
请随时向我发送我错过的任何很棒的论文,以添加到[email protected]上。
如果您共享列表,请在Twitter @Whats_ai或LinkedIn @Lououis(What是AI)上标记我!
2020年的十大计算机视觉论文,带有视频演示,文章,代码和纸张参考。
十大计算机视觉论文2020
?如果您想支持我的工作,并使用W&B(免费)跟踪您的ML实验,并使您的工作可再现或与团队合作,则可以通过遵循本指南来尝试一下!由于这里的大多数代码都是基于Pytorch的,因此我们认为在Pytorch上使用W&B的快速启动指南将最有趣。
遵循此快速指南,在下面的代码或任何存储库中使用相同的W&B行,并在W&B帐户中自动跟踪所有实验!设置不超过5分钟,并且会像对我那样改变您的生活!如果有兴趣,这是一个更高级的指南,用于使用超参数扫描:)
?感谢Weights&Biases赞助此存储库和我一直在做的工作,并感谢您使用此链接并尝试W&B的任何人!
该第四版最近由Alexey Bochkovsky等人于2020年4月推出。在“ Yolov4:对象检测的最佳速度和准确性”中。该算法的主要目标是在准确性方面制造具有高质量的超快速对象探测器。
现在,您可以使用这种新的图像到图像翻译技术从粗糙甚至不完整的草图中产生高质量的面部图像!如果您的绘画技巧像我一样糟糕,您甚至可以调整眼睛,嘴和鼻子的程度会影响最终图像!让我们看看它是否真的有效以及他们是如何工作的。
Gamegan是一款经过50,000次PAC-MAN情节训练的生成对抗网络,生产了功能齐全的版本,该版本是Mint-Munching Classic,而无需底层游戏引擎。
这种新算法将模糊的图像转化为高分辨率图像!它可以拍摄超级低分辨率的16x16图像,并将其变成1080p的高清人脸!你不相信我吗?然后,您可以像我一样做,在不到一分钟的时间内尝试一下自己!但是首先,让我们看看他们是如何做到的。
这个新型号将代码从编程语言转换为另一种没有任何监督!它可以采用Python函数并将其转换为C ++函数,反之亦然,而没有任何先前的示例!它了解每种语言的语法,因此可以推广到任何编程语言!让我们看看他们是如何做到的。
该AI从2D图像中生成3D高分辨率重建!您只需要一个图像即可生成一个看起来像您一样的3D化身!
迪士尼的研究人员在同名论文中开发了一种新的高分辨率面部交换算法,以实现视觉效果。它能够在百像分辨率下呈现照片现实的结果。在迪士尼工作,他们当然是这项工作的最佳团队。他们的目标是在维持演员的表现的同时,从源演员那里换成目标演员的面貌。这是极具挑战性的,并且在许多情况下很有用,例如改变角色的年龄,演员没有可用时,甚至涉及特技场景,这对于主要演员来说太危险了。当前的方法需要专业人士的大量逐帧动画和后处理。
这种新技术可以改变任何图片的质地,同时使用完整的无监督培训保持现实!结果看起来比甘斯在更快的过程中所能达到的目标还要好!它甚至可以用来创造深击!
当前的最新NLP系统努力概括从事不同的任务。他们需要在数千个示例的数据集中进行微调,而人类只需要查看一些示例即可执行新的语言任务。这是GPT-3背后的目标,即提高语言模型的任务不合时宜的特征。
与当前的最新方法相比,该AI可以填充删除的移动对象后面缺失的像素,并以更准确性和更模糊的方式重建整个视频!
像Gmail中使用的那样,一个好的AI可以生成连贯的文本并完成您的短语。这个人使用相同的原理来完成图像!在无需培训的无需标签的培训中,这一切都完成了!
这个人工智能可以用您想要的卡通风格来摄取的任何图片或视频!让我们看看它是如何做到的,还有一些了不起的例子。您甚至可以像我为自己创建的网站上自己尝试!
这种面部生成模型能够将正常的面部照片转移到独特的样式中,例如Lee Mal-Nyeon的卡通风格,辛普森一家,艺术甚至狗!这项新技术最好的是,它超级简单,并且大大优于以前在gan中使用的技术。
该算法代表身体姿势和形状作为参数网格,可以从单个图像重建并易于重新构造。给定一个人的图像,他们能够以不同的姿势或从另一个输入图像获得的不同衣服创建人的合成图像。
他们的目标是从单个RGB图像提出一种针对3D人姿势和网格估计的新技术。他们称其为i2l-meshnet。其中I2L代表图像到固件。就像体积 +像素的体素一样,是三维空间中的量化单元,它们将lixel,line和Pixel定义为一维空间中的量化单元。他们的方法的表现优于以前的方法,并且代码公开可用!
https://github.com/mks0601/i2l-meshnet_release
语言指导的导航是一个广泛研究的领域,也是一个非常复杂的领域。的确,人类只是走过房子去床左侧床头柜上留下的咖啡似乎很简单。但是对于代理来说,这是另一个故事,这是一种使用深度学习来执行任务的自主AI驱动系统。
ECCV 2020最佳纸张奖获得了普林斯顿团队。他们开发了一种新的端到端可训练模型,用于光流。他们的方法击败了多个数据集中最先进的体系结构的精度,并且更有效。他们甚至为所有人都提供了代码!
使用来自互联网的游客的公开照片,他们能够重建一个场景的多个观点,以保护逼真的阴影和照明!这是对逼真的场景渲染的最先进技术的巨大进步,其结果简直令人赞叹。
想象一下,当她18岁的高清晰度零文品的旧,折叠,甚至是撕裂的照片。这称为旧照片修复,本文刚刚开辟了一条全新的途径,以深入学习方法解决了这一问题。
来自IST奥地利和麻省理工学院的研究人员已使用基于小动物的大脑(例如螺纹虫)成功地训练了自动驾驶汽车。他们实现了,与流行的深层神经网络(如发言,重新NECNET或VGG)所需的数百万个神经元相比,只有几个神经元能够控制自动驾驶汽车。他们的网络仅使用75 000个参数,由19个控制神经元组成,而不是数百万!
Adobe Research的一组研究人员开发了一种新技术,用于仅基于该人的一张图片,用于年龄转化综合。它可以从您发送的任何图片中生成寿命图片。
Deoldify是一种使旧的黑白图像甚至胶卷镜头着色和恢复的技术。它是开发的,仍然只有一个人Jason Antic的更新。现在,它是使黑白图像着色的最新方法,并且一切都是开源的,但是我们会稍微回到这一点。
顾名思义,它使用变形金刚使用视频和视频的一般描述作为输入来为视频的每个序列生成准确的文本描述。
与所有当前最新方法不同的新方法,这种图像到绘制的翻译方法使用不涉及任何GAN体系结构的新方法模拟了多种样式的真正画家!
人类垫子是一项非常有趣的任务,其目标是在图片中找到任何人并从中删除背景。由于任务的复杂性,必须找到具有完美轮廓的人,这真的很难实现。在这篇文章中,我回顾了多年来使用的最佳技术,并在2020年11月29日发布了一种新颖的方法。许多技术正在使用基本的计算机视觉算法来完成此任务,例如Grabcut算法,该算法非常快,但不是非常快,但不是非常精确。
通过NVIDIA开发的这种新培训方法,您可以培训具有十分之一图像的强大生成模型!使许多无法访问这么多图像的应用程序!
通过NVIDIA开发的这种新培训方法,您可以培训具有十分之一图像的强大生成模型!使许多无法访问这么多图像的应用程序!
这种新方法能够生成一个完整的三维场景,并能够决定场景的照明。与以前的方法相比,所有这些都具有非常有限的计算成本和惊人的结果。
?检查2021仓库!
如果您共享列表,请在Twitter @Whats_ai或LinkedIn @Lououis(What是AI)上标记我!
[1] A. Bochkovskiy,C.-Y. Wang和H.-y-liao,Yolov4:对象检测的最佳速度和准确性,2020。Arxiv:2004.10934 [CS.CV]。
[2] S.-Y. Chen,W。Su,L。Gao,S。Xia和H. Fu,“ DeepfaceDrawing:来自草图的深层脸部图像”,图形上的ACM交易(ACM Siggraph2020论文集),第1卷。 39,没有。 4,72:1–72:16,2020。
[3] SW Kim,Y。Zhou,J。Philion,A。Torralba和S. Fidler,“学习与Gamegan模拟动态环境”,在IEEE计算机视觉和模式识别会议上(CVPR),2020年6月。
[4] S. Menon,A。Damian,S。Hu,N。Ravi和C. Rudin,Pulse:通过生成模型的潜在空间探索进行自我保护的照片,2020年,Arxiv:2003.03808 [CS.CV]。
[5] M.-A。 Lachaux,B。Roziere,L。Chanussot和G. Lample,《编程语言的无监督翻译》,2020年。ARXIV:2006.03511 [CS.CL]。
[6] S. Saito,T。Simon,J。Saragih和H. Joo,PIFUHD:高分辨率3D人类数字化的多级像素平均隐式函数,2020年。Arxiv:2004.00452:2004.00452 [CS.CV]。
[7] J. Naruniec,L。Helminger,C。Schroers和R. Weber,“用于视觉效果的高分辨率神经面部扫描”,《计算机图形论坛》,第1卷。 39,第173-184页,7月2020年。DOI:10.1111/CGF.14062。
[8] T. Park,J.Y。 Zhu,O。Wang,J。Lu,E。Shechtman,AA EFROS和R. Zhang,《深层图像操纵的SwappingAutoEncoder》,2020年。Arxiv:2007.00653 [CS.CV]。
[9] TB Brown,B。Mann,N。Ryder,M。Subbiah,J。Kaplan,P。Dhariwal,A。Neelakantan,P.Shyam,G。Sastry,A。Askell,A。Askell,S。Agarwal,A。Herbert- Voss,G。Krueger,T。Henighan,R。Child,A。Ramesh,DM Ziegler,J。Wu,C。Winter,C。Hesse,M。Chen,E。 Sigler,M。Litwin,S.Gray,B。Chess,J。Clark,C。Berner,S。McCandlish,A。Radford,I。Sutskever和D. Amodei,“语言模型是很少的学习者,” 2020 。
[10] Y. Zeng,J。Fu和H. Chao,《学习视频周期片段的联合时空转换》,2020年。Arxiv:2007.10247 [CS.CV]。
[11] M. Chen,A。Radford,R。Child,J。Wu,H。Jun,D。Luan和I. Sutskever,“从像素中获得的生成预读”,第37届机器学习国际会议论文集, HD III和A. Singh编辑,Ser。机器学习研究论文集,第1卷。 119,虚拟:PMLR,13-18 Jul 2020,第1691–1703页。 [在线的]。可用:http://proceedings.mlr.press/v119/chen20s.html。
[12] Xinrui Wang和Jinze Yu,“学习使用白盒卡通表示来漫画化。”,IEEE计算机视觉和模式识别会议,2020年6月。
[13] S. Mo,M。Cho和J. Shin,冻结了歧视者:微调gans的简单基线,2020年。 ARXIV:2002.10964 [CS.CV]。
[14] K. Sarkar,D。Mehta,W。Xu,V。Golyanik和C. Theobalt,“从单个图像中对人类的神经重新渲染”,在2020年的欧洲计算机视觉会议(ECCV)中。
[15] G. Moon和Km Lee,“ I2L-MESHNET:图像到固件预测网络,用于从单个RGB图像中获得精确的3D人体姿势和网格估计的图像到固件预测网络”,欧洲计算会议(ECCV),2020年
[16] J. Krantz,E。Wijmans,A。Majumdar,D。Batra和S. Lee,“超越Nav-Graph:连续环境中的视觉和语言导航”,2020年,ARXIV:2004.02857 [CS。简历]。
[17] Z. Teed和J. Deng,Raft:光流的反复全对场转换,2020。Arxiv:2003.12039 [CS.CV]。
[18] Z. Li,W。Xian,A。Davis和N. Snavely,“群众倾斜功能”,Inproc.欧洲计算机视觉会议(ECCV),2020年。
[19] Z. Wan,B。 ]。
[20] Lechner,M.,Hasani,R.,Amini,A。等。神经电路政策实现可审核的自主权。 Nat Mach Intell 2,642–652(2020)。 https://doi.org/10.1038/s42256-020-00237-3
[21] R. Or-el,S。Sengupta,O。Fried,E。Shechtman和I. Kemelmacher-Shlizerman,“欧洲计算机视觉会议(ECCV)论文集,“寿命转化合成”,2020年。
[22] Deoldify的创建者Jason Antic,https://github.com/jantic/deoldify
[23] S. Ging,M。Zolfaghari,H。Pirsiavash和T. Brox,“ Coot:视频文本表示学习的合作层次跨形式”,《神经信息过程会议》,2020年。
[24] Z. Zo.
[25] Arxiv,卷。 ABS/2011.11961,2020。
[26] T. Karras,M。Aittala,J。Hellsten,S。Laine,J。Lehtinen和T. Aila,培训生成的对抗网络,具有有限的数据,2020年。ARXIV:2006.06676 [CS.CV]。
[27] Ja Weyn,Durran博士和R. Caruana,“使用立方体上的深卷积神经网络改善数据驱动的全球天气预测”,《地球系统建模的进步杂志》,第1卷。 12,不。 2020年9月9日,ISSN:1942–2466.DOI:10.1029/2020MS002109
[28] PP Srinivasan,B。Deng,X. Zhang,M。Tancik,B。Mildenhall和JT Barron,“神经:用于重新获得和查看合成的神经反射率和可见性领域”,《 Arxiv》,2020年,2020年。