แม้จะมีทุกสิ่งที่เกิดขึ้นในโลกในปีนี้เราก็ยังมีโอกาสได้เห็นการวิจัยที่น่าทึ่งมากมายออกมา โดยเฉพาะอย่างยิ่งในด้านปัญญาประดิษฐ์ ยิ่งไปกว่านั้นมีการเน้นประเด็นสำคัญมากมายในปีนี้เช่นด้านจริยธรรมอคติที่สำคัญและอีกมากมาย ปัญญาประดิษฐ์และความเข้าใจของเราเกี่ยวกับสมองมนุษย์และการเชื่อมโยงไปยัง AI นั้นมีการพัฒนาอย่างต่อเนื่องแสดงให้เห็นถึงการใช้งานที่มีแนวโน้มในอนาคตในไม่ช้า
นี่คือเอกสารการวิจัยที่น่าสนใจที่สุดแห่งปีในกรณีที่คุณพลาดสิ่งใด ๆ กล่าวโดยย่อคือรายการที่รวบรวมไว้ของความก้าวหน้าล่าสุดใน AI และวิทยาศาสตร์ข้อมูลโดยวันที่วางจำหน่ายพร้อมคำอธิบายวิดีโอที่ชัดเจนลิงก์ไปยังบทความเชิงลึกเพิ่มเติมและรหัส (ถ้ามี) สนุกกับการอ่าน!
การอ้างอิงที่สมบูรณ์ของแต่ละกระดาษมีการระบุไว้ในตอนท้ายของที่เก็บนี้
ผู้ดูแล - louisfb01
สมัครรับจดหมายข่าวของฉัน - การอัปเดตล่าสุดใน AI อธิบายทุกสัปดาห์
- ตรวจสอบ 2021 repo!
อย่าลังเลที่จะส่งข้อความถึงเอกสารดีๆที่ฉันพลาดไปในที่เก็บนี้บน [email protected]
แท็กฉันบน Twitter @whats_ai หรือ LinkedIn @louis (AI คืออะไร) Bouchard ถ้าคุณแชร์รายการ!
เอกสารการมองเห็นคอมพิวเตอร์ 10 อันดับแรกในปี 2020 พร้อมการสาธิตวิดีโอบทความรหัสและการอ้างอิงกระดาษ
10 อันดับแรกของคอมพิวเตอร์ Vision Papers 2020
- หากคุณต้องการสนับสนุนงานของฉัน และใช้ W&B (ฟรี) เพื่อติดตามการทดลอง ML ของคุณและทำให้งานของคุณทำซ้ำหรือทำงานร่วมกับทีมคุณสามารถลองใช้งานได้โดยทำตามคำแนะนำนี้! เนื่องจากรหัสส่วนใหญ่ที่นี่เป็นแบบ Pytorch เราจึงคิดว่าคู่มือ QuickStart สำหรับการใช้ W&B บน Pytorch น่าสนใจที่สุดที่จะแบ่งปัน
ทำตามคู่มือด่วนนี้ใช้บรรทัด W&B เดียวกันในรหัสของคุณหรือ repos ใด ๆ ด้านล่างและให้การทดลองทั้งหมดของคุณติดตามโดยอัตโนมัติในบัญชี W&B ของคุณ! ใช้เวลาไม่เกิน 5 นาทีในการตั้งค่าและจะเปลี่ยนชีวิตของคุณอย่างที่ทำเพื่อฉัน! นี่คือคู่มือขั้นสูงสำหรับการใช้การกวาดแบบไฮเปอร์พารามิเตอร์หากสนใจ :)
- ขอบคุณน้ำหนักและอคติสำหรับการสนับสนุนที่เก็บนี้และงานที่ฉันทำและขอบคุณทุกคนที่ใช้ลิงค์นี้และลองใช้ W & B!
รุ่นที่ 4 นี้เพิ่งเปิดตัวเมื่อเร็ว ๆ นี้ในเดือนเมษายน 2563 โดย Alexey Bochkovsky และคณะ ในกระดาษ "YOLOV4: ความเร็วที่ดีที่สุดและความแม่นยำของการตรวจจับวัตถุ" เป้าหมายหลักของอัลกอริทึมนี้คือการสร้างเครื่องตรวจจับวัตถุที่รวดเร็วเป็นพิเศษที่มีคุณภาพสูงในแง่ของความแม่นยำ
ตอนนี้คุณสามารถสร้างภาพใบหน้าที่มีคุณภาพสูงจากภาพร่างที่หยาบหรือไม่สมบูรณ์พร้อมทักษะการวาดภาพศูนย์โดยใช้เทคนิคการแปลภาพเป็นภาพใหม่นี้! หากทักษะการวาดภาพของคุณไม่ดีเท่าของฉันคุณสามารถปรับได้ว่าดวงตาปากและจมูกจะส่งผลกระทบต่อภาพสุดท้าย! มาดูกันว่ามันใช้งานได้จริงหรือไม่และพวกเขาทำอย่างไร
Gamegan ซึ่งเป็นเครือข่ายฝ่ายตรงข้ามที่ได้รับการฝึกฝนเกี่ยวกับ 50,000 Pac-Man ตอนสร้างเวอร์ชันที่ใช้งานได้อย่างสมบูรณ์ของ Dot-Munching Classic โดยไม่ต้องใช้เครื่องมือเกมพื้นฐาน
อัลกอริทึมใหม่นี้แปลงภาพที่เบลอเป็นภาพความละเอียดสูง! มันสามารถใช้ภาพ 16x16 ความละเอียดต่ำสุด ๆ และเปลี่ยนเป็นใบหน้าของมนุษย์ที่มีความละเอียดสูง 1080p! คุณไม่เชื่อฉัน? จากนั้นคุณสามารถทำเหมือนฉันและลองด้วยตัวเองในเวลาไม่ถึงหนึ่งนาที! แต่ก่อนอื่นมาดูกันว่าพวกเขาทำอย่างนั้นได้อย่างไร
โมเดลใหม่นี้แปลงรหัสจากภาษาการเขียนโปรแกรมไปยังอีกโดยไม่มีการกำกับดูแลใด ๆ ! มันสามารถใช้ฟังก์ชั่น Python และแปลเป็นฟังก์ชัน C ++ และในทางกลับกันโดยไม่มีตัวอย่างก่อนหน้านี้! มันเข้าใจไวยากรณ์ของแต่ละภาษาและสามารถพูดคุยกับภาษาการเขียนโปรแกรมใด ๆ ! มาดูกันว่าพวกเขาทำอย่างนั้นได้อย่างไร
AI นี้สร้างการสร้างความละเอียดสูง 3 มิติของผู้คนจากภาพ 2D! มันต้องการเพียงภาพเดียวของคุณในการสร้างอวตาร 3 มิติที่ดูเหมือนคุณแม้แต่จากด้านหลัง!
นักวิจัยที่ดิสนีย์ได้พัฒนาอัลกอริทึมการสลับหน้าความละเอียดสูงใหม่สำหรับเอฟเฟกต์ภาพในกระดาษที่มีชื่อเดียวกัน มันมีความสามารถในการเรนเดอร์ผลลัพธ์ความสมจริงที่ความละเอียดของ megapixel การทำงานให้กับดิสนีย์พวกเขาเป็นทีมที่ดีที่สุดสำหรับงานนี้อย่างแน่นอน เป้าหมายของพวกเขาคือการแลกเปลี่ยนใบหน้าของนักแสดงเป้าหมายจากนักแสดงแหล่งข่าวในขณะที่ยังคงรักษาประสิทธิภาพของนักแสดง นี่เป็นสิ่งที่ท้าทายอย่างไม่น่าเชื่อและมีประโยชน์ในหลาย ๆ สถานการณ์เช่นการเปลี่ยนอายุของตัวละครเมื่อนักแสดงไม่พร้อมใช้งานหรือแม้กระทั่งเมื่อมันเกี่ยวข้องกับฉากการแสดงความสามารถที่อันตรายเกินไปสำหรับนักแสดงหลักที่จะแสดง วิธีการปัจจุบันต้องการภาพเคลื่อนไหวแบบเฟรมต่อเฟรมจำนวนมากและการโพสต์โดยผู้เชี่ยวชาญ
เทคนิคใหม่นี้สามารถเปลี่ยนพื้นผิวของภาพใด ๆ ในขณะที่ยังคงเป็นจริงโดยใช้การฝึกอบรมที่ไม่ได้รับการดูแลอย่างสมบูรณ์! ผลลัพธ์ดูดียิ่งกว่าสิ่งที่ Gans สามารถทำได้ในขณะที่เร็วขึ้น! มันสามารถใช้ในการสร้าง deepfakes!
ระบบ NLP ที่ทันสมัยในปัจจุบันพยายามที่จะพูดคุยกับงานที่แตกต่างกัน พวกเขาจำเป็นต้องได้รับการปรับแต่งในชุดข้อมูลของตัวอย่างหลายพันตัวอย่างในขณะที่มนุษย์จำเป็นต้องเห็นตัวอย่างเล็ก ๆ น้อย ๆ เพื่อทำงานภาษาใหม่ นี่คือเป้าหมายที่อยู่เบื้องหลัง GPT-3 เพื่อปรับปรุงลักษณะงานที่ไม่เชื่อเรื่องพระเจ้าของแบบจำลองภาษา
AI นี้สามารถเติมพิกเซลที่ขาดหายไปด้านหลังวัตถุที่เคลื่อนย้ายที่ถูกลบออกและสร้างวิดีโอทั้งหมดด้วยวิธีที่แม่นยำยิ่งขึ้นและความพร่ามัวน้อยกว่าวิธีการที่ทันสมัยในปัจจุบัน!
AI ที่ดีเช่นเดียวกับที่ใช้ใน Gmail สามารถสร้างข้อความที่สอดคล้องกันและจบวลีของคุณ อันนี้ใช้หลักการเดียวกันเพื่อให้ภาพสมบูรณ์! ทั้งหมดทำในการฝึกอบรมที่ไม่ได้รับการดูแลโดยไม่มีป้ายกำกับเลย!
AI นี้สามารถการ์ตูนรูปภาพหรือวิดีโอใด ๆ ที่คุณป้อนในสไตล์การ์ตูนที่คุณต้องการ! มาดูกันว่ามันเป็นอย่างไรและเป็นตัวอย่างที่น่าทึ่ง คุณสามารถลองด้วยตัวเองบนเว็บไซต์ที่พวกเขาสร้างขึ้นมาเพื่อตัวเอง!
รูปแบบการสร้างใบหน้านี้สามารถถ่ายโอนภาพถ่ายใบหน้าปกติไปสู่สไตล์ที่โดดเด่นเช่นสไตล์การ์ตูนของ Lee Mal-Nyeon, The Simpsons, ศิลปะและแม้แต่สุนัข! สิ่งที่ดีที่สุดเกี่ยวกับเทคนิคใหม่นี้คือมันง่ายมากและมีประสิทธิภาพสูงกว่าเทคนิคก่อนหน้านี้ที่ใช้ใน Gans
อัลกอริทึมแสดงถึงท่าทางและรูปร่างเป็นตาข่ายพารามิเตอร์ซึ่งสามารถสร้างขึ้นใหม่จากภาพเดียวและใช้งานได้ง่าย ด้วยภาพของบุคคลพวกเขาสามารถสร้างภาพสังเคราะห์ของบุคคลในโพสท่าที่แตกต่างกันหรือด้วยเสื้อผ้าที่แตกต่างกันที่ได้จากภาพอินพุตอื่น
เป้าหมายของพวกเขาคือการเสนอเทคนิคใหม่สำหรับการโพสต์มนุษย์ 3 มิติและการประมาณตาข่ายจากภาพ RGB เดียว พวกเขาเรียกมันว่า i2l-meshnet ที่ I2L ย่อมาจาก Image-to-Lixel เช่นเดียวกับ voxel ปริมาตร + พิกเซลเป็นเซลล์เชิงปริมาณในพื้นที่สามมิติพวกเขากำหนด lixel เส้นและพิกเซลเป็นเซลล์เชิงปริมาณในพื้นที่หนึ่งมิติ วิธีการของพวกเขาดีกว่าวิธีการก่อนหน้านี้และรหัสเปิดเผยต่อสาธารณะ!
https://github.com/mks0601/i2l-meshnet_release
การนำทางภาษานำทางเป็นสาขาที่ศึกษากันอย่างแพร่หลายและมีความซับซ้อนมาก อันที่จริงมันอาจดูง่ายสำหรับมนุษย์ที่จะเดินผ่านบ้านเพื่อไปดื่มกาแฟที่คุณทิ้งไว้บนโต๊ะข้างเตียงไปทางซ้ายของเตียง แต่มันเป็นเรื่องอื่นทั้งหมดสำหรับตัวแทนซึ่งเป็นระบบ AI ที่ขับเคลื่อนด้วยตนเองโดยใช้การเรียนรู้อย่างลึกซึ้งเพื่อทำงาน
ECCV 2020 Award Best Paper Award ไปที่ Princeton Team พวกเขาพัฒนารูปแบบการฝึกอบรมแบบ end-to-end ใหม่สำหรับการไหลของแสง วิธีการของพวกเขาได้รับความแม่นยำของสถาปัตยกรรมที่ทันสมัยในชุดข้อมูลหลายชุดและมีประสิทธิภาพมากขึ้น พวกเขายังทำให้รหัสพร้อมใช้งานสำหรับทุกคนใน GitHub ของพวกเขา!
ด้วยการใช้ภาพถ่ายสาธารณะของนักท่องเที่ยวจากอินเทอร์เน็ตพวกเขาสามารถสร้างจุดชมวิวหลายมุมมองของฉากที่อนุรักษ์เงาและแสงสว่างที่สมจริง! นี่คือความก้าวหน้าครั้งใหญ่ของเทคนิคที่ทันสมัยสำหรับการแสดงฉากฉากแสงและผลลัพธ์ของพวกเขานั้นยอดเยี่ยมมาก
ลองนึกภาพว่ามีภาพเก่าที่พับเก็บและฉีกขาดของคุณยายของคุณเมื่อเธออายุ 18 ปีในความละเอียดสูงโดยไม่มีสิ่งประดิษฐ์เป็นศูนย์ สิ่งนี้เรียกว่าการฟื้นฟูภาพถ่ายเก่าและบทความนี้เพิ่งเปิดถนนใหม่ทั้งหมดเพื่อแก้ไขปัญหานี้โดยใช้วิธีการเรียนรู้อย่างลึกซึ้ง
นักวิจัยจาก Ist Austria และ MIT ได้ฝึกอบรมรถยนต์ที่ขับเคลื่อนด้วยตนเองโดยใช้ระบบปัญญาประดิษฐ์ใหม่บนพื้นฐานของสมองของสัตว์เล็ก ๆ เช่นไส้เดือนด้าย พวกเขาประสบความสำเร็จด้วยเซลล์ประสาทเพียงไม่กี่เซลล์ที่สามารถควบคุมรถยนต์ขับเคลื่อนด้วยตนเองได้เมื่อเทียบกับเซลล์ประสาทหลายล้านเซลล์ที่ต้องการโดยเครือข่ายประสาทลึกที่เป็นที่นิยมเช่น Inceptions, Resnets หรือ VGG เครือข่ายของพวกเขาสามารถควบคุมรถยนต์ได้อย่างสมบูรณ์โดยใช้พารามิเตอร์เพียง 75,000 ตัวซึ่งประกอบด้วยเซลล์ประสาทควบคุม 19 เซลล์แทนที่จะเป็นล้าน!
ทีมนักวิจัยจาก Adobe Research พัฒนาเทคนิคใหม่สำหรับการสังเคราะห์การเปลี่ยนแปลงอายุโดยใช้ภาพเดียวจากบุคคลเท่านั้น มันสามารถสร้างภาพอายุการใช้งานจากภาพใด ๆ ที่คุณส่ง
Deoldify เป็นเทคนิคในการระบายสีและคืนค่าภาพขาวดำเก่าหรือแม้กระทั่งภาพภาพยนตร์ มันได้รับการพัฒนาและยังคงได้รับการอัปเดตโดย Jason Antic เพียงคนเดียว ตอนนี้มันเป็นวิธีที่ทันสมัยในการระบายสีภาพขาวดำและทุกอย่างเปิดกว้าง แต่เราจะกลับไปที่สิ่งนี้อีกสักหน่อย
ตามที่ระบุชื่อจะใช้ Transformers เพื่อสร้างคำอธิบายข้อความที่ถูกต้องสำหรับแต่ละลำดับของวิดีโอโดยใช้ทั้งวิดีโอและคำอธิบายทั่วไปของมันเป็นอินพุต
วิธีการแปลภาพเป็นภาพวาดนี้จำลองจิตรกรตัวจริงในหลายรูปแบบโดยใช้วิธีการใหม่ที่ไม่เกี่ยวข้องกับสถาปัตยกรรม GAN ใด ๆ ซึ่งแตกต่างจากวิธีการที่ทันสมัยในปัจจุบัน!
การปูของมนุษย์เป็นงานที่น่าสนใจอย่างยิ่งที่เป้าหมายคือการหามนุษย์ในรูปภาพและลบพื้นหลังออกจากมัน มันยากมากที่จะบรรลุผลเนื่องจากความซับซ้อนของงานต้องหาคนหรือคนที่มีรูปร่างที่สมบูรณ์แบบ ในโพสต์นี้ฉันตรวจสอบเทคนิคที่ดีที่สุดที่ใช้ในช่วงหลายปีที่ผ่านมาและวิธีการใหม่ที่ตีพิมพ์เมื่อวันที่ 29 พฤศจิกายน 2563 เทคนิคต่าง ๆ ใช้อัลกอริทึมการมองเห็นคอมพิวเตอร์ขั้นพื้นฐานเพื่อให้บรรลุงานนี้เช่นอัลกอริทึม Grabcut ซึ่งเร็วมาก แต่ไม่มาก แม่นยำมาก
ด้วยวิธีการฝึกอบรมใหม่ที่พัฒนาโดย NVIDIA คุณสามารถฝึกอบรมแบบจำลองที่ทรงพลังด้วยภาพหนึ่งในสิบ! ทำให้แอปพลิเคชันจำนวนมากเป็นไปได้ที่ไม่สามารถเข้าถึงภาพได้มากมาย!
ด้วยวิธีการฝึกอบรมใหม่ที่พัฒนาโดย NVIDIA คุณสามารถฝึกอบรมแบบจำลองที่ทรงพลังด้วยภาพหนึ่งในสิบ! ทำให้แอปพลิเคชันจำนวนมากเป็นไปได้ที่ไม่สามารถเข้าถึงภาพได้มากมาย!
วิธีใหม่นี้สามารถสร้างฉาก 3 มิติที่สมบูรณ์และมีความสามารถในการตัดสินใจแสงของฉาก ทั้งหมดนี้มีค่าใช้จ่ายในการคำนวณที่ จำกัด และผลลัพธ์ที่น่าทึ่งเมื่อเทียบกับวิธีการก่อนหน้านี้
- ตรวจสอบ 2021 repo!
แท็กฉันบน Twitter @whats_ai หรือ LinkedIn @louis (AI คืออะไร) Bouchard ถ้าคุณแชร์รายการ!
[1] A. Bochkovskiy, C.-Y. วังและ H.-ym Liao, YOLOV4: ความเร็วที่ดีที่สุดและความแม่นยำของการตรวจจับวัตถุ, 2020. Arxiv: 2004.10934 [CS.CV]
[2] S.-Y. Chen, W. Su, L. Gao, S. Xia และ H. Fu, "Deepfacedrawing: ภาพใบหน้าที่ลึกล้ำจากภาพร่าง" ธุรกรรม ACM เกี่ยวกับกราฟิก (การดำเนินการของ ACM SIGGRAPH2020), ฉบับที่ 39, no. 4, 72: 1–72: 16, 2020
[3] SW Kim, Y. Zhou, J. Philion, A. Torralba และ S. Fidler, "เรียนรู้ที่จะจำลองสภาพแวดล้อมแบบไดนามิกกับ Gamegan" ในการประชุม IEEE เกี่ยวกับการมองเห็นและการจดจำรูปแบบคอมพิวเตอร์ (CVPR), มิ.ย. 2020
[4] S. Menon, A. Damian, S. Hu, N. Ravi, และ C. Rudin, Pulse: การถ่ายภาพด้วยตนเองโดยการสำรวจอวกาศแฝงของแบบจำลองการกำเนิด, 2020. Arxiv: 2003.03808 [CS.CV]
[5] M.-A. Lachaux, B. Roziere, L. Chanussot และ G. Lample, การแปลภาษาการเขียนโปรแกรมที่ไม่ได้รับการดูแล, 2020. Arxiv: 2006.03511 [CS.CL]
[6] S. Saito, T. Simon, J. Saragih และ H. Joo, Pifuhd: ฟังก์ชั่นโดยนัยที่มีพิกเซลหลายระดับสำหรับการแปลงเป็นดิจิทัลมนุษย์ 3D ความละเอียดสูง, 2020. Arxiv: 2004.00452 [CS.CV]
[7] J. Naruniec, L. Helminger, C. Schroers และ R. Weber, "การแลกเปลี่ยนใบหน้าประสาทความละเอียดสูงสำหรับเอฟเฟกต์ภาพ," ฟอรัมคอมพิวเตอร์กราฟิก, ฉบับที่ 39, pp. 173–184, Jul. 2020.doi: 10.1111/cgf.14062
[8] T. Park, J.-Y. Zhu, O. Wang, J. Lu, E. Shechtman, AA Efros และ R. Zhang, Swappingautoencoder สำหรับการจัดการภาพลึก, 2020. Arxiv: 2007.00653 [CS.CV]
[9] TB Brown, B. Mann, N. Ryder, M. Subbiah, J. Kaplan, P. Dhariwal, A. Neelakantan, P.Shyam, G. Sastry, A. Askell, S. Agarwal, A. Herbert- Voss, G. Krueger, T. Henighan, R. Child, A. Ramesh, DM Ziegler, J. Wu, C. Winter, C. Hesse, M. Chen, E. Sigler, M. Litwin, S.Gray, B. Chess, J. Clark, C. Berner, S. McCandlish, A. Radford, I. Sutskever และ D. Amodei, "โมเดลภาษาเป็นผู้เรียนไม่กี่คน" 2020 . arxiv: 2005.14165 [CS.CL]
[10] Y. Zeng, J. Fu, และ H. Chao, การเรียนรู้การเปลี่ยนแปลงเชิงพื้นที่ร่วมกับการเปลี่ยนแปลงสำหรับวิดีโอในภาพวาด, 2020. Arxiv: 2007.10247 [CS.CV]
[11] M. Chen, A. Radford, R. Child, J. Wu, H. Jun, D. Luan, และ I. Sutskever, "การเตรียมการจากพิกเซล" ในการประชุมนานาชาติครั้งที่ 37 เรื่องการเรียนรู้ของเครื่องจักร HD III และ A. Singh, eds., Ser. การดำเนินการวิจัยการเรียนรู้ของเครื่อง 119, เสมือนจริง: PMLR, 13–18 ก.ค. 2020, pp. 1691–1703 [ออนไลน์]. พร้อมใช้งาน: http: //proceedings.mlr.press/v119/chen20s.html
[12] Xinrui Wang และ Jinze Yu, "เรียนรู้ที่จะทำการ์ตูนโดยใช้การเป็นตัวแทนการ์ตูนกล่องสีขาว", การประชุม IEEE เกี่ยวกับการมองเห็นคอมพิวเตอร์และการจดจำรูปแบบ, มิถุนายน 2020
[13] S. Mo, M. Cho, และ J. Shin, แช่แข็ง discriminator: พื้นฐานที่เรียบง่ายสำหรับการปรับแต่ง Gans, 2020 Arxiv: 2002.10964 [CS.CV]
[14] K. Sarkar, D. Mehta, W. Xu, V. Golyanik และ C. Theobalt, "การแสดงผลของมนุษย์ใหม่จากภาพเดียว" ในการประชุมยุโรปเกี่ยวกับวิสัยทัศน์คอมพิวเตอร์ (ECCV), 2020
[15] G. Moon และ KM Lee, "I2L-MESHNET: เครือข่ายการทำนายภาพถึงไล่ออกสำหรับท่าทางมนุษย์ 3 มิติที่แม่นยำและการประมาณตาข่ายจากภาพ RGB เดียว" ในการประชุมยุโรปเกี่ยวกับ ComputerVision (ECCV), 2020
[16] J. Krantz, E. Wijmans, A. Majumdar, D. Batra และ S. Lee, "Beyond the Nav-Graph: การนำทางวิสัยทัศน์และภาษาในสภาพแวดล้อมที่ต่อเนื่อง" 2020. Arxiv: 2004.02857 [Cs. CV]
[17] Z. Teed และ J. Deng, Raft: การแปลงฟิลด์ทั้งหมดที่เกิดขึ้นทั้งหมดสำหรับการไหลของแสง, 2020. Arxiv: 2003.12039 [CS.CV]
[18] Z. Li, W. Xian, A. Davis และ N. Snavely, "Crowdsampling ฟังก์ชั่น plenoptic," การประชุม Inproc.european เกี่ยวกับการมองเห็นคอมพิวเตอร์ (ECCV), 2020
[19] Z. Wan, B. Zhang, D. Chen, P. Zhang, D. Chen, J. Liao, และ F. Wen, การฟื้นฟูภาพถ่ายเก่าผ่านการแปลพื้นที่แฝงลึก, 2020. Arxiv: 2009.07047 [CS.CV ].
[20] Lechner, M. , Hasani, R. , Amini, A. et al. นโยบายวงจรประสาทเปิดใช้งานการตรวจสอบอิสระ Nat Mach Intell 2, 642–652 (2020) https://doi.org/10.1038/S42256-020-00237-3
[21] R. Or-El, S. Sengupta, O. Fried, E. Shechtman และ I. Kemelmacher-Shlizerman, "การสังเคราะห์การเปลี่ยนแปลงอายุการใช้งาน" ในการประชุมยุโรปเกี่ยวกับวิสัยทัศน์คอมพิวเตอร์ (ECCV), 2020
[22] Jason Antic ผู้สร้าง Deoldify, https://github.com/jantic/deoldify
[23] S. Ging, M. Zolfaghari, H. Pirsiavash และ T. Brox, "Coot: Cooperative ลำดับชั้นทรานส์ทรานส์แบบสหกรณ์สำหรับการเรียนรู้การแสดงข้อความวิดีโอ" ในการประชุมเกี่ยวกับการประมวลผลข้อมูลระบบประสาท, 2020
[24] Z. Zou, T. Shi, S. Qiu, Y. Yuan และ Z. Shi, ภาพวาดประสาทที่มีสไตล์, 2020. Arxiv: 2011.08114 [CS.CV]
[25] Z. Ke, K. Li, Y. Zhou, Q. Wu, X. Mao, Q. Yan และ RW Lau, "หน้าจอสีเขียวจำเป็นสำหรับการปูรูปแบบเรียลไทม์หรือไม่" arxiv, vol. ABS/2011.11961, 2020
[26] T. Karras, M. Aittala, J. Hellsten, S. Laine, J. Lehtinen และ T. Aila, การฝึกอบรมเครือข่ายฝ่ายตรงข้ามที่มีข้อมูล จำกัด , 2020. Arxiv: 2006.06676 [CS.CV]
[27] Ja Weyn, Dr Durran และ R. Caruana, "การปรับปรุงการทำนายสภาพอากาศทั่วโลกที่ขับเคลื่อนด้วยข้อมูลโดยใช้เครือข่ายประสาทที่ลึกล้ำบนทรงกลมคิวบ์", วารสารความก้าวหน้าในการสร้างแบบจำลองระบบโลก, ฉบับที่ 12 ไม่ 9, Sep. 2020, ISSN: 1942–2466.doi: 10.1029/2020MS002109
[28] PP Srinivasan, B. Deng, X. Zhang, M. Tancik, B. Mildenhall และ JT Barron, "Nerv: การสะท้อนแสงของระบบประสาทและทัศนวิสัยสำหรับการลดการเบาและการสังเคราะห์" ใน Arxiv, 2020