Tim peneliti AI Apple telah meluncurkan model estimasi kedalaman baru, Depth Pro, yang telah mencapai terobosan signifikan dalam kecepatan dan akurasi. Model ini dapat menghasilkan peta kedalaman 3D resolusi tinggi dari satu gambar 2D dalam 0,3 detik tanpa metadata kamera apa pun, dan dapat menangkap detail halus seperti rambut dan tumbuh-tumbuhan, menghadirkan inovasi pada bidang-bidang seperti augmented reality dan mengemudi otonom. Editor Downcodes akan menjelaskan secara rinci fungsi canggih Depth Pro dan prinsip teknis di baliknya.
Baru-baru ini, tim peneliti AI Apple merilis model baru bernama Depth Pro, yang merupakan terobosan besar di bidang estimasi kedalaman! Model ini dapat dengan cepat menghasilkan peta kedalaman 3D resolusi tinggi dari satu gambar 2D, dan yang menakjubkan, ternyata tidak memerlukan metadata kamera apa pun, yang jarang terjadi pada teknologi sebelumnya.

Depth Pro bekerja sangat cepat, menghasilkan peta kedalaman hanya dalam 0,3 detik . Model ini dapat membuat peta 2,25MP dengan kejernihan luar biasa, bahkan menangkap detail kecil seperti rambut dan tumbuh-tumbuhan yang sering terlewatkan oleh metode lain. Ini berarti Anda bisa mendapatkan detail adegan 3D secara real-time, yang merupakan keuntungan bagi banyak industri.
Misalnya, dalam aplikasi augmented reality (AR), objek virtual dapat diintegrasikan secara lebih akurat dengan lingkungan nyata untuk meningkatkan pengalaman pengguna. Dalam teknologi mengemudi otonom, kendaraan juga dapat melihat lingkungan sekitar dengan lebih akurat dan meningkatkan keselamatan berkendara.

Di balik teknologi ini terdapat arsitektur transformator visual multi-skala yang efisien. Para peneliti mengatakan bahwa arsitektur ini dapat memproses keseluruhan informasi dan detail gambar pada saat yang bersamaan, membuat Depth Pro meningkat secara signifikan dalam hal akurasi dan kecepatan. Dibandingkan dengan model lainnya, Depth Pro berkinerja sangat baik dalam menangkap detail halus, menampilkan tekstur bulu hewan dan tumbuhan dengan jelas, menghadirkan efek visual yang luar biasa.
Yang lebih penting lagi adalah Depth Pro dapat memberikan perkiraan “kedalaman absolut”, yang berarti tidak hanya memberi tahu Anda posisi relatif objek, tetapi juga jarak sebenarnya.
Hal ini penting untuk banyak skenario aplikasi, terutama dalam pengalaman realitas virtual yang memerlukan presisi tinggi. Selain itu, Depth Pro mengadopsi pendekatan "zero-shot learning", yang berarti dapat membuat prediksi kedalaman yang akurat tanpa kumpulan data tertentu.

Agar lebih banyak orang dapat merasakan pesona teknologi ini, Apple memutuskan untuk membuka sumber Depth Pro. Tim peneliti merilis kode relevan dan bobot model terlatih di GitHub untuk mendorong pengembang dan peneliti melakukan eksplorasi dan inovasi. Hal ini tidak diragukan lagi akan mendorong penerapan dan pengembangan Depth Pro secara cepat di berbagai bidang seperti robotika dan perawatan medis.
Dengan diluncurkannya Pro, Apple kembali menunjukkan ketangguhannya dalam inovasi teknologi di bidang AI. Model baru ini tidak hanya meningkatkan kemampuan mesin dalam memahami lingkungannya, tetapi juga diharapkan dapat memicu perubahan di berbagai industri.
Pintu masuk proyek: https://github.com/apple/ml- depth-pro
Menyorot:
** Estimasi kedalaman yang efisien **: Depth Pro dapat menghasilkan peta kedalaman 3D resolusi tinggi dalam 0,3 detik, yang sangat cepat.
**Kemampuan kedalaman absolut**: Tidak hanya dapat memberikan posisi relatif, namun juga secara akurat memberikan jarak sebenarnya, cocok untuk berbagai skenario aplikasi.
** Berbagi Sumber Terbuka **: Apple menjadikan Depth Pro open source untuk mendorong pengembang mengeksplorasi potensi aplikasinya di berbagai bidang.
Depth Pro yang open source akan sangat mendorong pengembangan teknologi estimasi kedalaman dan diharapkan membawa terobosan di bidang-bidang seperti AR dan mengemudi otonom. Kami menantikan lebih banyak pengembang yang mengembangkan aplikasi inovatif berdasarkan Depth Pro. Redaksi Downcodes akan terus memperhatikan perkembangan model ini selanjutnya.