El equipo de investigación de IA de Apple ha lanzado un nuevo modelo de estimación de profundidad, Depth Pro, que ha logrado avances significativos en velocidad y precisión. Este modelo puede generar un mapa de profundidad 3D de alta resolución a partir de una única imagen 2D en 0,3 segundos sin ningún metadato de la cámara, y puede capturar detalles finos como el cabello y la vegetación, aportando innovación a campos como la realidad aumentada y la conducción autónoma. El editor de Downcodes explicará en detalle las poderosas funciones de Depth Pro y los principios técnicos detrás de él.
Recientemente, el equipo de investigación de inteligencia artificial de Apple lanzó un nuevo modelo llamado Depth Pro, que es un gran avance en el campo de la estimación de profundidad. Este modelo puede generar rápidamente mapas de profundidad 3D de alta resolución a partir de una única imagen 2D. requieren metadatos de la cámara, lo cual es poco común en tecnologías anteriores.

Depth Pro funciona muy rápido, generando mapas de profundidad en tan solo 0,3 segundos . El modelo puede crear mapas de 2,25 MP con excelente claridad, capturando incluso detalles minúsculos como el cabello y la vegetación que otros métodos suelen pasar por alto. Esto significa que puede obtener escenas 3D detalladas en tiempo real, lo cual es una gran ayuda para muchas industrias.
Por ejemplo, en aplicaciones de realidad aumentada (AR), los objetos virtuales se pueden integrar con mayor precisión con el entorno real para mejorar la experiencia del usuario. En la tecnología de conducción autónoma, los vehículos también pueden percibir con mayor precisión el entorno circundante y mejorar la seguridad en la conducción.

Detrás de esta tecnología se encuentra una eficiente arquitectura de transformador visual de múltiples escalas. Los investigadores dijeron que esta arquitectura puede procesar la información general y los detalles de la imagen al mismo tiempo, lo que hace que Depth Pro mejore significativamente en precisión y velocidad. En comparación con otros modelos, Depth Pro funciona particularmente bien en la captura de detalles finos, representando claramente pelos de animales y texturas de plantas, brindando excelentes efectos visuales.
Lo que es más digno de mencionar es que Depth Pro puede proporcionar estimaciones de "profundidad absoluta", lo que significa que no sólo le indica las posiciones relativas de los objetos, sino también las distancias reales.
Esto es importante para muchos escenarios de aplicaciones, especialmente en experiencias de realidad virtual que requieren alta precisión. Además, Depth Pro adopta un enfoque de "aprendizaje de disparo cero", lo que significa que puede realizar predicciones de profundidad precisas sin un conjunto de datos específico. Esto es extremadamente adaptable, lo que le permite usarse ampliamente en una variedad de aplicaciones.

Para permitir que más personas experimenten el encanto de esta tecnología, Apple decidió abrir Depth Pro de código abierto. El equipo de investigación publicó código relevante y pesos de modelos previamente entrenados en GitHub para alentar a los desarrolladores e investigadores a explorar e innovar. Sin duda, esto promoverá la rápida aplicación y desarrollo de Depth Pro en múltiples campos, como la robótica y la atención médica.
Con el lanzamiento de Pro, Apple volvió a demostrar su fortaleza en innovación tecnológica en el campo de la IA. Este nuevo modelo no sólo mejora la capacidad de las máquinas para percibir su entorno, sino que también se espera que provoque cambios en múltiples industrias.
Entrada del proyecto: https://github.com/apple/ml- Depth-pro
Destacar:
** Estimación de profundidad eficiente **: Depth Pro puede generar mapas de profundidad 3D de alta resolución en 0,3 segundos, lo cual es extremadamente rápido.
**Capacidad de profundidad absoluta**: No solo puede proporcionar una posición relativa, sino que también proporciona una distancia real con precisión, adecuada para una variedad de escenarios de aplicación.
**Compartir código abierto**: Apple hace que Depth Pro sea de código abierto para alentar a los desarrolladores a explorar el potencial de su aplicación en diferentes campos.
El código abierto de Depth Pro promoverá en gran medida el desarrollo de la tecnología de estimación de profundidad y se espera que genere avances en campos como la realidad aumentada y la conducción autónoma. Esperamos que más desarrolladores desarrollen aplicaciones innovadoras basadas en Depth Pro. El editor de Downcodes seguirá atento al desarrollo posterior de este modelo.