Google anunció recientemente que el Asistente de Géminis en Android Studio se ha actualizado para admitir funciones de entrada multimodal, y este movimiento innovador trae a los desarrolladores una nueva experiencia de desarrollo. Ahora los desarrolladores pueden adjuntar imágenes directamente a las indicaciones, obteniendo así asistencia visual durante el desarrollo de aplicaciones. La introducción de esta función marca otro avance importante en la herramienta de desarrollo en la dirección de la inteligencia.
Esta característica multimodal se presentó originalmente en la conferencia de E/S 2024, y el Géminis actualizado ahora puede "comprender los marcos de alambre simples y convertirlos en códigos de composición de jetpack disponibles". En la versión canaria de Android Studio Narwal, el campo Ask Gemini tiene una nueva opción "Archivo de imagen adjunto" (admite el formato JPEG o PNG). Google recomienda que los usuarios usen imágenes con "fuerte contraste de color" y proporcionen "consejos claros" para obtener los mejores resultados.
Los desarrolladores pueden cargar capturas de pantalla e interfaces de usuarios desde simples marcos de alambre hasta modelos de alta fidelidad y pueden especificar las características esperadas. Por ejemplo, en un ejemplo de diseño de calculadora, puede ser necesario "hacer que la interacción y el cálculo funcionen como se esperaba". Esta flexibilidad hace que Gemini sea un asistente de la derecha para los desarrolladores, mejorando en gran medida la eficiencia del desarrollo.
Los consejos típicos para convertir el diseño visual en código de interfaz de usuario funcional incluyen: 1. "Para esta imagen proporcionada, escriba el código de composición de JetPack Android para crear una pantalla lo más cerca posible de esta imagen. Asegúrese de incluir importaciones, usar material3 y grabar el código". 2. "Para esta imagen proporcionada, escriba el código de composición de Android Jetpack para crear una pantalla lo más cerca posible de esta imagen y obtenga un color creativo. Hacer que las interacciones y los cálculos funcionen como se esperaba. Asegúrese de incluir importaciones, usar material3 y grabar el código". Estos consejos proporcionan una orientación clara para que los desarrolladores implementen rápidamente conversiones de diseño a código.
Google posicionó a Gemini como una herramienta que proporciona un "marco de diseño inicial", y el código generado a menudo requiere una mayor edición y ajuste. Las mejoras comunes incluyen garantizar que los objetos e iconos dibujables se importen correctamente. Google recomienda tratar el código generado como un punto de partida eficiente para acelerar el flujo de trabajo de desarrollo de la interfaz de usuario. Este posicionamiento hace de Gemini no solo una herramienta, sino también un optimizador para los procesos de desarrollo.
Además, la función de análisis visual de Gemini también se puede utilizar para identificar y resolver errores, y los desarrolladores pueden "cargar capturas de pantalla de la interfaz de usuario problemática, que Gemini analizará la imagen y propondrá una solución potencial". Los desarrolladores también pueden adjuntar fragmentos de código relevantes para una ayuda más precisa. Esta función proporciona a los desarrolladores capacidades potentes de resolución de problemas, lo que hace que el proceso de desarrollo sea más suave.
Gemini en Android Studio también admite cargar diagramas de arquitectura y obtener explicaciones o documentos, similar a la función Gemini Astra Glasses que se muestra previamente en la conferencia de E/S. La introducción de esta función ha hecho que la posición de Géminis en las herramientas de desarrollo sea más importante y proporcionó a los desarrolladores soporte completo.