
Fotomontaje inspirado en Google El Androide Libre
Google volvería a dejar en ridículo a ChatGPT con la nueva capacidad de su IA: subirás vídeos y así los analizará
Google ha dado la posibilidad de analizar vídeos de YouTube para hacer resúmenes, pero nunca abrió la puerta a que el usuario suba los suyos propios.
Más información: Gemini es más útil que nunca: ya puede editar documentos en tiempo real, programar o crear un 'pódcast' con tus archivos
Google finalmente ha sido capaz de acercarse a OpenAI con las numerosas actualizaciones de sus modelos de inteligencia artificial generativa y ciertas funciones de Gemini, como sucedió hace días con dos exclusivas que amplían la experiencia de Gemini Live. Ahora vuelve a superarse a sí mismo y se ha podido ver en exclusiva la función de análisis de vídeo cuando el usuario sube uno a Gemini.
OpenAI actualizó ChatGPT a finales del año pasado con la posibilidad de subir vídeos y así analizarlos al tomar ciertos fotogramas del mismo para dar un resumen o describir lo que el usuario desee. Es una experiencia bien distinta a la que se puede dar al subir una imagen, ya que ChatGPT pasará a procesar las imágenes con su visión por computadora y puede llevar minutos en comprender qué hay en un vídeo.
Google lleva desde marzo desarrollando esta experiencia para que hoy podamos presenciar cómo funciona gracias a Android Authority que la ha acabado en la versión 16.15.38.sa.arm64 beta de Gemini para Android. Y por lo que parece, funciona bastante bien al realizar la consulta del vídeo subido.
Se utiliza el modelo Gemini Advanced 2.0 Flash y en un vídeo se puede ver cómo se hace la consulta como si fuera una imagen. De hecho, se realiza la prueba con tres clips distintos para que en el primero Gemini sea capaz de hacer una descripción correcta de lo que ve. Incluso es capaz de dar la localización correcta del lugar al identificar la arquitectura del edificio que aparece en el vídeo.
Los otros dos clips de vídeo fueron analizados sin fallos. Hay ciertos límites en esta experiencia de análisis de vídeo con Gemini. Una de ellos es el máximo tiempo de duración del vídeo: 5 minutos. Y el segundo es que solo se permite una consulta sobre el vídeo subido. Es decir, que parece que para realizar otra consulta habría que subirlo de nuevo.

Subiendo un vídeo a Gemini El Androide Libre
Ya el mes pasado aparecieron varias líneas en el código que indicaba que Google permitiría subir y analizar varios vídeos a la vez. Su capacidad de descripción es bastante alta como se puede ver en las capturas compartidas para dar todos los detalles de lo que aparece en el vídeo.
Sobre su posible despliegue tampoco andaría muy lejos, ya que normalmente cuando se pueden activar estas funciones de manera no oficial significa que la fecha estaría cerca. El Google I/O será a mediados del mes que viene, así que sería una fecha especial para anunciar esta capacidad de Gemini y así seamos capaces de subir vídeos para que analice su contenido rápidamente.

El Androide Libre
Las posibilidades se ampliarían, ya fuese al descargar el vídeo de una reunión online o simplemente al capturar un vídeo de lo que aparece en la pantalla del móvil para que así nos ayude con cierto ajuste que hemos de modificar. Un importante avance para Gemini y habrá que ver de qué forma lo ofrece Google para así seguirle los pasos a ChatGPT que cuenta con esta función desde diciembre del año pasado.