No solo de las copias vive China (a pesar del reciente escándalo de la IA de TikTok/ByteDance). La IA de Alibaba, una multinacional tecnológica china especializada en comercio electrónico y tecnología minorista está rompiendo moldes de forma discreta y callada. En las últimas semanas, Alibaba Cloud (filial del conglomerado chino Alibaba Group) ha presentado tres inventos que, sinceramente, no han recibido la atención que se merecen.

No sabemos si se debe a que a EE.UU. no le interesa promocionar la inteligencia artificial china, pero lo cierto es que en las tres herramientas de generación de imágenes y vídeo que te vamos a mostrar a continuación en Diario IA aspiran a ser de lo más revolucionario que hemos visto en mucho tiempo.

Relacionado: Alibaba lanza un generador de texto en imágenes gratuito y espectacular

Outfit Anyone: la IA que aspira a romper las reglas de la venta online de ropa

Outfit adaptables con IA
Esta es la magia de la IA Outfit Anyone: una misma imagen se adapta automáticamente a distintos tipos de cuerpos.

Pero, ¿esto no existía ya? Sí y no: la capacidad de ponerle a una misma imagen distintas piezas de ropa lleva siendo parte de las webs de ecommerce desde hace años. Pero esto es nuevo, fíjate bien en la imagen de arriba.

La novedad de la IA que ha presentado Alibaba es la capacidad de adaptar las prendas a varios tipos de cuerpo (en forma, delgados, con sobrepeso, infantiles…) Fíjate en los pliegues o anchura: aquí, cada foto es distinta, pero se genera a partir de una sola imagen de la prenda.

En efecto, esta IA de Alibaba permitirá subir fotos de una persona y ver cómo le quedará la ropa de cuerpo entero. Además, Outfit Anyone también será capaz de crear vídeos y animaciones de alta calidad usando esa misma fotografía o dibujo.

Como puedes ver, estamos hablando de un probador virtual que funciona con inteligencia artificial y en base a una misma imagen que se transforma en función del sujeto que se la prueba. ¿Tenemos que dar más explicaciones de lo útil que puede resultarle al potencial comprador que, desde casa, no sepa con seguridad si la ropa que se quiere comprar le irá bien?

Outfit Anyone puede manejar hábilmente la deformación de las prendas para obtener resultados más realistas que los montajes de Photoshop en los que las prenda simplemente se pegaba encima de la foto.

Ya está disponible una versión demo de Outfit Anyone en la plataforma Huggin Face. Por motivos de seguridad, Alibaba ha limitado hasta ahora la posibilidad de subir fotos de personas, y sólo ha añadido una función de selección de ropa.

China y la inteligencia artificial: un silencioso mastodonte del que casi nadie habla

Animate Anyone

Aunque hace no mucho la idea de hacer una animación era terreno reservado para expertos, gracias a la inteligencia artificial ya es posible crear animaciones de alta calidad (tanto de personas reales como de ilustraciones) con unos pocos clics y cero conocimientos de edición digital.

Ese es el argumento de Animate Anyone, una IA de Alibaba que afirma ser capaz de animar cualquier foto con notable coherencia y control. Alibaba afirma que Animate Anyone puede transformar fotos en vídeos «según las secuencias de poses deseadas y logrando una continuidad temporal».

Basta sumar esta tecnología a la que te hemos enseñado hace un momento, Outfit Anyone, para abrir las puertas a un sinfín de nuevos casos de uso para tiendas de ropa y, por supuesto, influencers: ropa generada por IA y creación de un mercado para vídeos producidos en masa pero personalizados.

I2VGen-XL

Dejamos esta para el final porque, al fin y al cabo, es quizás la menos rompedora de las tres inteligencias artificiales presentadas por Alibaba. Pero no por ello menos impresionante. I2VGen-XL nos permite producir vídeos de alta calidad a partir del texto de entrada, las imágenes, el movimiento deseado, los sujetos deseados e incluso las señales de respuesta proporcionadas.

El modelo I2VGen-XL de Alibaba representa un hito importante en el panorama de la IA porque ofrece una alternativa a modelos que están prohibidos para los usuarios chinos o que podrían ser restringidos en el futuro por EE.UU. o el gobierno chino. Se trata de un sistema avanzado de conversión de texto a vídeo que pretende competir con modelos de gama alta como los lanzados por Pika Labs o Stability AI.

Cuando se compara con otros avances notables en este campo, como el modelo de Pika Labs y Stable Video Diffusion, I2VGen-XL se distingue por su enfoque único y su gran precisión semántica. Una demostración con varios ejemplos del uso de HiGen (un modelo de difusión) con I2VGen-XL muestra una importante mejora en la coherencia temporal y de fotogramas en comparación con el uso de HiGen solo.

Según el documento compartido por la empresa china, I2VGen-XL ha sido diseñado utilizando modelos de difusión en cascada, una sofisticada técnica de IA que garantiza que los vídeos generados no sólo sean visualmente impresionantes, sino también coherentes desde el punto de vista contextual y precisos desde el punto de vista semántico.

Funciona en un proceso de dos fases:

  • Fase de base: se centra en mantener la coherencia con el texto y las imágenes de entrada
  • Fase de refinamiento: mejora los detalles y la resolución del vídeo, alcanzando hasta 1280×720 píxeles.

Esta técnica puede parecer similar a las utilizadas para generar imágenes con SDXL. A diferencia de SD 1.5 y SD 2.1, que se basaban en un único modelo, Stability AI ha desarrollado dos modelos diferentes, uno base y otro de refinamiento, que deben combinarse para generar imágenes de la mejor calidad posible.

Alibaba Cloud afirma que para el entrenamiento del modelo se utilizó un amplio conjunto de datos de unos 35 millones de pares texto-vídeo y la asombrosa cifra de 6000 millones de pares texto-imagen. Este amplio conjunto de datos garantiza la versatilidad y precisión del modelo en diversos escenarios y temas.

El papel clave de China (y Alibaba) en la carrera armamentística de la IA

El lanzamiento de estos tres modelos se produce en un momento en el que el panorama tecnológico mundial está siendo testigo de un aumento de las tensiones y la competencia, especialmente entre Estados Unidos y China. En un contexto de restricciones comerciales y de impulso de la autosuficiencia tecnológica, el movimiento de Alibaba es oportuno y estratégicamente significativo para el país.

La última innovación de Alibaba no es un hecho aislado, sino que forma parte de una larga historia de rivalidad tecnológica (baste recordar los importantes recortes y vetos que sufrió la tecnología de Huawei fuera de China). Con Estados Unidos imponiendo restricciones a las exportaciones de chips (especialmente a NVidia) y China respondiendo con contramedidas, la carrera por la supremacía de la IA se ha acelerado.

Hace tiempo que Alibaba evidenció su intención de no sólo centrarse en el mundo del comercio, convirtiéndose en poco tiempo en un actor importante en tecnologías emergentes, llámese metaverso, criptomonedas o inteligencia artificial.