Apañárselas para saber cómo poner texto en imágenes hechas con inteligencia artificial es, todavía hoy, un desafío. Independientemente de que ya tengamos generadores de imágenes IA con resultados tan espectaculares y realistas como los de MidJourney v6, introducir texto en una foto IA sigue siendo una tarea en la que la gran mayoría de las herramientas IA no dan la talla.

Para resolver este problema, Alibaba research ha presentado AnyText, un modelo de generación y edición de texto visual multilingüe basado en la difusión, que se centra en la representación de un texto preciso y coherente en la imagen. A continuación, en Diario IA te mostramos varios ejemplos y te decimos cómo usar gratis esta herramienta para colocar texto en una imagen.

Relacionado: ¿Por qué nadie habla de estas tres increíbles inteligencias artificiales presentadas por Alibaba?

AnyText, la última maravilla de Alibaba para crear imágenes con texto si errores en la IA

Como poner texto en una imagen hecha con inteligencia artificial

La imagen que acabas de ver se corresponde a resultados reales presentados por el gigante asiático del comercio online Alibaba. Como puedes ver, ya es posible introducir texto en objetos, edificios o, literalmente, lo que se te ocurra.

Como editar texto en una imagen hecha con inteligencia artificial gratis
La herramienta de Alibaba permite corregir selectivamente porciones de texto de cualquier imagen.

¿Eres capaz de imaginar la cantidad de aplicaciones útiles que puede tener esta inteligencia artificial para, por ejemplo, una tienda online que venda productos personalizados?

Gracias a esta IA basada en Stable Diffusion, las tiendas online podrían mostrarle los productos personalizados a sus clientes en la página web, y sólo crearlos on demand, es decir, cuando el cliente haya pagado, evitando así que el inventario permanezca en el almacén acumulando polvo.

Es algo que ya sucede, por ejemplo, en Amazon y ciertos libros que únicamente se imprimen cuando el comprador los ha encargado. También pasa algo parecido en infinidad de tiendas online que venden camisetas y gorras.

Pero aquí estamos hablando de una revolución de dimensiones muchos más grandes.

El generador de texto en imágenes IA de Alibaba viene con dos modos: creación y edición. El modo edición te permite subir una imagen ya generada y arreglarla. Tienes ejemplos en la fotografía que acompaña a este texto.

Relacionado: La Guía definitiva para crear imágenes con IA gratuitamente

¿Cómo funciona AnyText y cómo consigue colocar texto en una imagen IA?

AnyText consta de un proceso de difusión con dos elementos principales: un módulo latente auxiliar y un módulo de incrustación de texto.

  • El primero utiliza entradas como el glifo del texto, la posición y la imagen enmascarada para generar características latentes para la generación o edición de texto.
  • El segundo emplea un modelo de reconocimiento óptico de caracteres para codificar los datos de trazos como incrustaciones, que se mezclan con las incrustaciones de pies de imagen del tokenizador para generar textos que se integran perfectamente con el fondo.

Para mejorar aún más la precisión de la escritura, este modelo de generación de texto en imágenes creadas con inteligencia artificial en el entrenamiento emplea pérdida de difusión por control de texto y la pérdida perceptiva de texto.

Relacionado: Cómo convertir una fotografía en logo gratis

Cómo usar AnyText para poner texto en imágenes hechas con inteligencia artificial

A continuación te explicamos cómo puedes usar gratis esta web para crear imágenes con inteligencia artificial y texto sin errores. Haz clic aquí para acceder a la web experimental de AnyText.

Generación de texto

Peluche con la camiseta de Diario IA
Así hemos creado la imagen con IA del peluche con la camiseta de Diario IA.
  1. Introduce la descripción textual de la imagen que deseas generar en [Prompt]. Cada línea de texto que deba generarse debe ir entre comillas dobles. Para nuestro ejemplo del osito con la camiseta de Diario IA hemos introducido: Fotografía de un peluche de osito panda adorable con una camiseta en la que se lee «Diario IA»
  2. A continuación, dibuja manualmente la posición especificada para cada línea de texto para generar la imagen. El dibujo de las posiciones del texto es crucial para la calidad de la imagen resultante, por lo que no deberías dibujar demasiado a la ligera o demasiado pequeño.
  3. El número de posiciones debe coincidir con el número de líneas de texto, y el tamaño de cada posición debe ajustarse lo más posible a la longitud o anchura de la línea de texto correspondiente. Si [Manual-draw] te resulta incómodo, puedes intentar arrastrar rectángulos [Manual-rect] o posiciones aleatorias [Auto-rand].
  4. Haz clic en Run.

Cuando se generan líneas múltiples, cada posición se empareja con la línea de texto de acuerdo con una regla determinada. La opción [Posición de ordenación] se utiliza para determinar si se da prioridad a la ordenación de arriba a abajo o de izquierda a derecha.

Como crear imagenes con texto gratis con inteligencia artificial

Puedes abrir la opción [Mostrar depuración] en la configuración de parámetros para observar la posición del texto y la imagen del glifo en el resultado. También puedes seleccionar la opción [Revisar posición], que utiliza el cuadro delimitador del texto renderizado como posición revisada. Sin embargo, ocasionalmente se observa que la creatividad del texto generado es ligeramente inferior utilizando este método.

Edición de texto

Carga una imagen en [Ref] como imagen de referencia, ajusta el tamaño del pincel y marca las áreas que deseas editar. Introducea la descripción textual y el nuevo texto a modificar en [Prompt] y, a continuación, genera la imagen.

La imagen de referencia puede ser de cualquier resolución, pero se procesará internamente con el límite de que el lado más largo no puede superar los 768 píxeles, y la anchura y la altura se escalarán a múltiplos de 64.

Haz clic aquí para acceder a la web experimental de AnyText.