Las IAs ya pueden hablar entre ellas. Buenas noticias: ya estamos un poco más cerca de que las inteligencias artificiales puedan planear entre ellas cómo acabar con la raza humana. En colaboración con la Universidad Estatal de Pensilvania y la Universidad de Washington, Microsoft ha desarrollado y lanzado AutoGen, una herramienta que mejora las capacidades de los grandes modelos lingüísticos (LLM) al permitir conversaciones multiagente.

Así, sin hacer mucho ruido, Microsoft ha puesto a disposición de todo el mundo su propia biblioteca de Python: un nuevo marco que permite el desarrollo de grandes aplicaciones de modelos de lenguaje (LLM) utilizando múltiples agentes que pueden hablar entre sí para resolver tareas. Y también jugar al ajedrez.

(Relacionado: La IA Windows Copilot no sirve para ‘nada’ (por ahora)

Qué es Microsoft AutoGen

La clave de Microsoft AutoGen es que los agentes interactúan entre sí a través de mensajes en lenguaje natural para realizar diversas tareas. Mira esta imagen que ha publicado la empresa en su blog:

Como funciona Microsoft AutoGen
Se puede utilizar un agente proxy de usuario y un agente asistente de AutoGen para construir una versión mejorada de ChatGPT + Code Interpreter + plugins. El agente asistente desempeña el papel de un asistente de IA como Bing Chat. El agente proxy de usuario desempeña el papel de un usuario y simula el comportamiento de los usuarios, como la ejecución de código. AutoGen automatiza el chat entre los dos agentes, al tiempo que permite la retroalimentación o intervención humana. El proxy de usuario interactúa sin problemas con los humanos y utiliza herramientas cuando es necesario.

Tal y como lo describe Microsoft, AutoGen es «un marco para simplificar la orquestación, optimización y automatización de los flujos de trabajo LLM». El concepto fundamental de AutoGen es la creación de «agentes», que son módulos de programación impulsados por LLM como GPT-4.

Los agentes AutoGen son personalizables, conversables y permiten sin problemas la participación humana (gracias, Microsoft). Pueden funcionar en varios modos que emplean combinaciones de LLM, entradas humanas y herramientas.

Una de las características clave de AutoGen es su compatibilidad con diversos patrones de conversación.

A continuación de ofrecemos una visión general de lo que puedes esperar del nuevo sistema de agentes de IA AutoGen de Microsoft y cómo instalarlo. Este marco, que sin duda será del interés de todos aquellos que quieran programar una inteligencia artificial con Python, ya está disponible en Github, abriendo un nuevo mundo de posibilidades para desarrolladores e investigadores en el campo de la IA.

¿Para qué sirve AutoGen? ¿Por qué es importante?

dos inteligencias artificiales juegan al ajedrez
Dos inteligencias artificiales juegan al ajedrez (imagen generada por IA).

Los desarrolladores pueden utilizar AutoGen para construir una amplia gama de patrones de conversación relativos a la autonomía de la conversación, el número de agentes y la topología de conversación de los agentes. Esta flexibilidad permite crear flujos de trabajo complejos que pueden gestionar una gran variedad de tareas.

(Relacionado: El «todo o nada» de Microsoft y la IA con Windows Copilot, Bing, Office 365, Azure & Edge)

El marco de conversación multiagente de AutoGen es un avance significativo en el campo de la IA. Al automatizar la conversación entre múltiples agentes capaces, las tareas pueden realizarse de forma autónoma o con retroalimentación humana, incluidas tareas que requieren el uso de herramientas mediante código.

Que es y para que sirve Microsoft autogen

Los agentes AutoGen pueden comunicarse entre sí para resolver tareas, lo que permite aplicaciones más complejas y sofisticadas de lo que sería posible con un único LLM.

Entre las opciones de personalización que estos agentes pueden ofrecer están:

  • La posibilidad de elegir los LLM que se van a utilizar
  • Los tipos de entrada humana que se van a permitir
  • Las herramientas que se van a emplear

Una de las características más destacadas de AutoGen es la perfecta integración (dicen en Microsoft) de la participación humana. Los humanos pueden proporcionar información y comentarios a los agentes según sea necesario, creando un entorno de colaboración entre los humanos y la IA.

(Relacionado: ¿Te imaginas un Microsoft Paint con inteligencia artificial?: Ya está aquí Paint Cocreator)

Ventajas de usar AutoGen

El diseño centrado en la conversación del agente tiene numerosas ventajas, entre ellas que

  • Maneja con naturalidad la ambigüedad, la retroalimentación, el progreso y la colaboración.
  • Permite la realización de tareas de codificación eficaces, como el uso de herramientas para la resolución de problemas.
  • Permite a los usuarios darse de alta o de baja sin problemas a través de un agente en el chat.
  • Logra un objetivo colectivo con la cooperación de múltiples especialistas.

AutoGen admite el chat automatizado y diversos patrones de comunicación, lo que facilita orquestar un flujo de trabajo complejo y dinámico y experimentar con la versatilidad. Ejemplo de ello es la imagen que te mostramos a continuación de una partida de ajedrez entre dos inteligencias artificiales habilitadas por AutoGen:

Dos inteligencias artificiales juegan al ajedrez con Microsoft AutoGen
Dos inteligencias artificiales juegan al ajedrez con Microsoft AutoGen.

Puntos fuertes y requisitos para usar AutoGen

Además de su versatilidad, AutoGen proporciona una API de inferencia mejorada. Ofrece un reemplazo directo de openai.Completion u openai.ChatCompletion, permitiendo un fácil ajuste del rendimiento, utilidades como unificación de API y almacenamiento en caché, y patrones de uso avanzados, como manejo de errores, inferencia multi-config, programación de contexto y más.

(Relacionado: Los stickers con IA de Meta/Facebook están fuera de control)

AutoGen ayuda a maximizar la utilidad de LLM costosos como ChatGPT y GPT-4. El reemplazo directo de openai.Completion u openai.ChatCompletion añade potentes funcionalidades como el ajuste, el almacenamiento en caché, la gestión de errores y la creación de plantillas. Por ejemplo, puede optimizar las generaciones por LLM con sus propios datos de ajuste, métricas de éxito y presupuestos.

En cuanto a los requisitos técnicos, AutoGen requiere una versión de Python >= 3.8. Esto garantiza que el framework pueda funcionar de forma eficiente y eficaz, proporcionando el mejor rendimiento posible a sus usuarios.

Más información en la web de Microsoft AutoGen.