Anthropic, la startup de inteligencia artificial orientada a la creación de modelos de IA fiables para competir con ChatGPT de OpenAI, ha anunciado hoy una actualización de su chatbot Claude que mejora sus características principales con una seguridad significativamente superior, una ventana de contexto mucho más grande y una nueva función de uso de herramientas de terceros.

Claude 2.1:Características de la actualización del LLM de Anthropic

Como primera mejora con respecto a Claude 2, Anthropic ha duplicado su ventana contextual hasta 200.000 tokens, es decir, unas 150.000 palabras o más de 500 páginas de material. Ahora los usuarios pueden cargar grandes volúmenes de documentación, como bases de código completas, estados financieros o incluso obras literarias largas como La Ilíada o La Odisea (con 176.000 y 115.320 palabras respectivamente).

¿Qué es la ventana de contexto?

La ventana de contexto de un Modelo de Lenguaje de Gran Escala (LLM) como GPT-4, se refiere al límite máximo de texto que el modelo puede considerar en una sola instancia para entender y responder a una consulta. Esta ventana incluye una cantidad específica de tokens, donde un token puede ser una palabra, parte de una palabra o un signo de puntuación.

Si el texto excede este límite, el modelo no podrá considerar la información que exceda la ventana de contexto, lo cual podría afectar la coherencia y relevancia de sus respuestas.

(Relacionado: ¿Cuándo sale ChatGPT 5?)

Este límite es crucial para comprender las capacidades y limitaciones de un LLM en el procesamiento de información extensa o en conversaciones prolongadas.

Una vez escaneada, Claude puede utilizarse para «hablar» con grandes volúmenes de contenido o datos y resumirlos, realizar sesiones de preguntas y respuestas, predecir tendencias, comparar y contrastar varios documentos o realizar otros tipos de análisis.

«Procesar un mensaje de 200.000 caracteres es una hazaña compleja y una primicia en el sector», afirma la empresa en el anuncio.

«Aunque estamos entusiasmados por poner esta nueva y potente capacidad en manos de nuestros usuarios, tareas que normalmente requerirían horas de esfuerzo humano para completarse pueden llevarle a Claude unos minutos».

El LLM con mayor ventana de contexto

GPT-4 Turbo puede procesar hasta 100.000 palabras (128.000 tokens) o 300 páginas de un libro estándar a la vez. El anterior modelo GPT-4 de ChatGPT sólo podía procesar 8.000 tokens, es decir, entre 4.000 y 6.000 palabras.

Hasta la fecha, los 100.000 tokens de Claude 2 eran la mayor ventana de contexto del sector para chatbots de IA con grandes modelos lingüísticos. Y Claude 2.1 ha ampliado aún más la cifra hasta las 150.000 palabras.

Anthropic añadió que, aunque ahora puede tardar unos minutos en producir resultados basados en conjuntos de datos extremadamente grandes, a medida que la tecnología progrese el tiempo que tarde será más manejable.

La empresa también ha dicho que ha hecho progresos significativos hacia la seguridad general del modelo al minimizar las alucinaciones, o declaraciones falsas, en comparación con Claude 2.0. Esto permitirá a las empresas que se basen en el modelo aplicar una IA de alto rendimiento para resolver cuestiones que requieran una mayor confianza y fiabilidad con la certeza de que recibirán más información basada en hechos.

A raíz de los comentarios de los usuarios, Anthropic ha añadido una nueva función beta que permite a Claude acceder a procesos, productos e interfaces de programación de aplicaciones de terceros. Los desarrolladores ahora pueden interoperar con el chatbot con funciones definidas por el usuario que el bot puede utilizar cuando sea apropiado para completar las solicitudes. Esto incluye funciones creadas por el desarrollador, búsquedas web, bases de conocimiento privadas y herramientas de terceros.

Entre los ejemplos a los que Claude podría conectarse para determinadas solicitudes se incluyen el uso de una herramienta de calculadora para razonamientos numéricos complejos, la respuesta a una pregunta mediante una llamada a una API o una búsqueda en la web, la realización de una acción sencilla a través de una API privada como una llamada a un sistema de gestión de contenidos o la conexión de los usuarios a un conjunto de datos de productos para ayudar a realizar recomendaciones.

Instrucciones del sistema

Un nuevo tipo de instrucciones, llamado «instrucciones del sistema» para Claude, permite a los desarrolladores proporcionar instrucciones personalizadas para que el chatbot adopte personalidades o roles específicos.

Con este tipo de instrucciones, los desarrolladores pueden configurar a Claude para que actúe con un tono determinado, se limite a temas específicos y respete las normas y los guardarraíles. Con este tipo de indicaciones, es menos probable que Claude realice acciones prohibidas o emita textos no deseados, y es más probable que se mantenga en el papel que se le pidió que desempeñara.

Más información en la web de Anthropic.