En otro giro de la apasionante evolución de la inteligencia artificial, Anthropic, una empresa emergente en el campo de la IA, ha lanzado Claude 2, su último chatbot.
Desarrollado para competir directamente con productos reconocidos como ChatGPT de OpenAI, Google Bard y Bing Chat, este nuevo lanzamiento se presenta como una nueva opción en el paisaje de los asistentes de conversación inteligentes.
Claude 2, una sólida competencia para OpenAI
Anthropic, fundada en 2021 por exinvestigadores de OpenAI, ha conseguido una financiación considerable, aproximadamente 1.5 mil millones de dólares, poniéndola en el radar como una competidora directa de OpenAI.
A pesar del respaldo multimillonario de Microsoft a OpenAI y su producto estrella, ChatGPT, el primer modelo de Anthropic demostró ser una propuesta sólida en las pruebas de referencia.
Según la compañía, este nuevo modelo mejora sus habilidades de conversación, aporta una mayor claridad en la explicación de su razonamiento, produce salidas más seguras, posee una memoria más prolongada y presenta habilidades avanzadas de programación, matemáticas y razonamiento.
El nuevo chatbot puede ser utilizado para escribir documentos, memorandos, cartas, historias, documentación técnica e incluso libros.
Si bien lo que distingue a Claude 2 y lo hace destacar es su capacidad para procesar hasta 75,000 palabras (100,000 tokens) a la vez, superando considerablemente el límite estándar de ChatGPT de 3,000 palabras.
Esto permite que el chatbot considere más contexto en sus respuestas, mejorando la calidad de las mismas y diversificando las tareas que puede realizar.
Claude 2 vs Chat GPT
Para medir la eficacia y competencia de Claude 2, se han realizado una serie de pruebas y evaluaciones. En estas, la herramienta ha demostrado un rendimiento impresionante, estableciéndose como un contendiente sólido en el campo de los chatbots.
Una de las pruebas más destacadas fue la sección de opción múltiple del examen de American Bar Exam. En esta prueba, diseñada para evaluar la competencia legal, Claude 2 logró una puntuación impresionante del 76.5 por ciento.
Para poner esto en contexto, este resultado lo sitúa a la par con GPT-4, la última generación de la serie GPT de OpenAI. En comparación, GPT-3.5, la versión gratuita de ChatGPT, promedió solo alrededor del 50 por ciento en la misma prueba.
En la prueba de programación Python HumanEval Codex, otra evaluación rigurosa diseñada para medir las habilidades de codificación, Claude 2 también obtuvo un alto rendimiento.
Alcanzó un 71.2 por ciento, un aumento considerable en comparación con el 56.0 por ciento obtenido por su predecesor, Claude 1.3.
Esto indica que no solo es útil para la conversación y generación de texto, sino que también tiene aplicaciones potenciales en tareas de programación.
Finalmente, en los problemas matemáticos de nivel primaria GSM8k, una prueba destinada a evaluar las habilidades matemáticas básicas, Claude 2 obtuvo un 88.0 por ciento.
Nuevamente, este es un aumento notable en comparación con el 85.2 por ciento obtenido por Claude 1.3, demostrando mejoras en las habilidades de razonamiento y procesamiento de Claude 2.
En resumen, las pruebas demuestran que Claude 2 no solo ha mejorado respecto a su versión anterior, sino que también se mantiene a la par, e incluso supera en algunos aspectos, a otros chatbots de la competencia.
Sin embargo, es importante tener en cuenta que, aunque estos resultados son prometedores, todavía se están desarrollando capacidades adicionales que se implementarán en los próximos meses, lo que puede llevar a un rendimiento aún mejor en el futuro.
Implementación y seguridad
El desarrollo de Claude 2 tomó alrededor de dos meses, involucrando a cerca de 35 personas directamente en el modelado de IA y a otras 150 en roles de apoyo. En este proceso, Anthropic puso especial énfasis en la seguridad.
A diferencia de OpenAI, Anthropic utiliza un mecanismo de retroalimentación basado en la IA, evitando la intervención humana en la evaluación del contenido generado por la IA para optimizar el modelo.
Además, establece reglas fundamentales a través de una especie de constitución, basada en términos y condiciones similares a los de Apple.
Ya son miles las empresas que utilizan la API de Claude 2, incluyendo socios como Jasper, una plataforma generativa de IA para copias de marketing, y Sourcegraph, una plataforma de código AI que aprovecha las capacidades de razonamiento mejoradas de Claude y ventanas de contexto más grandes para ayudar a los desarrolladores a escribir, corregir y mantener el código.
Fecha de lanzamiento y disponibilidad
El lanzamiento oficial de Claude 2 marca el comienzo de una nueva era para Anthropic, ya que representa su última y más ambiciosa incursión en el mundo de los chatbots inteligentes.
Sin embargo, a diferencia de muchos otros productos y servicios de IA, este chatbot no fue lanzado simultáneamente en todo el mundo.
Inicialmente, Claude 2 ha sido lanzado en el Reino Unido y los Estados Unidos. Estas dos ubicaciones fueron elegidas para su debut debido a la presencia significativa de Anthropic y sus socios en estos mercados.
Además, se espera que estos dos países ofrezcan una variedad de casos de uso y aplicaciones para Claude 2, lo que permitirá a Anthropic recopilar una amplia gama de comentarios y datos para seguir perfeccionando el chatbot.
No obstante, aunque el lanzamiento inicial se limita a estos dos mercados, Anthropic tiene planes para expandir la disponibilidad de su chatbot a más regiones en el futuro.
A medida que la compañía continúa trabajando en mejoras y actualizaciones, también está preparando el terreno para llevar este revolucionario chatbot a usuarios de todo el mundo.
Así que, aunque no se han anunciado fechas específicas, se puede esperar que Claude 2 se vuelva cada vez más accesible en otros mercados en los próximos meses.
Anthropic ha demostrado que aún hay mucho por descubrir en el mundo de los chatbots con el lanzamiento de Claude 2 y a medida que continúa su evolución, será interesante ver cómo esta innovadora tecnología cambia la forma en que interactuamos con las máquinas y aprovechamos la inteligencia artificial en nuestras vidas diarias.
Relacionados
-
Midjourney v5.2 ya está listo, descubre sus nuevas funciones
-
ImageFX: el nuevo generador de imágenes con IA de Google
-
ChatGPT Earth: el plugin de mapas con IA de ChatGPT
-
ControlNet en Stable Difussion AI: todo lo que debes saber
-
Character.AI: qué es y cómo usarlo ¿Hablará español?
-
MPT-30B: la nueva IA de lenguaje que compite con ChatGPT