Anthropic oculta su IA Claude Mythos por ser "demasiado potente". ¿...

Anthropic presenta Claude Mythos como una IA tan potente que es un riesgo, pero los expertos sospechan que es marketing.

¿La IA más peligrosa o la campaña de marketing más inteligente?

Anthropic ha sacudido el ecosistema tecnológico con una afirmación audaz: su nuevo modelo de inteligencia artificial, Claude Mythos Preview, es el mejor jamás creado. Tanto, que consideran que sus capacidades son demasiado potentes como para liberarlo al público general. Según la compañía, el modelo posee un dominio sin precedentes en ciberseguridad, capaz de identificar vulnerabilidades complejas, pero esta misma fortaleza lo convierte en una herramienta potencialmente peligrosa en las manos equivocadas. Sin embargo, a medida que el polvo se asienta, cada vez más voces críticas sugieren que podríamos estar ante una magistral campaña de expectación en lugar de una revolución tecnológica sin parangón.

El discurso cuestionado de Anthropic

El conocido analista Gary Marcus ha sido uno de los primeros en poner en duda la narrativa de Anthropic. Argumenta que, aunque Mythos es indudablemente superior a sus predecesores, el salto cualitativo no es tan disruptivo como se presenta. Expertos en ciberseguridad y desarrolladores se han sumado al debate, señalando inconsistencias en el estudio publicado por la propia empresa. Por ejemplo, Anthropic destacó cómo Mythos encontró vulnerabilidades críticas en el navegador Firefox. No obstante, un análisis más detallado revela que muchos de estos hallazgos eran variaciones de los mismos dos errores. Al corregirlos, la tasa de efectividad del modelo para descubrir nuevos exploits disminuía significativamente, quedando incluso por debajo de modelos anteriores como Opus 4.6.

¿Vulnerabilidades reales o un espejismo bien dirigido?

Las críticas también apuntan a la elección de las pruebas de rendimiento. Algunos expertos señalan que el uso de Cybench como principal barómetro de ciberseguridad es discutible, ya que modelos previos casi lo superaban. Esto sugiere que las pruebas podrían haber sido seleccionadas para resaltar las fortalezas específicas de Mythos, en lugar de ofrecer una evaluación completamente imparcial frente a los desafíos reales que enfrentan los modelos actuales.

La competencia responde: ¿Es para tanto?

La respuesta de los competidores no se hizo esperar. Clement Delangue, cofundador y CEO de Hugging Face, demostró que modelos de código abierto, mucho más pequeños y económicos, podían identificar las mismas vulnerabilidades que Mythos. El truco, según Delangue, residía en aislar el código relevante y darle al modelo las pistas adecuadas, como “considera el desbordamiento de enteros”. Esto pone de manifiesto el llamado “sesgo del observador”: sabían qué buscar porque Mythos ya lo había encontrado. Aunque esto no significa que un modelo pequeño pueda reemplazar a Mythos en tareas complejas a ciegas, sí demuestra que la capacidad del nuevo modelo, aunque impresionante, no es magia. Mythos es mejor, en gran parte, porque es un modelo masivo en tamaño, diseño y recursos computacionales.

La sombra del “FUD” como estrategia

El lenguaje empleado por Anthropic podría ser un claro ejemplo de “FUD” (Fear, Uncertainty, Doubt), una técnica de marketing que busca generar miedo, incertidumbre y duda para posicionar un producto. No es la primera vez que vemos algo así en la industria. En 2019, OpenAI afirmó que su modelo GPT-2 era “demasiado peligroso” para un lanzamiento público, una declaración que, en retrospectiva, sirvió para crear una enorme expectación. La historia parece repetirse, utilizando el secretismo como un catalizador de interés.

El veredicto final: a la espera de pruebas

Aunque los benchmarks publicados por Anthropic muestran saltos notables en ciertas áreas, en otras la evolución es más modesta. El Epoch Capabilities Index (ECI), uno de los índices más respetados, sitúa a Claude Mythos por encima de sus rivales, pero no por un margen abrumador. La conclusión es clara: el lanzamiento ha sido llamativo y los documentos sugieren un modelo de IA extremadamente capaz. El problema fundamental es la falta de acceso. Sin la posibilidad de que la comunidad global y los analistas independientes lo pongan a prueba, solo nos queda la palabra de Anthropic. La pregunta sigue en el aire: ¿estamos presenciando la llegada de un lobo feroz que cambiará las reglas del juego o simplemente escuchando a la empresa que mejor sabe gritar “que viene el lobo”? Por ahora, la verificación independiente sigue siendo la pieza que falta en este intrigante rompecabezas.

Anthropic oculta su IA Claude Mythos por ser "demasiado potente". ¿La revolución definitiva o el truco de marketing del siglo?