Un potente cerebro digital se fragmenta en letras caóticas, ilustrando la paradoja de la avanzada pero falible IA de Google.
Tecnología

La Paradoja de la IA de Google: Por Qué la Tecnología Más Avanzada del Mundo No Sabe Deletrear

La nueva IA de Google, AI Overviews, presenta errores de ortografía básicos, revelando una limitación fundamental de los LLMs.

El Despliegue Accidentado: Los Primeros Pasos de la IA en la Búsqueda de Google

No era necesario ser un profeta para anticipar que la ambiciosa revisión de la Búsqueda de Google, centrada casi por completo en la inteligencia artificial, tendría un comienzo complicado. La compañía de Mountain View ha apostado su futuro a la integración de la IA generativa en su producto estrella, un motor de búsqueda que ha definido la web por casi tres décadas. Sin embargo, este camino hacia el futuro está demostrando ser más accidentado de lo previsto, y los errores recientes son un eco de problemas pasados que muchos creían superados.

Esta no es la primera vez que Google tropieza con la implementación de sus AI Overviews. En una iteración anterior, la funcionalidad fue duramente criticada por citar como hechos publicaciones satíricas de medios como The Onion y comentarios de Reddit. Los resultados fueron una serie de recomendaciones absurdas y peligrosas, como aconsejar a los usuarios comer rocas o añadir pegamento a la pizza. Estos incidentes iniciales pusieron de manifiesto la fragilidad de un sistema que aún no distinguía la sátira de la realidad, obligando a la compañía a realizar ajustes urgentes.

Ahora, mientras Google redobla su compromiso con esta tecnología, los tropiezos vuelven a aparecer, aunque de una forma más sutil pero igualmente reveladora. La decisión de transformar radicalmente el buscador es una de las más significativas en sus 25 años de historia, marcando el fin de la era de los enlaces azules y el comienzo de una nueva etapa dominada por agentes de información autónomos. Este cambio fundamental, sin embargo, expone las grietas inherentes a la tecnología actual.

La memoria de los fallos previos

La estrategia de Google es clara: hacer de la IA generativa la pieza central de su producto insignia. La compañía está decidida a liderar esta nueva era tecnológica, pero los errores persistentes en tareas aparentemente sencillas manchan la narrativa de una IA todopoderosa. Antes de los problemas de ortografía, la compañía ya tuvo que parchear un fallo curioso: al buscar la palabra "disregard", la IA respondía con "Entendido. ¡Avísame cuando tengas una nueva indicación o pregunta!", como si fuera un asistente obediente en lugar de un diccionario. Estos fallos, aunque a menudo divertidos, alimentan el escepticismo y la desconfianza entre los usuarios, quienes están empezando a buscar alternativas. De hecho, la reacción contra la IA de Google está provocando un crecimiento histórico en buscadores alternativos que prometen una experiencia más tradicional y privada.

De 'Poop' a 'Trpum': Los Errores que Desnudan la Lógica de la IA

Los fallos más recientes de AI Overviews de Google son tan básicos que resultan desconcertantes. Cuando se le hacen preguntas sencillas que implican contar letras dentro de una palabra, el sistema muestra una sorprendente incapacidad. Estos errores no son complejos ni subjetivos; son fallos factuales que cualquier niño en edad escolar podría corregir, lo que los hace aún más notables viniendo de una de las tecnologías más sofisticadas del mundo.

La lista de ejemplos documentados es a la vez cómica y preocupante:

  • Al preguntarle cuántas 'P' hay en la palabra 'Google', la IA responde con seguridad que hay dos.
  • Afirma que hay "exactamente una 'r' en la palabra 'poop'".
  • Al deletrear la palabra 'journalism', comete un error y la escribe como 'j-o-u-r-n-a-d-i-s-m'.
  • Consigue identificar que hay una 'P' en el apellido del expresidente de EE. UU., pero lo deletrea como 't-r-p-u-m'.

Estos errores de conteo y ortografía han sido un chiste recurrente en la comunidad de IA durante años. Un desafío clásico para cualquier nuevo modelo de lenguaje es preguntarle cuántas 'r' hay en la palabra 'strawberry'. La respuesta casi siempre incorrecta revela una verdad fundamental sobre cómo funcionan estos sistemas. Google, en una declaración a TechCrunch, reconoció el problema: “Contar dentro de las palabras ha sido un desafío conocido para los LLMs, y estamos trabajando para solucionar este problema en particular”.

El talón de Aquiles de los modelos de lenguaje

La persistencia de estos errores ortográficos es fascinante porque son increíblemente difíciles de erradicar a nivel fundamental. Lo que para un humano es una tarea trivial, para un Modelo de Lenguaje Grande (LLM) es un desafío conceptual. Estos modelos, capaces de programar una aplicación en segundos o resolver problemas matemáticos que han desconcertado a expertos durante décadas, tienen una competencia ortográfica comparable a la de un niño de preescolar. La paradoja es evidente: una inteligencia sobrehumana en ciertos dominios muestra una debilidad casi infantil en otros.

Más Allá de las Letras: Por Qué los Modelos de Lenguaje Tropiezan con la Ortografía

La razón fundamental detrás de la incapacidad de la IA para deletrear reside en su arquitectura central. Contrariamente a la intuición, los LLMs no perciben el texto como lo hacemos los humanos, es decir, como una secuencia de letras que forman palabras y oraciones. En su lugar, operan sobre un concepto llamado 'tokens'. Muchos modelos se basan en la arquitectura 'transformer', que descompone el texto en estas unidades. Un token puede ser una palabra completa, una sílaba o incluso una sola letra, dependiendo del modelo específico y del idioma.

Cuando un usuario introduce una consulta, el texto no se "lee", sino que se traduce en una serie de representaciones numéricas de estos tokens. El modelo entonces procesa estos números para predecir cuál debería ser la siguiente secuencia de tokens más lógica. Como explicó el investigador de IA Matthew Guzdial a TechCrunch, el sistema no tiene un conocimiento inherente de las letras individuales que componen una palabra. “Cuando ve la palabra ‘the’, tiene esta codificación de lo que significa ‘the’, pero no sabe sobre ‘T’, ‘H’, ‘E’”, aclara. Este es uno de los motivos principales por los que la IA es tan mala deletreando.

La 'niebla' de los tokens y el futuro de la IA

Esta arquitectura basada en tokens es inherentemente limitante para tareas a nivel de carácter. Sheridan Feucht, estudiante de doctorado en la Universidad Northeastern, sugiere que no existe un 'tokenizador' perfecto debido a la naturaleza difusa del lenguaje. La forma en que estos sistemas procesan la información es tan ajena a nuestra cognición que los problemas como la ortografía son un efecto secundario casi inevitable. Esta dependencia de los tokens tiene implicaciones profundas, no solo para la ortografía, sino también para la economía y sostenibilidad de las aplicaciones de IA.

Si bien este no es un problema urgente en la agenda de los investigadores, cuya prioridad no es que los LLMs ganen un concurso de deletreo, estos fallos evidentes cumplen una función importante. Nos recuerdan de forma contundente que la inteligencia artificial no es perfecta ni omnisciente, por mucho que a veces parezca un poder que escapa a nuestra comprensión. Cada error, por básico que sea, es una lección sobre la necesidad de no confiar ciegamente en sus resultados y de mantener siempre un espíritu crítico. La precisión de la IA, al final, sigue dependiendo de la verificación humana.

Es un tipo de inteligencia artificial entrenado con enormes cantidades de texto para comprender y generar lenguaje. Su funcionamiento se basa en predecir la secuencia de palabras más probable para responder a una consulta o continuar un texto.

Son las unidades básicas en las que los modelos de lenguaje descomponen el texto para procesarlo. Un 'token' puede ser una palabra, sílaba o letra, que el modelo convierte en números para su análisis y predicción.

Es una rama de la inteligencia artificial capaz de crear contenido nuevo y original, como texto, imágenes o código. A diferencia de otras IA, esta usa los datos de entrenamiento como base para generar algo completamente nuevo.

La IA no procesa el texto como los humanos, letra por letra, sino en unidades llamadas 'tokens'. Este método le dificulta realizar tareas sencillas como contar letras o deletrear correctamente, a pesar de su avanzada capacidad para resolver problemas complejos. Es una limitación fundamental de su arquitectura actual.

Son resúmenes generados por inteligencia artificial que aparecen al inicio de los resultados de búsqueda. Su objetivo es ofrecer respuestas directas a las consultas, reemplazando la tradicional lista de enlaces azules. Sin embargo, su implementación ha mostrado errores y falta de fiabilidad en varias ocasiones.

No completamente. La IA de Google ha mostrado fallos, desde citar sátira como hechos hasta cometer errores de ortografía básicos. Aunque es una herramienta poderosa, sus resultados no deben ser aceptados ciegamente y siempre requieren un espíritu crítico y verificación humana para garantizar su precisión.
E

Escrito por

Eder Muñoz Fundador & Editor · SoyReportero

Ingeniero de Sistemas con especialización en desarrollo de software y arquitecturas digitales. Fundador de SoyReportero, plataforma de noticias tecnológicas construida y operada desde su concepción técnica. Apasionado por la inteligencia artificial, el ecosistema tech y su impacto en Latinoamérica.

Ver perfil

Calificación

-- / 5

(-- votos)

Reportes

--

Comentarios

Cargando comentarios...