Un error en diez respuestas puede sonar razonable en abstracto. Colocado en la parte superior de la búsqueda más utilizada del mundo, se convierte en un problema de escala difícil de ignorar.
Eso es exactamente lo que revela un análisis encargado por The New York Times a la empresa Oumi, que evaluó más de 4.000 preguntas del benchmark SimpleQA. Con el modelo anterior, Google AI Overviews respondía correctamente en el 85% de los casos. Tras la actualización a Gemini 3, esa cifra sube al 91%. Es una mejora real, pero un 9% de respuestas incorrectas en un benchmark diseñado específicamente para ser difícil no es un resultado que invite a la celebración, especialmente para un producto que se presenta como una alternativa más directa y fiable que la lista clásica de enlaces.
El contexto importa: SimpleQA no refleja la totalidad del tráfico de búsqueda, pero sí mide con precisión algo relevante —la tendencia del sistema a generar errores con aparente confianza. Y ese tono seguro es parte del problema. Cuando una respuesta incorrecta llega formulada como un dato definitivo, la mayoría de usuarios no tiene motivos para cuestionarla.

Google lleva meses intentando corregir el rumbo. Tras los episodios que dañaron su reputación en 2024 introdujo una serie de ajustes, y posteriormente retiró parte de los resúmenes de salud después de que The Guardian documentara varios casos problemáticos. Aun así, el patrón se mantiene: AI Overviews reduce la tasa de clics hacia los resultados tradicionales, cita con frecuencia fuentes distintas a las que aparecen en el ranking orgánico y esas fuentes tienden a ser menos estables a lo largo del tiempo.
El problema de fondo no es exclusivo de Google —todas las búsquedas generativas tienen dificultades para verificar antes de responder—, pero el impacto a largo plazo va más allá del usuario individual. Menos clics hacia las fuentes originales significa menos incentivo para producirlas, lo que deteriora precisamente la materia prima de la que dependen estos sistemas para funcionar.
Fuente: Ars Technica, The Guardian, Blog de Google



