Estudio encuentra que el 35% de los nuevos sitios web utilizan IA, lo que genera un tono excesivamente optimista en línea
Investigadores de Imperial College London, Stanford University y el Internet Archive han publicado un prepublicado que cuantifica la difusión de contenido generado por inteligencia artificial en la web pública. Al muestrear instantáneas de la Wayback Machine, el equipo identificó que aproximadamente el 35 por ciento de los sitios creados desde 2022 hasta 2025 fueron completamente generados por IA o fuertemente asistidos por grandes modelos de lenguaje.
Para llegar a esa cifra, los investigadores probaron cuatro enfoques de detección antes de establecerse en una herramienta de Pangram Labs, que entregó los resultados más consistentes a pesar de las imperfecciones reconocidas. La muestra, extraída del gran repositorio del Internet Archive, estaba destinada a representar el ecosistema más amplio de nuevas páginas web.
El titular más destacado del estudio es el aumento en el lenguaje positivo. El análisis de sentimiento muestra que las páginas escritas por IA tienen un puntaje de sentimiento positivo aproximadamente un 107 por ciento más alto que sus contrapartes creadas por humanos. Los investigadores describen el efecto como una "alegría artificial" que hace que el tono general de la escritura en línea se sienta excesivamente optimista.
Más allá del tono, el análisis sugiere una reducción de los puntos de vista. Utilizando métricas de similitud semántica, el equipo encontró que los sitios impulsados por IA son aproximadamente un 33 por ciento más similares en contenido que los sitios escritos por humanos, lo que indica una disminución en la diversidad ideológica en la web.
Cuatro hipótesis que los investigadores entraron en el estudio resultaron falsas. Contrariamente a la creencia popular, los datos no mostraron un aumento en la desinformación vinculada al contenido de IA. De manera similar, las páginas generadas por IA eran tan propensas a incluir enlaces salientes como las páginas escritas por humanos, y el estilo de escritura no se aplanó en una voz genérica.
"Todos en el equipo esperaban que eso fuera cierto", dijo el investigador de Stanford Maty Bohacek, señalando la sorpresa por la falta de evidencia para una homogeneización estilística. "Pero simplemente no tenemos evidencia significativa para eso". Los hallazgos inesperados resaltan cómo las suposiciones sobre los grandes modelos de lenguaje pueden adelantarse a la realidad empírica.
Antes de que comenzara el trabajo técnico, el equipo encargó una encuesta pública sobre las actitudes hacia el contenido escrito por IA. Los encuestados anticiparon en gran medida un aumento en las noticias falsas, una disminución en los enlaces externos y un estilo de escritura uniforme y aburrido, resultados que el estudio finalmente no confirmó. La discrepancia entre la percepción y la medición subraya una brecha más amplia en la comprensión pública de los efectos reales de la IA.
Los autores enfatizan que esta investigación es un paso inicial, no un veredicto final, sobre cómo la IA redefine la internet. Esperan que los datos estimulen investigaciones más profundas sobre las formas matizadas en que los grandes modelos de lenguaje influyen tanto en el tono como en la diversidad del discurso en línea.
Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas