Loading ...

Um em cada três novos sites é feito por IA, revela estudo

Resumo
  • Estudo revela que 35% das páginas criadas desde 2022 utilizam modelos de linguagem.
  • O levantamento foi conduzido por pesquisadores da Universidade de Stanford, do Imperial College London e do Internet Archive.
  • Eles analisaram amostras de sites arquivados pela Wayback Machine e identificaram padrões de texto automatizado.

Um em cada três sites criados desde 2022 já conta com algum nível de produção por inteligência artificial. É o que mostra um estudo conduzido por pesquisadores da Universidade de Stanford, do Imperial College London e do Internet Archive.

Segundo o levantamento, até meados de 2025 cerca de 35% das novas páginas publicadas na internet foram classificadas como geradas ou assistidas por IA. Antes do lançamento do ChatGPT, no fim de 2022, esse número era praticamente inexistente.

Para chegar a esses dados, os pesquisadores analisaram amostras de sites arquivados pela Wayback Machine entre agosto de 2022 e maio de 2025. O grupo utilizou o software Pandram v3 para identificar padrões de texto automatizado e medir a presença de conteúdo gerado por modelos de linguagem.

Ao 404 Media, Jonáš Doležal, pesquisador de Stanford e coautor do estudo, diz que a velocidade dessa mudança chama atenção. Segundo ele, em poucos anos a IA passou a ocupar uma fatia relevante de um ambientes que levou décadas para ser construído por humanos.

Uma internet mais “uniforme”

Os autores também buscaram entender como o avanço afeta a forma como o conteúdo é produzido. Inspirados por debates como o da chamada Teoria da Internet Morta — a ideia de que grande parte da rede é composta por robôs interagindo entre si —, eles testaram diferentes hipóteses sobre o impacto da IA na web.

Duas delas, relacionadas ao estilo textual, foram confirmadas. De acordo com o estudo, conteúdos gerados por IA tendem a ser mais “alegres” e menos prolixos.

Ao mesmo tempo, há sinais de perda de diversidade estilística e de vocabulário, levando a uma espécie de “monocultura” digital, em que um padrão de escrita domina e substitui diferentes tons de voz. Falamos sobre esse impacto da IA na internet no Tecnocast 355 — A Teoria da Internet Morta.

O que o estudo não encontrou

Apesar do impacto textual, surpreedentemente o estudo não identificou crescimento de informações comprovadamente falsas nem queda relevante no uso de fontes.

O resultado chama atenção porque contraria a percepção de que a IA teria alavancado informações falsas ou enganosas. O argumento é usado, inclusive, pela imprensa brasileira no inquérito contra algumas das tecnologias do Google, como os Resumos de IA.

Em paralelo, o levantamento também comparou esses resultados com a percepção de usuários. Embora parte do público associe o avanço da IA a uma piora na qualidade da informação, esse efeito não apareceu de forma clara nos dados analisados.

Gráfico de linha mostra a evolução da presença de conteúdo gerado por IA na internet entre julho de 2022 e meados de 2025. A linha vermelha indica a proporção de sites totalmente gerados por IA, enquanto a linha roxa inclui conteúdos gerados ou assistidos por IA. Os dados, baseados em amostras do Internet Archive analisadas pelo Pangram v3, revelam crescimento acentuado após novembro de 2022 — marcado por uma linha tracejada que indica o lançamento do ChatGPT —, com a participação chegando a cerca de 35% no cenário mais amplo até 2025.
Conteúdo gerado por IA dispara na web após o lançamento do ChatGPT (imagem: reprodução/AI on the internet)

Uma das explicações levantadas pelos autores é que a própria internet já opera, historicamente, com diferentes níveis de rigor na verificação de informações.

De acordo com o 404 Media, os pesquisadores pretendem aprofundar a análise para entender quais tipos de sites e idiomas estão mais sujeitos ao uso de IA.

A ideia é transformar o estudo em uma ferramenta de monitoramento contínuo, em parceria com o Internet Archive, capaz de acompanhar em tempo real a evolução da presença de conteúdo gerado por IA na web.

Um em cada três novos sites é feito por IA, revela estudo

Rolar para cima