Páginas

03 junho 2024

Desaparecimento de artigos da internet

Uma nova pesquisa do Pew Research Center nos EUA conclui que 38% de todas as páginas da web que existiam em 2013 não são mais acessíveis devido a um fenômeno que eles chamam de “decaimento digital”.

Quando os pesquisadores estenderam o prazo, eles descobriram que cerca de um quarto de todas as páginas da web criadas de 2013 a 2023 não existem mais. Desse número, 8% dessas páginas foram criadas em 2023.


“A internet é um repositório inimaginavelmente vasto da vida moderna ... mas mesmo que os usuários de todo o mundo confiem na web para acessar livros, imagens, artigos de notícias e outros recursos, esse conteúdo às vezes desaparece da vista”, diz o estudo.

A pesquisa definiu links inacessíveis como uma página que não existe mais em um servidor host (mostrando uma mensagem 404 não encontrada).

Os pesquisadores coletaram uma amostra aleatória de páginas da Web do Common Crawl, uma pesquisa de arquivo na internet que tira um instantâneo de como a internet se parece a qualquer momento.

A equipe experimentou cerca de 90.000 páginas de internet por ano de 2013 a 2023 para ver se elas ainda existem.

Eles descobriram na Wikipedia que cerca de 54% das páginas analisadas tinham pelo menos um link quebrado na seção de referências.

Cerca de 23% dos sites de notícias continham um link quebrado, enquanto 21% das páginas do governo o fizeram.

Fonte: aqui.

O problema pode acontecer também em periódico. Alguns podem ter publicados pesquisas interessantes e que irão desaparecer. O gráfico abaixo é outra versão do mesmo assunto:


Eis uma outra visão:

Em 2021, estimava-se que um quarto dos links profundos no site do NYT estavam quebrados, enquanto a pesquisa recente do Pew descobriu que 21% dos sites governamentais e 23% das páginas de notícias tinham pelo menos um link quebrado — um problema claro na era da desinformação, quando a rastreabilidade das fontes é mais importante do que nunca e URLs inativas podem ser compradas e alteradas para exibir qualquer coisa.

A internet das coisas (mortas)

As descobertas mais recentes surgem enquanto os defensores da “teoria da internet morta”, que postula que a web foi colonizada por bots que estão gerando a maioria do conteúdo que encontramos online, se tornam mais fervorosos. De fato, alguns comentaristas agora argumentam que entramos na era da “internet zumbi”, onde entidades que antes eram operadas por humanos agora são fazendas de conteúdo automatizadas publicando imagens geradas por IA de Jesus camarão ou comissárias de bordo cristãs devotas.

[P.S. Quem fez esta postagem foi um ser humano]

Nenhum comentário:

Postar um comentário