A Internet tem um problema que, para muitos, pode na verdade ser um alívio, ou mesmo uma vingança: quase o 40% das páginas web de 10 anos atrás ou mais eles não estão mais acessíveis e remetem ao famoso “404: Página não encontrada” (aliás, você sabe como deletar o histórico do navegador?).

Estamos falando sobre o que é chamado de “decadência digital“, que de acordo com um relatório da Centro de Pesquisa Pew é particularmente grave e lança uma sombra sobre as fontes de um série de artigoscomo os que podemos encontrar em Wikipédia.

De acordo com o artigo publicado pela Centro de Pesquisa Pew um quarto de todos os que existiram entre 2013 e 2023 já não estão disponíveis.

Essa tendência é mais agressiva para conteúdos mais antigos, já que o 38% das páginas da web de 2013 não está mais acessível, enquanto para os de 2023 estamos falando do 8% que de qualquer maneira não é um valor tão baixo.

O fenômeno, conhecido como “decadência digital“, não afeta apenas páginas da web, mas também tweets. Aprox. um quinto de todos os tweets não é mais visível alguns meses depois de terem sido publicados, porque a conta se tornou privado, era suspenso ó excluído.

Além disso, alguns tweets tendem a desaparecer mais rápido de outros. Por exemplo, os tweets escritos em turco ou árabe têm maior probabilidade de desaparecer do que os tweets escritos em outras línguas (estamos falando de cerca de 40% deste conteúdo desaparecendo dentro de três meses após a publicação).

Como dizíamos, para muitos poderia ser uma vingança, depois de durante anos terem sido informados de que o que se publica no Internet e para Sempre, mas na realidade é um problema.

Por que? Pense sobre Wikipédia: existem muitas guias nas quais as fontes não estão mais acessíveis. Mas isto também se aplica a sites do governo ou mesmo aqueles de notícias.

Segundo o site Columbia Journalism Review, que já havia reconhecido esse perigo em 2021, isso significa que o conteúdo de referência não poderá mais ser acessado, portanto não será mais possível compreender o contexto de um artigo.

Não só isso, mas num estudo de 2014 foi visto como no Estados Unidos quase metade de tudo hiperlinks nas opiniões da Suprema Corte levaram a conteúdos diferentes dos deles publicação original ou eles desapareceram da Internet.

Infelizmente, isto torna certos tipos de investigação extremamente difíceis ou quase impossíveis.

Há uma solução, porém, pelo menos parcial: o Internet Archive, uma biblioteca digital sem fins lucrativos que oferece um espaço digital permanente para acesso a diversos tipos de recursos, incluindo Sites.

O site permite recuperar bilhões de páginas da Internet, salvas automaticamente por seu rastreador da web que trabalham para preservar ao máximo a web pública, também por meio de uma extensão conveniente para o Chrome. Claro que você não encontrará tudo o que foi publicado, mas uma boa parte e utilizamos com frequência para monitorar as mudanças nos sites ao longo do tempo.

Curiosamente, enquanto escrevíamos este artigo o site da O Arquivo da Internet não estava acessível, negando acertadamente o que acabava de ser afirmado.