Pesquisa mostra quantos links importantes na web se perdem com o tempo
Os hiperlinks são uma ferramenta poderosa, tanto para SEO quanto para melhorar o entendimento dos leitores. No entanto, a perda de material de referência pode ter impactos negativos no SEO e resultar na perda de contexto ou conteúdo.
Uma equipe da Harvard Law, em colaboração com a equipe digital do New York Times, conduziu um estudo sobre hiperlinks desde o lançamento do site do Times em 1996 até 2019. Nesse estudo, foram examinados 553.693 artigos e descobriu-se que havia 2.222.845 hiperlinks apontando para conteúdo externo, dos quais 72% direcionavam para uma página específica e 25% estavam inacessíveis.
Além disso, a pesquisa revelou que, ao longo do tempo, os links tinham maior probabilidade de se tornarem inválidos. Enquanto apenas 6% dos links de 2018 estavam podres, esse número aumentou para 43% dos links de 2008 e 72% dos links de 1998. Surpreendentemente, mais da metade de todos os artigos (53%) continham pelo menos um link inválido.
A análise também avaliou a prevalência de redirecionamento de conteúdo. Ao pegar 4.500 URLs de links intactos, constatou-se que 13% deles haviam mudado significativamente, apontando para informações diferentes daquelas referenciadas no artigo original quando foi publicado. Além disso, 4% dos links publicados em artigos de 2019 foram desviados, em comparação com 25% dos links acessíveis de 2009.
Outro estudo conduzido pela Harvard Law mostrou que os códigos de erro 400 ou 500 (incluindo 404, 503, etc.) são quase sempre indicativos de links inválidos, com exceção de quando uma página da web está temporariamente indisponível. No entanto, um código 200 não garante que a fonte esteja presente; a página pode exibir arrependimentos, ser redirecionada ou ter mudado de conteúdo, o que torna mais difícil detectar a invalidade do link.
Algumas iniciativas já estão em andamento para preservar os links, como o Internet Archive, que hospeda milhares de arquivos. Outro exemplo é o Projeto Perma.cc, desenvolvido pela Harvard Library Innovation Lab, que busca corrigir o problema de links inválidos em citações legais e periódicos acadêmicos, fornecendo uma versão arquivada da página com um link para a fonte original. A Wikipédia também incentiva os colaboradores a arquivar documentos referenciados em serviços de arquivamento, como Wayback Machine e archive.today, caso acreditem que um artigo possa sofrer alterações.
Esse estudo destaca a natureza volátil da Web e aponta para a necessidade de novas práticas, fluxos de trabalho e tecnologias para lidar com a questão dos links inválidos. Embora existam esforços para melhorar essa situação, o problema ainda está longe de ser completamente resolvido.