互联网是现代生活中不可或缺的宝库,但即使全世界每天都依赖网络来获取各种资源,这些内容最终也有可能从人们的视野中消失。近日,一项研究发现,当前的在线内容仍然非常短暂。
研究人员从互联网档案服务Common Crawl中收集了大约10万个网页的快照,并检查这些样本在当下是否还存在。结果显示,在2013年存在的网页中,到2023年10月为止已经有约25%至30%无法访问。这些无法访问的页面包含了两种情况:一是域名仍然存在但其中某些页面已经失效;二是连域名都不再存在。
具体来看,在抽样调查的新闻网站中,约23%的网页至少包含一个失效链接。无论是高流量还是低流量的新闻网站,在此方面表现相似。排名前20%的新闻网站中,约25%的页面至少包含一个失效链接;而排名后20%的网站中,则是26%。
此外,研究人员还对维基百科进行了观察。他们选择了维基百科中的“参考链接”部分,并发现其中11%的链接已经失效;同时,在社交媒体平台上发布的近500万条推文样本中,有接近18%的内容在3个月内就已经不可见。
其中有一半是因为账号被设为私密、被冻结或注销;另外一半是因为账号发布者自己删除了相关推文,但是账号本身仍活跃。这项研究表明,在线内容仍然非常短暂且不稳定。