Rambler's Top100
НОВОСТЬ

За последние 10 лет четверть контента исчезла из интернета

[10:00 17 июня 2024 года ]

Интернет часто воспринимают как место, где контент хранится вечно. Но, как показало новое исследование, огромные объемы информации теряются при удалении или перемещении страниц. Исследование под названием “Когда онлайн-контент исчезает” опубликовано на сайте Pew Research Center.

В интернете насчитываются сотни миллиардов проиндексированных веб-страниц. Как показал анализ, онлайн-контент не вечен.

По состоянию на октябрь 2023 года четверть всех веб-страниц, существовавших в период с 2013 по 2023 год, больше не доступны. Причем чем старее контент, тем меньше шансов у него сохраниться: около 38% веб-страниц, существовавших в 2013 году, сегодня недоступны, по сравнению с 8% страниц, существовавших в 2023 году.

Этот “цифровой распад” происходит во многих онлайн-пространствах: на правительственных и новостных сайтах, в разделе “Ссылки” на Википедии, в соцсетях.

Также анализ показал следующее:

  • 23% новостных веб-страниц содержат хотя бы одну неработающую ссылку;
  • 21% веб-страниц правительственных сайтов содержат хотя бы одну неработающую ссылку;
  • новостные сайты с высоким и низким уровнями посещаемости примерно с одинаковой вероятностью содержат неработающие ссылки;
  • веб-страницы местных органов власти особенно часто имеют неработающие ссылки;
  • 54% страниц Википедии содержат хотя бы одну ссылку в разделе “Ссылки”, указывающую на страницу, которая больше не существует;
  • почти каждый пятый твит не виден всего через несколько месяцев после публикации (в 60% случаев из-за закрытия, удаления или блокировки учетной записи, в 40% — из-за удаления твита владельцем, чья учетная запись продолжает существовать).

Причем некоторые типы твитов имеют тенденцию исчезать чаще, чем другие. Более 40% твитов на турецком и арабском языках перестают быть видны на сайте в течение трех месяцев после публикации. 

Для проведения анализа была собрана случайная выборка в почти миллион веб-страниц из архивов интернет-службы Common Crawl. Исследователи отбирали страницы, собираемые Common Crawl каждый год с 2013 по 2023 год (приблизительно 90 000 страниц в год), и проверяли, существуют ли они сегодня.

Добавить в FacebookДобавить в TwitterДобавить в LivejournalДобавить в Linkedin

Что скажете, Аноним?

Если Вы зарегистрированный пользователь и хотите участвовать в дискуссии — введите
свой логин (email) , пароль  и нажмите .

Если Вы еще не зарегистрировались, зайдите на страницу регистрации.

Код состоит из цифр и латинских букв, изображенных на картинке. Для перезагрузки кода кликните на картинке.

НОВОСТИ
АНАЛИТИКА
ДАЙДЖЕСТ
ПАРТНЁРЫ
pекламные ссылки

miavia estudia

(c) Укррудпром — новости металлургии: цветная металлургия, черная металлургия, металлургия Украины

При цитировании и использовании материалов ссылка на www.ukrrudprom.ua обязательна. Перепечатка, копирование или воспроизведение информации, содержащей ссылку на агентства "Iнтерфакс-Україна", "Українськi Новини" в каком-либо виде строго запрещены

Сделано в miavia estudia.