Рубрика развивается при поддержке
Advertisement

Исследование: Как быстро «умирают» ссылки в интернете — в статьях NYT 20-летней давности не работают 72% источников Статьи редакции

По мнению авторов работы, ведущие в никуда ссылки — проблема не только журналистики, но и всего интернета.

Группа сотрудников Гарвардской школы права вместе с журналистами The Times оценили уровень надёжности интернета как хранилища информации на примере ссылок в статьях The New York Times. Оказалось, что более половины статей NYT, начиная с 1996 года, частично или полностью ссылаются на «мёртвые» страницы, что подрывает доверие к журналистике и снижает информационную ценность контента.

Исследователи рассмотрели более 553 тысяч статьей, которые содержат внутри себя почти 2,3 миллиона ссылок на внешние сайты. Около 6% из них «умерли» только за три последних года, а если считать с 1998 года, то доля «мёртвых» ссылок в статьях превышает 72%. Такие ссылки могут вести на плашку с ошибкой 404 («Не найдено») или перенаправлять на главную страницу целевого сайта — но бывают варианты и похуже.

Процент «умерших» ссылок (кирпичный цвет) в статьях The New York Times по отношению к их общему количеству (светло-салатовый цвет) Изображение Columbia Journalism Review

Вокруг «мёртвых» ссылок на крупных ресурсах выстроена целая теневая индустрия. Если такая ссылка ведёт на несуществующий сайт, то его могут «реанимировать» на заказ с тем же доменом и такой же адресацией до конкретной страницы. Но вместо оригинальной информации на этой странице могут разместить рекламу или страницу с прямо противоположной информацией.

Например, в 2011 году член Верховного суда США Сэмюэл Алито высказал особое мнение касательно отмены запрета на продажу «жестоких» видеоигр детям в Калифорнии, сопроводив его ссылкой на подробное объяснение своего мнения. Но эта ссылка быстро «умерла» и стала вести на плашку с насмешливым сообщением.

Here's the opinion of the U.S. Supreme Court in a case about whether California can restrict the sale to kids of video games portraying violence. Justice Alito wrote a concurrence, and linked to a web site as he explained his reasoning. https://t.co/pb6cPbOZit
«Это мнение члена Верховного суда США о том, может ли Калифорния ограничивать продажу детям видеоигр, изображающих насилие. Судья Алито согласился с такой возможностью и дал ссылку на сайт с объяснением своего мнения»
Here's what visitors to the opinion's link saw shortly after Justice Alito's opinion was released. https://t.co/nFRSePxLFY
«Вот что увидели перешедшие по ссылке вскоре после того, как судья Алито опубликовал своё мнение»
And that, in turn, has gone away! Now the Supreme Court's official reports are pointing to this message. https://t.co/BDUFIZxYfT
«Но и то, в свою очередь, ушло! Теперь официальные отчёты Верховного суда указывают на это сообщение»

Авторы исследования считают, что рост числа «умерших» ссылок — большая проблема не только для журналистов, но и для всего интернета. Точечным решением могут стать архивирующие сервисы вроде Wayback Machine или Perma.cc, но глобально они вряд ли могут изменить текущую тенденцию к распаду контекста повествований и исчезновению источников информации.

{ "author_name": "Никита Логинов", "author_type": "editor", "tags": ["\u0438\u0441\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u043d\u0438\u044f","\u0438\u043d\u0442\u0435\u0440\u043d\u0435\u0442"], "comments": 35, "likes": 74, "favorites": 32, "is_advertisement": false, "subsite_label": "tech", "id": 386099, "is_wide": true, "is_ugc": false, "date": "Mon, 24 May 2021 13:53:41 +0300", "is_special": false }
0
35 комментариев
Популярные
По порядку
Написать комментарий...

Вы бы лучше такое иссоедование на тж провели... сколько материалов утеряно... deleted.... а я потерял около 350 подписчиков....

31

Из-за подписчиков не бурчи. А некоторые материалы пятилетней давности сложно найти на ТЖ

1

На ТЖ вообще сложно что-то найти, легко потерять и невозможно забыть

12

как боженька смолвил!

1

а из за чего мне бурчать

0

Бурчи на меня

1

бурбурбурбупрбурбурбурбурбур

1

Как я тебя прекрасно понимаю!

1

ты вахтёру в жилетку плакался, теперь здесь на жалость давишь, без своих пезд подписчеков на голубом глазу тут льешь крокодильи слезы

1

А что плохого то
Я плакса

–1

ну епс

0
Запасной танк88

да я блять не могу найти посты за 2019 год потому что ПОИСКА ПО ДАТЕ НЕТ, СПАСТБО

1
Запасной танк88

Бесит, когда на stackoverflow вместо ответа дают ссылку на другой вопрос с ответом, которые уже удалены.
За такое уголовное наказание нужно вводить

19
Запасной танк88
3
Запасной танк88

Комментарий удален по просьбе пользователя

3

Хорошая идея. И эти скриншоты тоже встраивать в страницу. Ещё нужно с десяток скриптов прикрутить, а то страницы с текстом по 100 мб это как-то мало. 

7
Запасной танк88

Комментарий удален по просьбе пользователя

–1

Если ты пишешь статью "на века" или что-то техническое, то смело можно делать копию страниц в pdf и выкладывать их в хранилище в конце статьи. Опять же, а если в стать на которую ты ссылаешься тоже имеет ссылки, как быть с ними? Весь интернет не сохранить.  ред.

4

Текстовая версия страницы без верстки будет занимать несколько килобайт

3

Заверять скриншоты будет твой персональный следователь, когда обвинит в критике власти

1

Хороший ответ

1
Запасной танк88

очень много всего дохнет

4

Нужно как-то тэгать потенциально важные статейки, а какой-нибудь webarchive будет их обязательно сохранять себе. В общем, нужная целая система, но денег на это никто не даст

2

На моей стене в ВК, которую веду с ~2008 года, около 90% постов с ссылками уже не работают, но благо есть описание и многие видосы можно найти по описанию) 

2

Как думаете, если хостинги станут бесплатными и не надо будет их постоянно продлевать, ситуация изменится?

1
Запасной танк88

Этот хостинг называется archive.org

2

Но это реально точечное решение и не решение всех проблем

2

Ну, для СМИ очень даже решение

5

если не сохранять страницы вручную, то можно и не вернуть их 

1

архивирующие сервисы вроде Wayback Machine или Perma.cc, но глобально они вряд ли могут изменить текущую тенденцию к распаду контекста повествований и исчезновению источников информации.

Что значит врядли? Прогнать скрипт, который все ссылки из новости добавит в архив не так сложно. И в статье потом ссылки на архивы эти повесить. Можно даже прогнать скрипт на старых статьях, чтобы хотя бы выжившие ссылки заархивировать. Тут делов на один вечер, уж крупные новостные сайты могут такое провернуть

1

Ссылки умирают быстрее, чем люди.

1

кирпичный цвет

1

Был в ярости когда пол года назад так и не смог найти нигде сорсы openssl 1.x.x ¯\_(ツ)_/¯

1
Читать все 35 комментариев
null