{"id":1015,"title":"\u0410\u043b\u044c\u0431\u043e\u043c \u043e \u043b\u044e\u0431\u0432\u0438 \u0432\u043e \u0432\u0440\u0435\u043c\u044f \u0432\u043e\u0439\u043d\u044b \u0431\u0435\u0437 \u0435\u0434\u0438\u043d\u043e\u0433\u043e \u0441\u043b\u043e\u0432\u0430 ","url":"\/redirect?component=advertising&id=1015&url=https:\/\/tjournal.ru\/umg\/472440-poslushat-novoe-oulavyur-arnalds-i-strunnyy-kvartet&placeBit=1&hash=2f79f2d1dce5a3269d2e27f43f5810c5215f9449ef7975dca45f4a27e2574b04","isPaidAndBannersEnabled":false}

Интернет умер, да здравствует интернет: как «вымирают» ссылки времён нулевых и кто борется за их сохранность Статьи редакции

Сеть оказалась ненадёжным хранилищем, и многие данные утрачены безвозвратно — почему это случилось и можно ли как-то предотвратить.

Фото Getty

Представьте: вы ищете в интернете информацию об исполнителе, поднявшемся на вершину хит-парада летом 2001 года, или событии, произошедшем в конце весны 2002-го. Разумеется, вы заходите в «Википедию» и читаете общие сведения, но их недостаточно. Стремясь узнать больше, вы кликаете по всем ссылкам в конце статей, но раз за разом попадаете на неработающие сайты.

Всё дело в том, что интернет нулевых мёртв. Стараясь найти источники событий тех времён, вы словно идёте по кладбищу: здесь выдаёт ошибку, тут — просрочен домен, там — вообще ничего никогда не было. Казалось, что все загруженные в сеть фотографии и записи останутся в ней навсегда, но теперь ссылки начала века либо бесследно исчезли, либо работают только через веб-архив.

Что происходило в интернете нулевых и как умирали известные всем сайты

20 лет назад интернет выглядел совершенно иначе: сайты отличались пестротой, фоновой музыкой и большим количеством анимации. Тогда уже работал «Яндекс» (правда, выглядел совсем не так), но необходимую информацию пользователи искали ещё и через Aport и Rambler, общались в комнатах чата «Кроватка» и читали новости на «Вебпланете».

Перечисленные сайты (опять же кроме «Яндекса» и «Рамблера») уже не работают. Если перейти по ссылке aport.ru, то можно увидеть не поисковик, а прайс-агрегатор, похожий на «Яндекс.Маркет». В таком виде он существует с 2012 года, когда компанию за 150 тысяч долларов выкупил директор сайта Mamba.ru Андрей Бронецкий.

«Кроватка» тоже мертва, по старой ссылке «висит» мемориальная табличка с надписью «Krovatka.ru. 1996-2020. Это было лучшее время». Сайт работал как онлайн-чат с 25 каналами, среди которых — «Знакомства», «Любовь», «Кому за 30», «Искусство» и «Компьютеры». За порядком следили модераторы, которые блокировали нарушающих правила пользователей.

Причины закрытия сайта не объявлялись, но в 2016 году один из его авторов Андрей Куля рассказывал «Секрету Фирмы», что с появлением соцсетей чат покинула «львиная доля пользователей». «Когда появился LiveInternet, люди начали уходить потихонечку, потом появился Skype. Аудитория всё равно была, но прекратился прогрессивный рост. Потом начали появляться соцсети — «ВКонтакте», «Одноклассники» — народ ушёл туда», — говорил он.

«Вебпланета», созданная Денисом Крючковым, позднее открывшим одно из крупнейших IT-сообществ «Хабрахабр», не обновляется ещё дольше. Интернет-издание закрылось в конце 2011 года. Причины решения не объявлялись, но, по данным Lenta.ru, дело в убыточности проекта. Главный редактор проекта Лёха Андреев сообщил изданию, что «всё живое тем и отличается, что когда-нибудь умирает».

Сайты нулевых закрываются каждый год — иногда целыми «пачками». В апреле 2019 года Google закрыл проработавшую восемь лет соцсеть Google+. Она обладала всеми типичными атрибутами, например, возможностью обновлять статус, размещать фотографии в ленте и созваниваться по видеосвязи. В первые недели после запуска в сервисе зарегистрировалось несколько миллионов пользователей, но соцсеть так и не стала популярной.

«Я открываю новостную ленту, но вижу пустую страницу, на которой ничего не происходит. Это огромная пустошь, которая отличается обилием зарегистрированных людей, так и не начавших использовать сервис, потому что они не разобрались в его работе», — писал журналист Forbes Пол Тасси вскоре после запуска платформы.

Владельцы обосновывали закрытие низкой популярностью сервиса и проблемами с защитой данных пользователей. Эксперты говорили, что соцсеть была неудобной: в Google+ постоянно менялся интерфейс, блокировались люди с псевдонимами и удалялись страницы брендов. Консультант по работе с соцсетями Мэтт Наварра отмечал, что из-за этого «незавидная участь сервиса была предрешена с первого дня».

Несколько проектов закрыла Yahoo: в 2001 году они прекратили работу интернет-радио Broadcast.com, существовавшего с 1995 года и выкупленного тремя годами ранее. Компания приобрела успешный проект с 570 тысячами пользователей, каждый из которых оценивался в десять тысяч долларов, но отключила сервис из-за спада популярности отрасли.

В мае 2021 года Yahoo закрыла один из старейших сервисов вопросов и ответов Yahoo Answers. Понятная аналогия для культуры рунета — это как если бы из сети безвозвратно удалили миллионы обсуждений с «Ответов Mail.ru». На сайт больше нельзя зайти — пользователям разрешили скачать часть вопросов и ответов по предварительной заявке, но и эту функцию закрыли уже в июне. При этом общий архив сервис создавать отказался. Причиной прекращения работы в Yahoo! назвали опять же падение популярности.

Исчезают и мессенджеры — естественно, вместе с хранящейся в них информацией. Яркий пример: браузерный клиент AOL, работавший ровно 20 лет, закрылся в декабре 2017 года. В прощальном письме вице-президент Oath Майкл Альберс признал, что с 1990-х годов средства общения изменились, а сам мессенджер проиграл борьбу SMS, WhatsApp и другим соцсетям.

Иногда утрата сайтов связана с историческими процессами: например, так произошло с Югославией. По словам директора института веб-науки при Саутгемптонском университете Дам Венди Холл, домен .yu являвшийся доменом верхнего уровня для Югославии, прекратил существование после распада страны. «Есть исследователь, который пытается восстановить то, что там было», — отмечает специалистка.

Как к полной или частичной потере данных приводит реформирование сайтов или неактивность пользователей

Иногда сайты не умирают, а модернизируются, что в лице пользователей выглядит как «частичная смерть»: во время реформирования исчезают целые разделы, а вместе с ними — информация. Так, например, произошло с MySpace: в 2019 году из-за неудачного переноса сервера исчезло всё содержимое профилей и вся музыка, загруженная до 2015 года.

Переживать о потере снимков пришлось и владельцам аккаунтов на Flickr и Webshots — но по причине смены владельцев. Когда в первую компанию пришёл SmugMug, пользователям предписали купить платную подписку или «расстаться» со всеми фотографиями, кроме последней тысячи. BuzzFeed предполагает, что в результате удалили «огромное количество фотографий», многие из которых выложили люди «не беспокоившиеся об их пропаже».

Webshots, успешно работавший в 2000-е годы как сервис для обмена фотографиями, компания American Greetings превратила в сайт обоев для рабочего стола. Пользователи только за два месяца узнали, что все их файлы удалят, если они не купят платный аккаунт. Такая же история случилась и с платформой с обзорами книг и музыки Xanga — в 2013 году сервис удалил блоги пользователей, которые не заплатили за pro-аккаунт.

Информация может пропадать из интернета и автоматически: это касается электронных почт и мессенджеров. Если не заходить в Telegram несколько месяцев, то он удалит учётную запись, а вместе с ней — все переписки и файлы. С ноября 2019 года такую же политику имеет и Twitter — аккаунт нужно не посещать полгода.

Почему «смерть интернета» — это проблема: для закона, науки и вообще всех сфер жизни

Исчезновение информации приводит к тому, что пользователи перестают доверять интернету и компаниям, которым принадлежат сайты. В случае нерентабельности, смены курса бизнеса или претензий со стороны государственных властей и крупных компаний твой профиль и всю информацию могут удалить без возврата.

Часто вымирание ссылок приводит к серьёзным последствиям — например, когда один сайт закрывается, а на его месте умышленно или случайно появляется другой. Всё это приводит к ситуации, когда нельзя быть уверенным в собственноручно проставленных ссылках.

В 2010 году американский судья Самуэль Алито высказал особое мнение касательно отмены запрета на продажу «жестоких» видеоигр детям в Калифорнии и сопроводил его ссылкой на подробное объяснение своего мнения. Вскоре после публикации текста все, кто перешли по ней, увидели совсем не то, что хотел судья.

«Разве вы не рады, что не процитировали эту веб-страницу в отчёте Верховного суда по делу Браун <...>. Если вы сделали это, как это сделал судья Алито, исходный контент давно бы исчез, и кто-то другой мог бы прийти и купить домен, чтобы прокомментировать быстроту связанной информации в эпоху интернета», — говорилось в сообщении по ссылке.

Here's what visitors to the opinion's link saw shortly after Justice Alito's opinion was released.
«Вот что увидели перешедшие по ссылке вскоре после того, как судья Алито опубликовал своё мнение»
And that, in turn, has gone away! Now the Supreme Court's official reports are pointing to this message.
«Но и то, в свою очередь, ушло! Теперь официальные отчёты Верховного суда указывают на это сообщение»

Вокруг «мёртвых» ссылок на крупных ресурсах выстроена целая теневая индустрия. Если такая ссылка ведёт на несуществующий сайт, то его могут «реанимировать» на заказ с тем же доменом и такой же адресацией до конкретной страницы. Но вместо оригинальной информации на этой странице могут разместить рекламу или страницу с прямо противоположной информацией.

Но это только один из примеров. По данным исследования, опубликованного в Harvard Law Review в марте 2014 года, 50% ссылок из судебных заключений Верховного суда с 1996 года, когда гиперссылку использовали впервые, больше не работают. Тоже самое произошло и с Harvard Law Review: учёные выяснили, что 75% ссылок из журнала нельзя открыть.

Журналисты The Atlantic и The New York Times проанализировали около двух миллионов внешних ссылок, публиковавшихся в статьях на сайте NYT, и выяснили, что 25% из них уже не работают. Чем старше статья, тем меньше вероятность, что из нее можно куда-то «перейти»: в материалах 1998 года не работают 72% ссылок.

Процент «умерших» ссылок (кирпичный цвет) в статьях The New York Times по отношению к пока ещё работающим (светло-салатовый цвет) Изображение Columbia Journalism Review

Такая ситуация приводит к разрыву цепочек информации, которыми и силён интернет в его идеальном виде. Зайдя на какой-либо сайт, вы можете перейти на другой сайт, а затем ещё один, тем самым находя истоки, причины и источники любого знания. Исчезновение ссылок нарушает такой порядок и часто затрагивает, например, специальное научное знание. Ситуация осложняется тем, что от бумажных аналогов хранения информации повсеместно отказываются, сосредотачиваясь на цифровом формате.

Например, как выяснили учёные из Принстонского университета ещё в 2001 году, количество URL-адресов в научных статьях растёт с каждым годом, но 53% из них не работают. Работа от 2014 года, объединившая 3,5 миллиона статей о науке и технологиях, показала, что каждая пятая из них не указывает на первоначальный источник.

Вымирание ссылок нарушает целостность и доказательную базу научных исследований. Учёным сложно на это повлиять, потому что за сохранность ресурсов ответственность несут не они, а владельцы сайтов. Попытки бороться самостоятельно сводятся к малоэффективным решениям: например, в журнале Cancer Research запрещено ставить ссылки на URL, а в российских изданиях обязательно ставить метку о дате последнего обращения к ресурсу.

Масштаб исчезновения ссылок показательно демонстрирует проект The Million Dollar Homepage Алекса Тью. 21-летний студент создал его в августе 2005 года, чтобы собрать деньги на обучение. На сайте с сеткой 1000 на 1000 пикселей за один доллар продавались места для ссылок. Все пиксели продали за 138 дней, но к 2014 году 22% из них вели уже на мёртвые веб-страницы.

Проблема исчезновения ссылок касается и TJ — статьи, вышедшие в первые годы существования сайта, доступны, но в них нет фотографий. Всё из-за переезда картинок на другой сервер. Например, можно показать текст про проект «Миллион пикселей», вышедший в марте 2014 года, но виджет получится некрасивый — именно из-за отсутствия иллюстраций.

Главная причина вымирания веб-страниц— децентрализация интернета. За сохранность информации ответственны владельцев конкретных сайтов, которые закрывают их, меняют структуру и ссылки, а иногда — просто забывают обновлять регистрацию домена.

Контент становится недоступен и в результате преднамеренных действий: например, в 2015 году BuzzFeed удалил более тысячи материалов, на которые жаловались рекламодатели и партнёры. Это коснулось статей с критикой рекламного контента компаний Axe, Microsoft Internet Explorer и Twitter.

Материалы СМИ, а иногда и целые сайты удаляют по требованию органов власти: например, летом в России заблокировали издания «МБХ Медиа» и «Открытой России», а «Проект» признали «нежелательной организацией». Из-за статуса последнего издания другие СМИ вынуждены удалять материалы со ссылками на его статьи по требованию Роскомнадзора.

Вымирание ссылок входит в сценарий «цифрового тёмного века» — теории, при которой из мира исчезнут все электронные данные, не имеющие бумажных эквивалентов. Концепция появилась ещё в 1990-е и отсылает к эпохе средних веков, отличавшейся почти полным отсутствием письменных свидетельств. Главный аргумент теории заключается как раз в том, что все цифровые данные постоянно исчезают.

Компьютерный терминал с лазерным диском, содержащим информацию из проекта «Би-би-си» «Судный день» Фото «Би-би-си»

Например, в 1986 году «Би-би-си» запустил проект «Судный день» в честь 900-летия книги Страшного суда — свода материалов, собранных по приказу Вильгельма Завоевателя про владения его королевства. Издание попросило жителей Великобритании задокументировать родные города — в акции поучаствовало более миллиона человека, они собрали фотографии, карты и видео-туры. Но к началу 2000-х годов оказалось, что все физические носители проекта сломаны или утеряны, а данные — утрачены.

Примечательно, что оригинальная Книга Страшного суда из 1086 года не потеряна, а хранится в государственном архиве в Кью и доступ к ней может получить любой желающий. «Иронично, что 15-летняя версия нечитаема, а древняя — всё ещё пригодна для использования. Нам повезло, что Шекспир не писал на старом ПК», — отмечал в разговоре с The Guardian компьютерный специалист Пол Уитли.

Какими способами пытаются спасти цифровые данные от исчезновения

Перспектива потерять всю цифровую информацию не вдохновляет человечество, поэтому общество пытается решить проблему хранения данных. В 1997 году опубликовали международный стандарт OAIS, определяющий подходы и решения в области электронного архивирования. Вслед за ним приняли ещё несколько документов, среди которых — Trusted Digital Repository, Digital Preservation Network (DPN), InterPARES Project и PRONOM.

Стандарты установили семь главных стратегий архивирования цифровых материалов:

  • консервации (работы с оригинальным форматами и носителями);
  • эмуляции (восстановления функциональности устаревших систем для работы с устаревшими форматами);
  • инкапсуляции (включения технического описания документа в состав самого цифрового объекта);
  • миграции (переноса на другие носители, например, с магнитной ленты на компакт-диск);
  • цифровой археологии (спасения устаревших или повреждённых цифровых объектов);
  • обновления (переноса с одного долговременного носителя на другой в качестве предупреждения потери данных);
  • веб-архивирования (сбора, сохранения и извлечения сайтов из интернета и перенос их в электронный архив).

Самый любопытный объект для сохранения информации — «Арктический мировой архив», открытый в марте 2017 года на архипелаге Шпицберген. В бункере, именуемом СМИ «вторым Хранилищем судного дня», находятся резервные данные на случай, если оригиналы повредятся из-за войн или стихийных бедствий.

Фото National Geographic

Вся информация хранится в убежище на сверхстойкой плёнке, покрытой порошком из оксида железа. По данным производителя, она способна выдержать до 750 лет в нормальных условиях и до двух тысяч лет в пещере с низким содержанием кислорода.

В октябре 2019 года компания Microsoft начала перенос всего исходного кода с GitHub в «Хранилище судного дня». На первую бобину записали код операционных систем Linux и Android и шесть тысяч других важных open-source приложений. К июлю 2020 года весь архив сайта размером в 21 терабайт (или 186 катушек) перенесли в бункер.

Шкаф с резервной копией данных на плёнке Фото Bloomberg Businessweek

Кто такие веб-архивисты и как они пытаются остановить вымирание ссылок

Сохранением непосредственно ссылок и сайтов занимаются веб-архивисты. Первым на проблему «смерти ссылок» обратил внимание Брюстер Кейл. Ещё обучаясь в Массачусетском технологическом институте он не принимал закрытость информации: чтобы попасть в юридическую библиотеку Гарварда и получить доступ к делам для своей работы, он использовал удостоверение профессора.

В 1996 году Кейл основал некоммерческую организацию Internet Archive, целью которой стало сохранение находящихся в интернете знаний. По его словам, главная сложность заключается в том, что в сети всё постоянно меняется: средний срок жизни веб-страниц составляет 90 дней, после которых они изменяются или исчезают.

Брюстер Кейл Фото «Архива Интернета»

Первые пять лет доступ к информации имела только администрация сервиса — все данные хранились на серверах «Архива». С 2001 года архивисты открыли доступ к сохранённым данным всем желающим. Первоначально организация работала только как веб-архив, но постепенно там стали сохранять книги, аудио, тексты Open Library и ПО. На декабрь 2021 года в архиве находится более чем 635 миллиардов страниц.

Веб-страницы сохраняются с помощью сервиса Wayback Machine, «паук» которого регулярно исследует доступные сайты и сохраняет их на специализированных серверах. Каждая новая копия страницы не перезаписывает предыдущую, а сохраняется отдельно с указанием даты добавления. Ссылки можно добавлять и вручную, если «паук» не добрался до нужной страницы.

Internet Archive известен несколькими крупными проектами: например, в 2000 году архивариусы вместе с Библиотекой Конгресса собрали информацию о политических кампаниях кандидатов на выборах президента США, а в 2001-м — о теракте в Нью-Йорке. Интересны и две коллаборации с «Википедией»: с заменой нескольких миллионов мёртвых ссылок на архивные копии и разработкой функции предпросмотра книг.

Хранение обеспечивается с помощью системы зеркальных сайтов, расположенных в отдалённых друг от друга местах. Все файлы сохраняются в формате ARC. Копии Wayback Machine находятся в Сан-Франциско, Ричмонде, Александрии и Амстердаме.

Фото «Архива Интернета»

Какую часть интернета удалось сохранить архивистам, неизвестно. «Я бы выглядел идиотом [если бы попытался оценить]. Потому что никто не может точно определить размер интернета. Бесполезно беспокоиться о том, что вам неподвластно», — говорит Брюстер Кейл.

Работа «Архива» изменила отношение к ссылкам в интернете — в мире стало появляться множество программ по архивированию сайтов. К процессу массово подключились государственные организации — например, Библиотека Конгресса и национальные библиотеки Австралии, Швеции и Норвегии. В 2013 году Европейский союз запустил проект EU web archive, где сохраняются сайты ЕС.

Веб-архив Библиотеки Конгресса сохраняет миллиарды объектов — от сайтов правительства США до культурно значимых мемов. Уже более 20 лет этим занимается Эбби Гротке — руководитель группы веб-архивирования. «Мы просто пытаемся зафиксировать изменения во времени», — описывает свою деятельность специалистка.

Созданием архива сайтов российских организаций и учреждений с 2017 года занимается президентская библиотека. На периодической основе специалисты архивируют такие ресурсы, как сайты президента России и правительства России — копия создаётся каждый день.

Архивариус Джейсон Скотт Фото «Википедии»

Ещё одно крупное некоммерческое объединение энтузиастов — Archive Team — занимается сохранением частей интернета с 2009 года, когда компания Yahoo закрыла Geocities — веб-хостинг с сайтами пользователей. Проект создал историк технологий Джейсон Скотт, приводивший в числе причин «чувство гнева и бессилия», возникающее у пользователей.

Мы позволяем компаниям решать за нас, что выживет, а что умрёт. Но это не наша работа выяснить, что ценно и что значимо. Мы действуем на основе трёх добродетелей — ярости, паранойи и клептомании.

Джейсон Скотт
создатель Archive Team

Первоочередная задача Archive Team — сохранить контент, размещённый на онлайн-сервисах из группы риска. Так специалисты занимаются архивированием, например, Yahoo! Video, Google Video, Splinder, Friendster, FortuneCity и сокращённых URL-ссылок. В ноябре 2019 года команда запустила инициативу «Twittering Dead» по сохранению твитов умерших людей. Заявки оставляют пользователи, передающие ссылки через Google-формы.

ATTENTION USERS OF TWITTER. Did someone who know or know of make the huge mistake of dying before clicking through a 2019 Terms of Service for their twitter account? Do you want to honor their memory? Please fill out this form: https://forms.gle/iBFP24cKDnYpicxB9

В Archive Team входят независимые пользователи и авторы. Процесс сохранения сайтов выглядит так: архивариусы загружают страницы в виртуальную машинную среду Warrior, после чего она появляется в хранилище The Internet Archive. В 2019 году «Архив Интернета» и Archive Team подписали соглашение о сохранении публичных постов с закрывшейся соцсети Google+. За первые четыре недели архивации специалисты собрали 1,56 петабайт данных.

Исполнительный директор института веб-науки при Саутгемптонском университете Дам Венди Холл подчёркивает важность архива: «Если бы не они, то у нас не было бы ни одного из ранних сайтов. Если бы Брюстер Кейл не создал архив и не начал сохранять ссылки, не дожидаясь разрешения, мы бы всё потеряли».

Работа веб-архивистов ценна ещё и тем, что они сделали то, чем должны были заниматься обычные архивы и национальные библиотеки — но «растерялись» из-за быстрого роста значимости интернета. «Британская библиотека должна иметь копию каждой местной газеты. Но когда газеты перешли из печати в сеть, архивирование приобрело другую форму. Являются ли эти веб-сайты таким же важным источником, как и предшествовавшие им газеты?», — спрашивает Венди Холл.

Сотрудник веб-архива Британской библиотеки Джейсон Веббер считает важной проблемой то, что, несмотря на усилия архивистов, «большая часть интернета нигде не хранится». «Сохранение интернета началось только через пять лет после появления первых веб-страниц. Не осталось ничего из той эпохи. А первая веб-страница, созданная в 1991 году, больше не существует, сохранённый в архиве вариант — её копия», — говорит специалист.

Цифровой мир очень эфемерен, мы смотрим на свои телефоны, материал на них меняется, и мы не задумываемся об этом. Но сейчас люди всё больше осознают, как много мы можем потерять.

Джейсон Веббер
0
74 комментария
Популярные
По порядку
Написать комментарий...
Mikhail Gruznov

Отличный текст, спасибо за важную тему!

И прикольно, что проработанная нами в этом году серия статей в Википедии о вымирании ссылок, архивировании и различных проектах в этой сфере пригодилась для этого материала.

Весь этот год писали (и продолжаем), чтобы больше людей узнали об проблемах сохранения и распространения информации.

https://ru.wikipedia.org/wiki/%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Folcvine

Ответить
11
Развернуть ветку
Государственный инструмент

Комментарий удален по просьбе пользователя

Ответить
53
Развернуть ветку
Anton Tekhtelev

Метавселенная, получается

Ответить
6
Развернуть ветку
умный человек

Кстати
На некоторых площадках до сих пор продаются книги про Гугл Плюс
https://market.yandex.ru/product--brogan-k-google-dlia-biznesa/617625089

Для ностальгии, наверно

Ответить
4
Развернуть ветку
Государственный инструмент

Комментарий удален по просьбе пользователя

Ответить
0
Развернуть ветку
Максим Шпилёв

средний срок жизни веб-страниц составляет 90 дней

А срок жизни комментов на ТЖ? Неделя?

Ответить
0
Развернуть ветку
Teddy Loaf

Я уж надеялся что по моему ФИО перестанет всплывать мое позорное письмо в компьютерру 2001 года.

Ответить
24
Развернуть ветку
Александр Борродач

Мои надежды на то, что форум, где я писал кринжовые посты в 2006-2008 гг, сдохнет - сбылись.

Ответить
7
Развернуть ветку
Vadim Zero

У меня была подшивка этого журнала как раз за 2001 - 2003 годы. Ты в каком номере оказался?

Ответить
3
Развернуть ветку
aliftin

Это день нужно закончить новостью о том что в каком-то маленьком городке Техаса проводят чемпионат по doom 1. А то слишком мало сегодня лонгов о старых вещах в интернете и их функционирлвании.

Ответить
25
Развернуть ветку
Государственный инструмент

Оставлю этот комментарий в качестве пасхалки для историков будущего. Превед, патомги :З

Ответить
17
Развернуть ветку
Wojciech Soska

Добавим кадр из Железного человека 1994 года на случай очередного переезда очобы.

Ответить
2
Развернуть ветку
Кот Эхолот

Ну и жопку моего кота оставим потомкам, на всякий

Ответить
10
Развернуть ветку
Ху Эмай

Сеть оказалась ненадёжным хранилищем
Удивительное открытие

Ответить
13
Развернуть ветку
Denis Medvedev

Специалисты архивируют сайт президента России и сайт правительства?
Хоть раз там кто-нибудь был вообще, кроме них?

Ответить
11
Развернуть ветку
Michael Konovalov

Зато спецслужбы архивируют сайт Навального.

Ответить
0
Развернуть ветку
Роман Гавриль

Так я, получается, не просто смешные картинки из интернета сохраняю, а серьезным делом занят. Мам, ты слышала?

Ответить
10
Развернуть ветку
Ganna Olenyeva

Хорошее дело. Но я думаю, в итоге это частично свернут из-за цензуры. Особенно в условиях, когда все чаще пытаются скрыть и поменять информацию в политических целях. Например, Гугл массово удаляет идеологически неугодную музыку, при этом теперь он прячет даже ссылки на удаленные видео. Также он значительно занижает просмотры задним числом. Но часто можно пойти на Internet Wayback Machine, если сохранилась ссылка, и увидеть, что они там наудаляли, в каких масштабах и когда. Более того, там же старый нормальный алгоритм рекомендаций, так что легко найти целые кластеры идеологически неверных вещей с большим числом просмотров, которые потом массово отцензурили. Хорошо иллюстрирует стремительный рост цензуры.

В итоге, я думаю, все эти крупные компании и государства начнут прессовать архивы, чтобы удаленное ими стирали навсегда.

Ответить
8
Развернуть ветку
sf

можешь привести примеры? вообще тянет на статью

Ответить
1
Развернуть ветку
Ganna Olenyeva

На примере правой музыки:
https://web.archive.org/web/20170315175109/https://www.youtube.com/watch?v=NHq5yeJ7sbc (510к просмотров)
https://web.archive.org/web/20170916095707/http://www.youtube.com/watch?v=zjr81A6Al9c (1200к)
https://web.archive.org/web/20170215094545/https://www.youtube.com/watch?v=5T1meFzfBZY (420к)
https://web.archive.org/web/20170309221158/http://www.youtube.com/watch?v=RY6L--WQ4OY (800к)

Далее можешь брать любые видео из рекомендаций на это из старого ютюба в Wayback Machine, пытаться их вводить в современный ютюб - они почти все будут забаннены. Этих песен сотни и даже, наверное, тысячи. Открываешь какой-нибудь тред на форуме от 2017 года и там песня за песней сейчас запрещены, а тогда были разрешены.

Масштаб цензуры, к примеру: https://www.youtube.com/playlist?list=PL_7pLsicKtaJREr-Dmbhvcz9UoJG7cCzu - было 224 видео, из них осталось доступно только 29. Или: https://www.youtube.com/playlist?list=PLE5923CD645180171 - было 44 видео, из них осталось 5. Для сравнения - "антисистемный" анархистский панк: https://www.youtube.com/playlist?list=PLtazNXjCT3dmbAOdeieZB6BbEO95f8TSk - было 103 видео, осталось 91. Или ультралевая музыка: https://www.youtube.com/playlist?list=PLV4dNwZj-cDMCVMZJxaG9mL0MI-oQs1yk - было 355, осталось 279. Так что это явно цензура, а не просто развал аккаунтов и так далее.

При этом по умолчанию ссылки на удаленное спрятаны. Раньше иногда удаляли видео, но оставляли название (теперь нет). Пока можно, впрочем, включить видимость запрещенных видео, чтобы они показывались как ниже. Затем можно взять URL из списка и повводить их в Wayback Machine, чтобы узнать, что там было. Также был промежуточный период, когда они прятали в будущем запрещенное за "confirm your age". Например: https://web.archive.org/web/20170324153843/https://www.youtube.com/watch?v=Agi6uXkLEi4

Просмотры занижают двумя способами. Либо просто внаглую уменьшают просмотры, либо баннят основное видео, а потом попеременно баннят и открывают перезагрузки. Например, у третьего видео было из первого абзаца было 420к просмотров, но его запретили. Некоторое время все перезагрузки были забаннены и песня на ютюбе отсутствовала, как и большинство аналогичных, а перезаливки тоже баннили. Но потом перезаливки с низким числом просмотров открыли. Поэтому сейчас можно найти пять копий этой песни, в том числе и оригинальный клип. В каждой 10-15к просмотров: https://www.youtube.com/results?search_query=Division+250+%E2%80%93+Polvora+y+Sangre

Также стоит отметить растущую нерелевантность рекомендаций. Для сравнения - одна из немногочисленных разрешенных композиций: https://web.archive.org/web/20170214061814/https://www.youtube.com/watch?v=8OhaGk_Zfsg - раньше все рекомендации были совершенно релевантные. Теперь просто втупую рекомендуют видео с большим числом просмотров или от других групп с тем же названием (и малым числом просмотров). См. приложение для примера (открыто в инкогнито окне).

Ответить
9
Развернуть ветку
Андрей Анисимов

Возможно даже уголовную)

Ответить
0
Развернуть ветку
Имя И Фамилия

Где-то пять лет назад я занялся зачисткой упоминаний о себе в интернете, и могу сказать, что мамкины борцуны за сохранность страничек - та ещё проблема.

Ответить
4
Развернуть ветку
Сталин спас Россию

Сохранил твой комментарий

Ответить
15
Развернуть ветку
Имя И Фамилия

Чей "мой"?))

Ответить
0
Развернуть ветку
Александр Борродач

Сохрани и ссылку

Ответить
0
Развернуть ветку
Саша Кириллова

Кстати, это вообще интересная проблема...

Ответить
4
Развернуть ветку
Имя И Фамилия

Если ты захочешь удалить какую-нибудь страничку со своей фотографией из вейбек машин (у меня это была новость на сайте универа), то ты будешь делать это очень долго, если вообще предприятие увенчается успехом. Им плевать, они видите ли интернет сохраняют. Жаль, что эта сторона вопроса мало кого интересует. Ну, может когда-нибудь

Ответить
7
Развернуть ветку
Государственный инструмент

А можно ещё за удаление со своего сайта вымогть деньги)

Ответить
2
Развернуть ветку
Александр Борродач

Но когда речь зашла о сайте программы для шифрования TrueCrypt - все прекрасно удалили

Ответить
0
Развернуть ветку
Design

Тебя случаем не Витя зовут ?

Ответить
0
Развернуть ветку
Артем Сергеевич

вы не правы, я так выпилил свой сайт из веб-архива, причём очень дегко, правда в начале десятых.

Ответить
0
Развернуть ветку
Имя И Фамилия

Вы не правы, я так выпилил
Так и я выпилил что мне нужно, я что-то об этом сказал?

Правда в начале десятых
)

Ответить
0
Развернуть ветку
Артем Сергеевич

ну я ответил что выпилить можно все что угодно, было бы желание))) ну и делать это в нужное время в нужном месте, я про это в общем)

Ответить
0
Развернуть ветку
Ustinlive

))

Ответить
0
Развернуть ветку
WED CR.ST.

теории, при которой из мира исчезнут все электронные данные, не имеющие бумажных эквивалентов.

Ну, по факту, если у тебя какие-то данные только на одном носителе/сайте, то им рано или поздно кирдык, если ты их не перезапишешь/перезальёшь. Хорошо, когда это что-то ненужное. Плохо, когда нужное, а воспользоваться или вытащить из архива уже нельзя.
У самой куча мёртвых ссылок в Избранном, хотя это и 10е, по большей части.

Веб архив, конечно, вещь. Иногда захожу посмотреть копию своего старого дневника с уже упокоившегося ресурса. Жаль, что сохранилось только то, что было автоматически кешировано или сохранено ручками в самый последний момент.
Когда сайт ещё не снесли, некоторым посоветовала сделать копии перед отключением.
Рада, вообще, что давно про эту штуку знаю.

Ответить
6
Развернуть ветку
Государственный инструмент

Материал был удален по просьбе автора DELETED

Ответить
6
Развернуть ветку
Maf

прям дни ностальгии) вон на хабре вчера пост был про то как хорошо жилось и все летало во времена pentium 166MMX и windows95 собрал 1к комментов) День зимнего солнцестояния влияет что ли или и правда трава была зеленее и индустрия IT сейчас ушла куда-то не туда по всем вопросам.

Ответить
3
Развернуть ветку
sf

IT перестало быть клубом избранным и стало масс-маркетом куда можно войти за 2 месяца курсов на каком-нибудь обучающем ресурсе. Отсюда потерялось чувство причастности к чему-то собенному

Ответить
4
Развернуть ветку
Слава Францев

Странно что никто не реализовал идею интернета с платным доступом. Точно такой же интернет — только за $19.99 в месяц и вход по инвайтам. Пиздюки, любители ватсапа-инстаграма и прочие додики остаются здесь, а илита сидит в своём собственном манямирке.

Ответить
1
Развернуть ветку
Рыжий

Отсюда потерялось чувство причастности к чему-то собенному
По идее оно потерялось где-то в конце 90ых, когда появились высокоуровневые языки и php...

Ответить
0
Развернуть ветку
sf

не думаю, php это был популярный и пожалуй единственный удобоваримый язык клепать динамические сайты. и веб это было круто, модно, интересно. все хотели делать веб, все пробовали переносить бизнес в веб. как бум доткомов в сша. но повальной массовости не было. все равно приходило устанавливать и настраивать все самому

Ответить
2
Развернуть ветку
Рыжий

Там пост не сколько о ностальгии, сколько про охуевшесть разработчиков, которые не думают о ресурсах от слова совсем

Ответить
0
Развернуть ветку
Maf

Пост перекликается с этим, тем что софт со временем точно также как сайты исчезает. В комментах некоторые упоминают , что сейчас очень трудно собрать систему по состоянию лет на 10-20 назад, репозитории отвалились, сертификаты заэкспайрились, старых исходников или нет или они не билдятся. С windows и софтом под него слегка попроще, если было на дисках что-то и оно еще доступно где-то в сети на торрентах и не требует онлайн активации. Но в целом все печально.

Ответить
0
Развернуть ветку
Иван Дмитриев

Скачивайте интернет пока его совсем не удалили!

Ответить
4
Развернуть ветку
Alexey Shirshov

Опять на дискетах все сохранять???

Ответить
3
Развернуть ветку
Государственный инструмент

Главная причина вымирания веб-страниц— децентрализация интернета
Как раз-таки наоборот.

Ответить
3
Развернуть ветку
Евгений Иванов

сложно на это повлиять, потому что за сохранность ресурсов ответственность несут не они, а владельцы сайтов

Да ладно!

Что мешает сохранить контент по ссылке и "распечатать" его в конце статьи или документа?

И это совершенно ведь "не сложно повлиять", верно?

Также в браузере функцию "Добавление в закладки" нужно реализовать совершенно по другому.

Оно дополнительно должно сохранять страницу. И эти сохранённые данные можно экспортировать.

Ответить
2
Развернуть ветку
sf

интернет по крайней мере покоится на все той же технологии HTTP, которая в принципе есть обычный текст, т.е. еще туда-сюда можно всегда прочитать.

а вот всякие медиа-библиотеки или программы. они просто не запустятся на современном железе. я недавно вспоминал первую российскую меди-энциклопедию, это сделали в начале 90-х группа Наутилус Помпилиус. Это было супер-круто, такого еще никто на советском пространстве не делал. У тебя был диск там была вся история группы, фотки, немного клипов, музыкальная подборка.

Я думаю у кого-то лежит по домам, но на трекере вряд ли сейчас найдешь такое. Это было задолго до трекеров.

Ответить
1
Развернуть ветку
Фёдор Клименко

Есть на рутрекере аж в двух экземплярах.

Ответить
0
Развернуть ветку
sf

Но запустится ли? Он был написан под вин 95

Ответить
0
Развернуть ветку
Фёдор Клименко

На рутрекере в комментах пишут, что нужен хотя бы Win7. У меня на Win7 не запустилось. Наверное нужно ставить виртуальную машину, в ней XP или Win95.

Ответить
0
Развернуть ветку
sf

Про то и речь. А на современном железе вин95 не запустится

Ответить
0
Развернуть ветку
Государственный инструмент

Виртуалка зато запустится

Ответить
2
Развернуть ветку
sf

во, нашел видеобзор на диск
https://youtu.be/l0BNWe1L_sY?t=170

Ответить
0
Развернуть ветку
Hooligan

Хм. Неплохая бизнес идея.

Ответить
1
Развернуть ветку
Государственный инструмент

И не будет, потому что свобода была, пока интернетом пользовалось 1,5 фрика.

Ответить
0
Развернуть ветку
Государственный инструмент

Мой еблет с ирокезом в 94ом сверкнул на страницах газет крупным планом. Зумеры сосатб

Ответить
1
Развернуть ветку
Alex Baystruykin

Неплохой дайджест по теме, но интернет не то что нулевых а практически 80-х все еще живет. Всякие специализированные места вроде архив.орга даже интерфейс за тридцать лет не меняют.
А кроватку жалко, да. Не чат, а атмосферу конца 90-х, но она ушла намного раньше чем чатик прикрыли.

Ответить
1
Развернуть ветку
Sergei Timofeyev

Скорее конца 90-ых и начала 00-ых. Первые два года. Дальше в интернет начнут массово ломиться.

Ответить
0
Развернуть ветку
Dmitriy

Занимаюсь редактированием дискографий в муз базах и часто имею дело с wayback machine, находя там оригинальную инфу по релизам везде от itunes до постов с myspace. И в архиве есть странные проблемы с некоторыми музыкальными платформами, когда словно не дают просмотреть инфу в самом архиве. Одна из таких проблем: не работает отображение всего на soundcloud начиная с 2014 года. А причиной этого скорее всего является случай, когда саундклауду предсказывали банкротство и он намеривался закрыться, и тогда люди с веб-архива начали архивировать буквально всё на сайте. Но владельцам саундклауда это не понравилось и они пригрозили судом, и тогда все отменили. С тех пор треки в архиве можно просмотреть только в коде страниц - инфа там есть, но визуально это белые страницы. Я в этом году даже писал в техподдержку веб-архива по этому поводу. Один из основателей ответил - причин не раскрыл, но поблагодарил и сказал что передал информацию инженерам. С тех пор конечно же ничего не поменялось. Но хочется верить, что это все же баг, а не специальная заглушка по просьбе правообладателей.

Ответить
1
Развернуть ветку
Aleksandr Papushev

Еле дочитал, но очень интересно, спасибо

Ответить
0
Развернуть ветку
Саша Кириллова

Благодарю! Действительно вышло объемно...

Ответить
2
Развернуть ветку
Василий Дробовский

Короче - никто не знал что придёт новое в Интернет.
Однако же никто и не думал, что до сих пор останутся сайты, продолжающие разбрасывать "лиды".
Фишка наиболее тесного общения осталась в тематических ресурсах, многие из которых стали музеями.
Мобильность самого Интернет возросла и конечно, узконаправленные сайты могут до сих пор быть модерируемым пространством, после которого, общение рано или поздно перейдёт на мессенджер или телефон.
Если начинать серьезный проект, то как бы то ни было, свой сайт, хотя бы "визитку" лучше всего иметь. Или открыть профиль в LinkedIn.

Ответить
0
Развернуть ветку
Василий Дробовский

А "лиды" в России, это не уникальные технологии - это просто "заплати и уйди". Убивается просто, но и возникает не в Google а ещё "ниже", на уровне конкретного сайта.

Ответить
0
Развернуть ветку
Государственный инструмент

Делайте бэкапы

Ответить
0
Развернуть ветку
Sergei Timofeyev

Кто будет делать бэкапы после твоей смерти?

Ответить
0
Развернуть ветку
Evgeniy__G

Концепция цифрового тёмного века это интересно)

Ответить
0
Развернуть ветку
Marat Khamadeev

О, я же как раз заказывал материал по цифровой археологии)

Ответить
0
Развернуть ветку
Marat Khamadeev

Процент «умерших» ссылок (кирпичный цвет) в статьях The New York Times по отношению к их общему количеству (светло-салатовый цвет)

Ну не то же на рисунке. Давайте я вам помогу с правильной подписью

распределение по годам долей «умерших» ссылок (кирпичный цвет) и пока ещё работающих (светло-салатовый цвет) в статьях The New York Times

Ответить
0
Развернуть ветку
Zukhriddin Rashidov

http://club.chateg.ru может умереть в 2022-году. Помогите сохранить.

Ответить
0
Развернуть ветку
John Smith

два слова: форумы by.ru.

Ответить
0
Развернуть ветку
artemykairyak

Я стараюсь ничего не удалять из своих соцсетей (если за это нельзя сесть), потому что мне очень важна история моего существования в интернете, это своеобразная история жизни что ли, я представляю как буду через лет 50 всё это читать и рыдать от ностальгии

Ответить
0
Развернуть ветку
Ян Восиповский

Помню как раньше сохранял целые страницы с посылом - "потом как-нибудь почитаю". Что я там тогда сохранял, где теперь это все, черт его знает.

Ответить
0
Развернуть ветку
Данил Вишнивецкий

Да и вообще, сохранять нужно для чистого интереса, как выглядел сайт тогда)) Я так много куда заходил и смотрел, благодаря Wayback Machine

Ответить
0
Развернуть ветку
Читать все 74 комментария
null