Офтоп
Роман Персианинов

Библиотека утерянных возможностей

Трагичная история попытки Google создать самое большое цифровое хранилище книг в мире.

Фото Reuters

В 2004 году компания Google решила создать цифровой архив, в который должны были войти 130 миллионов когда-либо опубликованных книг. Авторы проекта планировали отсканировать все ранее изданные произведения и предоставить доступ к этому архиву библиотекам, создав таким образом самое большое хранилище данных. Однако, подобно трагедии Александрийской библиотеки, после долгой борьбы за выживание идея цифрового хранилища провалилась.

Когда в марте 2011 года это стало очевидно, учёные, архивисты, библиотекари и другие критики проекта, ставшие одной из причин его уничтожения, вздохнули с облегчением. Они считали, что предотвратили катастрофу, не дав одной из крупнейших компаний мира создать несравнимую по масштабам структуру. Историю цифровой библиотеки, частично сохранившейся в лице Google Books, рассказал журналист американского издания The Atlantic Джеймс Сомерс (James Somers).

Все книги мира — в одном месте

Проект компании Google по отсканированию всех существующих в мире книг начался с идеи сооснователя компании Ларри Пейджа (Larry Page). Он давно мечтал поместить мировой запас книг в цифровой мир. В 2002 году дела у организации шли отлично, прибыль с каждым месяцем только увеличивалась, и Пейдж решил подробнее изучить возможность перенести запасы библиотек в компьютерный мир.

Руководитель Google пришёл в Университет Мичигана — свою альма-матер и по совместительству ведущее заведение сканирования книг в США. Пейдж поинтересовался, сколько нужно времени, чтобы отсканировать семь миллионов томов — весь книжный запас университета. Удивлённое руководство ответило, что такой проект в лучшем случае займёт около тысячи лет, если на копирование одной книги будет уходить 40 минут. Сооснователь Google немного подумал и ответил, что его компания управится за шесть лет.

Ларри Пейдж. Фото The New York Times

Проект по отсканированию и переносу книг в цифровой мир назвали «Океан» (Project Ocean). План Пейджа заключался в следующем: университетские и национальные библиотеки одалживают Google свои книги, а компания сканирует их и предоставляет бесплатную цифровую копию каждого сочинения. Таким образом организация планировала охватить самый большой и забытый пласт информации— книги, которые перестали издавать.

На подготовку «Океана» ушло два года. Пейдж договорился о поставках с Университетом Мичигана, Гарвардом, Стэнфордом, Оксфордом, Нью-Йоркской публичной библиотекой и дюжиной других. Каждую неделю к порогу Google приезжали грузовики, заполненные книгами. Тексты со столетними историями загружались в тележки и отправлялись к сотрудникам станций, каждая из которых могла отсканировать до тысячи страниц в час.

Для этого компании пришлось изготовить специальное оборудование и программы, каждая стоимостью в несколько тысяч долларов. Сканируемая книга закреплялась на специальном стенде, сверху на неё направляли несколько фотоаппаратов, а трёхмерный радар определял точное положение листов книги в пространстве.

Страницы аккуратно переворачивал человек — ни одному прибору не удавалось сделать это так же быстро и аккуратно. После этого оператор нажимал на педаль на полу и камеры фотографировали. Затем процесс повторялся. Специальные программы сглаживали кривые участки сфотографированного листа. В самые загруженные моменты над проектом трудились до 50 инженеров: они настраивали оптику приборов, учили программы отличать простой текст от диаграмм, иллюстраций и цифр.

Это был первый проект в истории Google, который называли «полётом на Луну».

Название отсылало к полёту на Луну космического корабля «Аполлон-11» в 1969 году. Но, как всегда случается с масштабными проектами, у него нашлись критики. Некоторые сотрудники Google раздражённо задавались вопросом, зачем тратить на отсканирование старых книг по 50 миллионов долларов в год?

К августу 2010 года компания потратила на проект 400 миллионов долларов. В тот же месяц Google пообещала отсканировать все когда-либо опубликованные книги — почти 130 миллионов. Однако пока грузовики подъезжали к дверям компании, выгружая тысячи произведений, а инженеры следили за процессом копирования, писатели и издатели готовились подать на Google в суд за «массовое нарушение авторских прав».

Google против «Гильдии авторов»

Во время работы над «Океаном» руководство компании понимало, что они не могут просто выложить отсканированные книги в открытый доступ. С юридической стороны это было самоубийством. Первоначальная идея заключалась в том, чтобы предоставить возможность поиска по всем книгам с демонстрацией пользователю небольшого отрывка из неё. Это больше напоминало каталог, чем библиотеку, и юридический отдел Google считал, что они не нарушают закон. Ведь пользователи будут читать не книгу, а лишь мелкий фрагмент из неё.

Юристы ошиблись. Писатели объединились в «Гильдию авторов» и при поддержке группы издателей подали совместный иск против Google. За каждое незаконное копирование книги компании грозило до 150 тысяч долларов штрафа.

Учитывая то, что в это время Google отсканировала миллионы произведений, штраф в 150 тысяч долларов за каждую копию мог обернуться финансовой катастрофой.

Это был не первый случай, когда технологические компании игнорировали права интеллектуальной собственности. В 1900-х годах создатели деталей пианино использовали нотную бумагу вопреки авторским правам, за что получили иск от музыкальных издательств.

С похожими проблемами столкнулись первые производители виниловых пластинок и радио. В 1960-е годы кабельные каналы транслировали передачи без авторских разрешений и получали повестку в суд. В 80-е годы киностудии направляли иски к производителям видеомагнитофонов, а музыкальные лейблы в 2000-м году обвинили Napster в краже.

У всех этих случаев есть общая особенность — владельцы авторских прав подавали в суд не с целью задавить новую технологию, а заключить выгодную обеим сторонам сделку. Такие столкновения, приводившие в итоге к консенсусу, происходили с появлением почти каждого технологического изобретения.

Публичная библиотека Нью-Йорка, ранее сотрудничавшая с Google. Фото The Atlantic

В случае с Google истцы не сразу поняли, какую выгоду они могут извлечь из судебного разбирательства. Проект компании мог вывести в цифровой мир книги, защищённые авторским правом, и вдохнуть в них новую жизнь. Подобное произошло с развитием индустрии видеокассет: владельцы старых фильмов начали получать прибыль с продаж записей с их картинами, которые к этому времени уже не показывали в кинотеатрах.

Истцы поняли — работу Google нужно не тормозить, а подталкивать, чтобы в нужный момент заключить выгодную сделку. К примеру, владельцы старых и давно не издающихся книг могли получить возможность вновь продавать свои работы на интернет-площадке.

Авторы произведений не поняли этого сразу, потому что до проекта Google бизнес по продаже цифровых книг был коммерчески мёртвым. Мало кто видел в нём перспективы, но «Океан» мог всё изменить. Однако когда некоторые участники «Гильдии» начали это понимать, было уже слишком поздно — судебное разбирательство по нарушению авторских прав раскрутилось.

Истцы попали в патовую ситуацию: если они выиграют у Google, то получат лишь возмещение ущерба и потеряют возможность оживить цифровой рынок книг. Но если они уступят, то компания продолжит оцифровывать книги и публиковать в «урезанном» формате, когда пользователь видит лишь короткий фрагмент. При этом организация не сможет продавать электронные копии целиком из-за закона об авторских правах. Участникам разбирательства нужно было найти третий вариант.

Идеальный план

В США 50% книг, выпущенных с 1923 по 1963 годы, официально считаются общественной собственностью. Проблема в том, что никто не знает, о каких 50% идёт речь. Например, автор подписал соглашение об издании 40 лет назад. Договор предусматривал, что через этот промежуток времени произведение перестанут издавать и полные права на него вернутся к писателю.

Но ситуация осложняется тем, что договор об авторском владении подписан на бумагах, зачастую хранящихся в неизвестном месте. Найти родственников автора не всегда удаётся, а издательство произведения могло давно закрыться. Чтобы найти истинного владельца, нужно поднять архивы, изучить сотни документов в различных конторах, адрес которых ещё нужно найти. Подобное расследование обойдётся искателю в огромную сумму, не говоря о том, что автора можно так и не найти.

Переломным моментом в споре «Гильдии авторов» против Google стало осознание, что компания предлагает способ навсегда обойти проблему поиска истинного владельца. Идея организации заключалась в том, что издатели подписывают с ней договор на продажу книг на электронной площадке Google Books. 63% дохода с каждого проданного произведения компания переправляет в единый реестр прав на книги. Наследники авторов и издателей могли бы обращаться в это место за своей долей. Но поскольку в реестр обращались бы далеко не все, оставшиеся деньги Google выделяла бы на поиск истинных авторов старых произведений. Таким образом компания могла бы со временем установить владельцев многих сочинений и при этом не загнать себя в экономическую яму.

Создание плана по совместному проекту заняло у Google, библиотек, издателей и «Гильдии авторов» 2,5 года.

По плану, компания должна была заплатить 90 миллионов долларов штрафов другим участникам процесса и потратить 34,5 миллиона долларов на создание единого реестра. Условия были следующие: Google Books может показать 20% книги, чтобы подтолкнуть читателя к покупке. Цена книги формировалась алгоритмом компании или устанавливалась издателем.

В среднем стоимость варьировалась от 2 до 30 долларов. Все вышедшие из публикации произведения собирались в одну большую цифровую корзину и отправлялись в университеты, где студенты могли читать их бесплатно. Это же касалось каждой национальной библиотеки США.

Участникам процесса казалось, что их план одинаково удовлетворяет все стороны. Библиотеки получат постоянный доступ к миллионам оцифрованных книг, у авторов и издателей появится возможность продавать старые книги, которые долгие годы не приносили им прибыль, а Google, контролируя процессы продажи, сможет отбить вклад в оцифровку.

Заброшенная библиотека

Новость о консенсусе сторон стремительно разошлась в СМИ. Проект Google затрагивал книжную индустрию, авторов, издателей, библиотеки, правительство и американское общество в целом. Вскоре на него обрушились с критикой за то, что компания якобы хочет стать монополистом цифровой индустрии книг.

Противники проекта считали безответственным решение предоставить миллионы сочинений в руки корпорации. По мнению осуждающих, Google заманила бы библиотеки, университеты и издательства выгодными условиями, а затем, когда бы они пристрастились к цифровой площадке, вынудила бы пойти на нездоровые и монополистские соглашения.

Против проекта выступила компания Microsoft, заявив, что практическая монополия на цифровую библиотеку сделает Google ультимативным поисковиком и не оставит место для конкуренции. Этот тезис поддержала компания Amazon, увидев в проекте лишь стремление отбить у неё клиентов. Критики Google почему-то не обращали внимание на то, что 80% цифрового рынка контролирует Amazon, тогда как у Google был в лучшем случае 1%.

«У людей не было возможности приобрести вышедшие из печати книги в интернете, а теперь появилась. Как это может им навредить?» — отвечали адвокаты Google на критику.

С развитием событий пропасть между сторонниками и противниками идеи росла, никто не хотел уступать. В какой-то момент в дело вмешалось Министерство юстиции и заявило, что проект Google выходит за рамки иска, касающегося разбирательства о нарушении авторского права, и создаёт опасный прецедент.

По мнению властей, если бы компания договорилась с партнёрами в рамках судебного разбирательства, то любой другой технологической компании для получения прав на создание подобного магазина электронных книг пришлось бы повторить такой же путь.

Другими словами, сначала организациям нужно нарушить закон об авторском праве, а потом, когда на них подадут в суд издатели, договариваться с ними о сделке. Это было неприемлемо, и в марте 2011 года судья отказал Googe и «Гильдии авторов» в одобрении проекта. В апреле 2016 года Верховный суд США отверг петицию «Гильдии авторов» по сделке, что окончательно подтвердило провал.

Судья Денни Чин (Denny Chin), вынесший финальное решение о сделке Google. Фото The New York Times

Формально компания выиграла дело против «Гильдии авторов». Суд признал, что Google имела право оцифровывать и предоставлять пользователям отрывки книг. Однако организация отказалась дальше бороться за проект, который пережил массу событий.

Сначала компания договорилась с библиотеками, чтобы отсканировать книги. Затем построила для этого дорогостоящую станцию, после чего столкнулась в суде против авторов, издателей и университетов, но сумела убедить их в идее изменить рынок цифровых книг. Однако несмотря на эти усилия проект провалился.

Читатели не получили цифровую библиотеку из 130 миллионов когда-либо опубликованных книг. Издатели и авторы лишились возможности получать небольшой процент от продажи старых произведений.

Где-то внутри Google хранится 25 миллионов книг, многие авторы которых остаются неизвестными. Доступ к этой библиотеке есть только у небольшого числа инженеров, проверяющих работу систем. Журналист Джеймс Сомерс встретился с бывшими работниками станции и спросил, насколько было бы сложно открыть доступ к этим огромным архивам.

«У тебя были бы большие проблемы, — ответили журналисту. — Но вообще нужно лишь написать один запрос к базе данных. Так доступ переключится с „Выключено” на „Включено“. Это займёт несколько минут».

#золотойфонд