Офтоп
Роман Персианинов

Бесконечная жизнь электронных переписок в компании Enron

К чему привела самая громкая утечка личных писем в истории, и какие уроки из неё извлёк мир.

Рабочий демонтирует вывеску компании Enron. Фото Gety

В мае 2017 года Министерство юстиции США назначило бывшего директора ФБР Роберта Мюллера специальным советником по расследованию вмешательства России в президентские выборы 2016 года. Месяц спустя Дональд Трамп предложил новым директором ФБР юриста Кристофера Рэя.

Мюллера и Рэя связывает важная история — крах компании Enron. В 2001 году эта крупная организация оказалась в центре коррупционного скандала, а вскоре переписка её работников оказалась в публичном доступе в интернете. Мюллер и Рэй активно участвовали в расследовании дела Enron, и на этом фоне в СМИ появились новые материалы об уроках, которые из него извлекло общество.

TJ вспоминает, как банкротство компании привело к раскрытию тысяч личных сообщений, и почему IT-специалисты считают эту историю скорее удачей, чем катастрофой.

Взлёт и падение Enron

В конце 1990-х годов в мире сложно было найти другую энергетическую компанию, которую хвалили бы так же активно, как техасскую Enron. За 16 лет работы она выросла из слияния двух крупных игроков, InterNorth и Houston Natural Gas, получила контроль над поставками электроэнергии и газа и вскоре разместила акции на фондовом рынке.

На пике могущества компания обеспечила работой больше 20 тысяч человек, а в 2000 году её выручка составила 101 миллиард долларов. По крайней мере так думала мировая общественность. В том числе бизнес-издание Fortune, которое шесть лет подряд превозносило инновации компании.

Его редакция не догадывалась, что за «успехом» Enron скрывается крупнейший в истории США случай корпоративного мошенничества и коррупции. Руководство организации подделывало отчётность, чтобы скрыть провалы на внешнем рынке, и регистрировало десятки юридических фирм в офшорных зонах, куда незаконно переправляло выручку и деньги инвесторов.

Генеральный директор Enron Кеннет Лэй. Умер в 2006 году, не дождавшись финального вердикта по делу о мошенничестве. Фото AP

Подозрительно высокие цифры в отчётах о прибыли, казалось, никого не смущали. Однако Enron легко опустилась с высот до финансового дна. В 2001 году аналитик Джеймс Чанос обратил внимание на то, что на рынке Enron стоила в 55 раз больше, чем годовая прибыль компании. Такое явление свойственно финансовым пирамидам, иллюзорный успех которых привлекает крупные инвестиции.

Наблюдения Чаноса не были уникальными. На его месте мог бы оказаться любой профессиональный аналитик, неподвластный хвалебной прессе. Однако лишь Чанос догадался обратиться к журналистам Fortune с просьбой изучить отчётность компании подробнее. Расследованием занялась Бетани Маклин, позже посвятившая краху Enron целую книгу.

Бетани Маклин. Фото Capital Markets

Материал журналистки раскрыл настоящее положение компании: она несла тяжёлые убытки, вызванные внутренними махинациями, а руководство упорно это скрывало. Статья разожгла общественный резонанс, Федеральная комиссия по регулированию в области энергетики сформировала специальный отдел и начала проверку. После этого стоимость акций организации начала падать со стабильных 80-85 долларов до (к моменту завершения расследования) доллара за акцию.

Основное руководство компании получило тюремные сроки до 15 лет за мошенничество и коррупцию, вице-президент Enron застрелился ещё до окончания следствия, а тысячи людей, потративших сбережения на акции, разорились. Казалось, в этой истории есть лишь проигравшие, однако, как показало время, это не так.

Как переписка сотрудников оказалась в интернете

«Вчера мы поссорились из-за пачки кукурузных хлопьев на фоне национальной трагедии», — написала сотрудница Enron 12 сентября 2001 года. Это и другие 600 тысяч (по другим данным — 1,6 миллионов) сообщений 158 работников высшего звена появились в открытом доступе в результате правительственного расследования.

Самый большой слив электронных переписок случился в 2003 году, когда Enron уже закрылась, а её имущество разобрали другие компании. Решение опубликовать данные в рамках расследования приняла Федеральная комиссия по регулированию в области энергетики.

За годы в сети у слива несколько раз появлялись новые версии: последняя появилась в мае 2015 года. Она весит около полутора гигабайт и содержит лишь часть данных. Полный архив, весом около 2 терабайт, предоставляется исследовательским организациям или частным лицам за деньги.

Работники Enron во время скандала вокруг компании. Фото Getty

Как отмечал журналист TechRepublic, следователи не объяснили должным образом публикацию личных переписок, пусть и корпоративных. По их словам, они должны были стать предметом исторических и научных исследований, хотя большая часть сообщений даже не была связана с расследованием. Более того, в изначальной версии присутствовала масса личных данных сотрудников, которыми они делились в переписках. В том числе номера кредитных карт, адреса и номера телефонов.

Чем оказалась полезна переписка

​Когда архив Enron впервые появился в сети, технологические специалисты увидели в нём крупный потенциал для создания специальных алгоритмов. Массачусетский технологический институт купил права на оригинальный архив за 10 тысяч долларов, после чего специалисты учреждения очистили массив от копий писем и удалили из сообщений частные данные.

«Очищенная» версия могла стать почвой для создания искусственного интеллекта, который, изучив массивы сообщений, смог бы лучше понимать шаблоны человеческого общения. Он мог бы лучше понимать запросы людей, общаться с ними или сортировать их почту по степени важности.

Эта смелая для 2003 года идея вскоре нашла партнёров в лице технологической компании SRI International и Управления перспективных исследовательских проектов Министерства обороны США (DARPA). Годы спустя дочерняя компания SRI International создала прототип искусственного интеллекта Siri, который затем приобрела Apple.

Филиал SRI International в Калифорнии. Фото REDUX

По данным Technology Review, публикация переписки сотрудников Enron, самого большого публичного архива настоящих электронных сообщений в истории, стала причиной развития нескольких функций почтовых приложений. Этот массив данных представляет собой огромный сборник живого человеческого общения: шуточных, романтических, бесцельных или корпоративных сообщений.

Вместе они отражают шаблоны, которые используют люди в переписках. На основе исследований этих паттернов специалисты научили компьютерную систему выделять важные письма среди второстепенных. Авторы современных программ, обученных находить спам или отделять полезную информацию от бесполезной, так или иначе основывались на массиве данных Enron. В 2013 году компания HP отметила, что использовала архив сообщений компании в разработке собственных программ.

Современные программы используют алгоритмы самообучения, медленно становясь подобием совершенного искусственного интеллекта из кино. В развитии таких систем есть заслуга Enron.​

Масштабный слив корпоративной переписки был полезен не только для IT-специалистов, но и лингвистов. Они уже много лет изучают сообщения сотрудников, в которых обсуждения рабочих вопросов перемежаются с впечатлениями от техасских девушек в мини-юбках. Кто-то из начальников флиртует с подчинёнными, кто-то договаривается выпить после работы, кто-то делится теориями заговора — популярное занятие после теракта 11 сентября 2001 года.

Только 6% всех сообщений начинались с какого-либо приветствия, а мужчины здоровались с собеседниками реже женщин. В беседах с большим количеством участников (от 10 человек) люди старались писать неформально, как будто общаются с друзьями. Специалисты предположили, что таким образом сотрудники хотели казаться «круче».

Преподаватель лингвистики в английском университете Ноттингем Трент, Дэвид Райт считает, что даже по самым банальным фразам можно определить индивидуальные особенности человека. До конца 2017 года он планирует опубликовать в известном академическом журнале International Journal of Corpus Linguistics статью, где в том числе анализируются сообщения сотрудников Enron.

По наблюдениям Райта, самые популярные слова среди женщин в компании — это «привет», «для» и «спасибо». У мужчин чаще встречается «я», «больше», и «по направлению (toward)». Эти речевые шаблоны встречаются у всех людей, но лингвист считает, что каждое такое выражение позволяет определить характерный стиль человека.

Детали переписки Enron так или иначе присутствуют более в чем 3000 научных работах.​

Технический специалист Джафар Адиби, который один из первых обратил внимание на потенциал переписок компании, утверждает, что каждый месяц он получает запросы от учёных из разных стран. Все они интересуются мнением Адиби по поводу использования переписок в тех или иных целях.

Люди обращаются за советом Адиби не зря. В 2010 году он соосновал компанию Reunify, известную приложением PULSE. Как говорится на сайте сервиса, инструмент анализирует базы данных клиентов для повышения продаж и помогает сотрудникам компаний «вести правильный разговор с нужным клиентом в нужное время». Нельзя однозначно утверждать, что Адиби и его коллеги использовали для создания алгоритмов своего сервиса переписки Enron, однако это вполне возможно.

Тега Мойн и Сэм Лавин дают интервью корреспонденту Reuters о своем проекте Smell Dating. Фото Observer

Интерес к архиву компании не падает и в 2017 году. В январе художники Тега Мойн и Сэм Лавин запустили проект «Хорошая жизнь», который позволяет прочитать все сообщения сотрудников Enron в хронологическом порядке. Для этого пользователю нужно указать свой электронный адрес и отметить, как долго он хочет получать письма (30 дней, год или семь лет).

Вероятно, долгоиграющее внимание к письмам связано с тем, что второй подобный случай легального «слива» переписки уже вряд ли произойдёт. В 2003 году мировому сообществу, в особенности его американской части, предстояло узнать ещё много нового о слежке спецслужб за интернет-общением и том, как можно воспользоваться этими данными.

В 2017 году ситуация совсем иная. После дела Эдварда Сноудена, сливов Wikileaks и заявлений спецслужб США о том, что российские хакеры способны взломать даже самые защищённые ресурсы, американское и западное общество вряд ли допустит, чтобы частная переписка, пусть и корпоративная, оказалась в открытом доступе.