Офтоп
TJ

88 первых свиданий

Как математический гений взломал сайт знакомств OkCupid, чтобы найти настоящую любовь

Автор: Настя Праздничная

Кевил Паулсен из Wired рассказал историю 35-летнего математика Криса МакКинли, решившего применить статистические методы на сайте знакомств, «взломавшего» его алгоритм и нашедшего свою любовь после длинной череды неудачных знакомств. TJournal публикует перевод этой безумно трогательной, но поучительной истории.

Крис МакКинли сидел в свете единственной лампочки и экрана монитора в небольшом кабинете на пятом этаже Калифорнийского университета в Лос-Анджелесе, в отделе математических наук. Было три часа утра, идеальное время для квантовых вычислений на суперкомпьютере в Колорадо, который он использовал при написании своей докторской диссертации. (Тема: обработка больших объемов данных и параллельные численные методы). А пока компьютер гудел, он открыл в отдельном окне свой ящик на сервисе знакомств OkCupid, чтобы проверить почту.

МакКинли, 35-летний долговязый парень с растрёпанными волосами, был одним из 40 миллионов американцев, ищущих романтики на сайтах вроде Match.com, J-date и E-harmony. Но прошло уже девять месяцев со времени разрыва его предыдущих отношений, а его поиски не приносили результата. Он отправил десятки милых сообщений женщинам, которые потенциально могли ему подойти, исходя из алгоритмов OkCupid. Большинство сообщений игнорировались вовсе; ему удалось сходить всего лишь на шесть первых свиданий.

Тем ранним утром в июне 2012, пока его компилятор трудился над машинным кодом в одном окне, а его унылый аккаунт на сайте знакомств ничего не делал в другом, Криса осенило, что он делает всё неправильно. 

Он подходил к знакомствам в интернете так же, как любой другой пользователь. А теперь он осознал, что он должен и пару себе искать как математик.

OkCupid был основан математиками-выпускниками Гарварда в 2004 году, и поначалу он привлёк внимание пользователей именно своим математическим подходом к поиску пары. Пользователям предлагалось ответить на множество вопросов с вариантами ответов обо всём — от политики, религии и семьи до любви, секса и смартфонов.

В среднем респонденты выбирали около 350 вопросов из тысяч возможных : «Какое из предложений пойти в кино звучит для вас наиболее заманчиво?» или «Насколько важна религия/Бог в вашей жизни?» Каждый из вариантов ответа пользователь отмечает как приемлемый или неприемлемый в ответах своей «половинки», а также оценивает, насколько важен для него вопрос по пятибалльной шкале от «безразлично» до «обязательно». А затем алгоритм сопоставления на OkCupid использует эти данные, чтобы выяснить совместимость пары. Чем ближе к 100% — математическая вторая половинка — тем лучше.

Но математическая совместимость МакКинли с дамами из Лос-Анджелеса была ужасной. Алгоритм OkCupid использует только те вопросы, на которые решили ответить оба человека, а выбранные МакКинли вопросы оказались не слишком популярными. Когда он пролистал список совпадений, выяснилось, что меньше сотни женщин подходят ему на 90% и больше. И это в городе, где живёт около 2 миллионов женщин (и примерно 80 тысяч из них есть на OkCupid). На сайте, где показатель совместимости делает тебя заметным, он был практически невидимкой. 

Он понял, что ему необходимо увеличить этот показатель. Если посредством статистической выборки МакКинли мог бы узнать, какие вопросы волнуют тех женщин, которые ему нравятся, он мог бы создать себе новый аккаунт, и честно ответить на эти вопросы, а другие просто проигнорировать. Он мог бы точно совпасть с любой из девушек Лос-Анджелеса, которые ему подходят, и не совпасть с остальными.

Крис МакКинли использовал скрипт на Python, чтобы перебрать сотни вопросов на OkCupid. Затем он рассортировал представительниц прекрасного пола на семь групп, вроде «разносторонняя» и «полная мыслей», с разными характеристиками.

Даже для математика МакКинли необычен. Выросший на окраине Бостона, он окончил Миддлберри-Колледж в 2001 году с дипломом по китайскому языку. В августе того же года он устроился на неполный рабочий день в Нью-Йорке, делая переводы с китайского на английский для компании, располагавшейся на 91 этаже северной башни Всемирного торгового центра. Башни обрушились пять недель спустя. (МакКинли нужно было быть в офисе только в 2 часа дня. Он ещё спал, когда первый самолёт врезался в северную башню в 8:46 утра). «После этого я спросил себя: чем же я хочу заниматься на самом деле», — говорит он. Друг из Колумбийского университета пригласил его в знаменитую профессиональную команду по блэкджеку из Массачусетского технологического института, и следующие несколько лет он провёл, мотаясь между Нью-Йорком и Лас-Вегасом, считая карты и зарабатывая этим до 60 000 долларов в год.

Этот опыт пробудил в нем интерес к прикладной математике, и в итоге вдохновил его на получение магистерской, а затем и докторской степени в этой области. «Они могли использовать математику во множестве различных ситуаций», — рассказывает он. «Они могли увидеть какую-нибудь новую игру — например, трёхкарточный покер Пай Гау— затем пойти домой, написать код, и вернуться с имеющейся стратегией для победы».

И теперь он собирался сделать нечто подобное ради любви. Для начала ему нужны были данные. И пока его диссертационная работа шла своим чередом, он создал 12 фейковых аккаунтов на OkCupid и написал Python-скрипт для управления ими. Скрипт должен был искать по заданным параметрам (гетеро- и бисексуальных женщин в возрасте от 25 до 45) и собирать в аккаунтах максимум доступной информации: этническая принадлежность, рост, отношение к курению, астрологический знак — «ну и всё в этом духе», говорит он.

Чтобы найти ответы на вопросы, ему пришлось покопаться. OkCupid позволяет пользователям видеть ответы других только в том случае, если пользователь сам ответил на этот конкретный вопрос. МакКинли настроил своих ботов так, чтобы они просто выбирали случайным образом ответ на все вопросы: он не планировал использовать эти фейковые аккаунты для поиска половинки, поэтому ответы не имели значения. А затем ответы женщин копировались в базу данных.

В августе 2013 года нечто подобное проделал московский разработчик Роман Кузьмин с сервисом онлайн-знакомств Loveplanet. Он написал скрипт, по заданному набору параметров отбирающий девушек, а потом при помощи ботов заходящий на их страницы и проставляющий лайки к фотографиям. После этого скрипт анализировал, кто из девушек ответил Роману симпатией, и предоставлял список страниц, чем облегчал поиск. Тогда Роман рассказывал, что ему удалось познакомиться с как минимум пятью по-настоящему привлекательными девушками.

МакКинли с удовлетворением наблюдал за работой своих ботов. Когда было собрано около тысячи аккаунтов, он столкнулся с первым препятствием. На OkCupid работает система против подобных способов сбора информации: она с легкостью замечает неправдоподобно быстрые ответы на вопросы. Один за другим, боты отправлялись в бан.

И ему пришлось учить их действовать, как живые люди.

Он обратился к своему другу, Сэму Торриси, нейробиологу, который недавно обучал МакКинли теории музыки в обмен на уроки по высшей математике. Торриси тоже был зарегистрирован на OkCupid, и любезно согласился установить шпионское ПО на свой компьютер, чтобы можно было отслеживать то, как он пользуется сайтом. Имея эти данные на руках, МакКинли запрограммировал своих ботов симулировать скорость печати и количество кликов, которые делал Торриси. Он принёс из дома второй компьютер и подключил его к широкополосному интернету в отделе математики, чтобы тот мог бесперебойно работать 24 часа в сутки.

Через три недели он собрал 6 миллионов вопросов и ответов от 20 тысяч женщин по всей стране. Его диссертация была отодвинута на второй план, так как он погрузился в изучение данных. Он стал оставаться в своём кабинете и на ночь. Он забросил свою квартиру вовсе, променяв её на клетушку с бежевыми стенами. Когда приходило время сна, он укладывался на тонкий матрас прямо на своём столе.

Алгоритм поиска любви

Для реализации своего плана работы МакКинли нужно было найти шаблон, применимый к собранным данным — способ группировать женщин на основании их схожести. Прорыв наступил, когда он написал алгоритм, усовершенствовав так называемый K-Modes от Bell Labs. Впервые этот алгоритм использовали в 1998 году, чтобы проанализировать поражённые посевы сои. Алгоритм использует категориальные данные и связывает их наподобие комков цветного воска, плавающих в лавовой лампе. Немного изменяя параметры, он мог воздействовать на результаты, превращая их в плоскость или объединяя в единый твёрдый шар.

Он перебирал параметры, пока не добился того, чтобы 20 тысяч женщин оказались разбиты на семь статистически различных групп на основании их ответов на вопросы. «Я был в экстазе», — говорит он. «Это был лучший день июня».

Он дал своим ботам другое задание: собрать выборку из 5 тысяч женщин в Лос-Анджелесе, которые заходили на OkCupid в прошлом месяце. Проверка полученных данных через K-Modes подтвердила, что они были разделены на группы примерно так же. Его статистическая выборка работала.

Теперь ему осталось решить, какая из групп подходила ему больше всего. Он просмотрел несколько аккаунтов из каждой группы. Одна из групп была слишком молодой, две – слишком возрастными, ещё одна оказалась чересчур увлеченной христианством. Но тут ему попалась группа, в которой преобладали девушки около 25 лет, выглядевшие как музыканты и артисты в стиле инди. Это была золотая группа. Стог сена, в котором он найдёт свою иглу. Где-то внутри этой группы и прячется его настоящая любовь.

На самом деле соседняя группа тоже выглядела неплохо — женщины чуть постарше, занимавшиеся творческими профессиями, вроде редакторов и дизайнеров. Он решил попробовать обе группы. Он создал два аккаунта и оптимизировал один под группу А, а второй – под группу B.

Он провёл текстовый анализ данных этих двух групп, чтобы узнать, что их интересует; образование оказалось популярной темой, поэтому в своей биографии он подчеркнул, что работает профессором математики. Тем не менее, вопросник оставался немаловажной частью. Он отобрал 500 вопросов, которые были наиболее популярны в обеих группах. МакКинли уже решил, что будет отвечать честно — он не хотел, чтобы его будущие отношения были основаны на сгенерированной компьютером лжи. Но он позволил компьютеру выяснить, какой показатель важности стоит присвоить каждому из вопросов, используя алгоритм под названием «алгоритм усиления классификаторов».

После этого он создал два аккаунта, в одном была фотография, где он взбирается на гору, а в другом — где он играет на гитаре на концерте. Один из вопросов гласил: «Вне зависимости от дальнейших планов, что сейчас имеет для Вас большее значение — секс или любовь?». Ответ: любовь, конечно же. Но для более молодой группы он последовал подсказке компьютера и оценил вопрос как «очень важный», а для группы B как «обязательный».

Когда последний вопрос был отвечен и оценен, он запустил поиск на OkCupid среди женщин в Лос-Анджелесе на основании процентного совпадения. В верху списка оказалась девушка, совместимость с которой составляла 99 процентов. Он стал прокручивать список дальше, и дальше, и дальше… Спустя десять тысяч женщин со всего Лос-Анджелеса показатель совместимости всё ещё был выше 90%.

Ему нужно было предпринять ещё одно действие, чтобы его заметили. Пользователей OkCupid уведомляют, если кто-то просматривает их страницу. Поэтому он написал ещё одну программу для посещения страниц женщин из верхушки своего списка, ранжируя по возрасту: тысяча 41-летних женщин в понедельник, ещё тысяча в возрасте 40 лет во вторник, и через две недели он «просматривал» страницы 27-летних. В ответ около 400 женщин посещали его аккаунты каждый день. И ему начали приходить сообщения.

«Я раньше не находила никого с такими отличными показателями, и я считаю твой профиль интригующим», — написала одна женщина. «К тому же, ты сильный мужчина, у которого всё отлично с цифрами… я бы сказала – привет».

«Привет! Твой аккаунт меня поразил, и я хочу познакомиться», — написала другая. «Думаю, у нас много общего, может, не в математике, но во многих других отличных вещах!»

«Ты действительно переводишь с китайского?» — спросила ещё одна. «Я немного занималась китайским, но ничего особо не вышло».

Математическая часть поисков МакКинли была завершена. Осталась только одна вещь. Он должен был выйти из кабинета и проверить свои изыскания на практике. Ему нужно было отправиться на свидания.

87 неудачных свиданий

30 июня, приняв душ в тренажёрном зале университета, он направился на своём потрёпанном Ниссане через весь город на первое свидание, состоявшееся благодаря исследованию данных. Шейла была веб-дизайнером из группы А, молодых творческих особ. Они встретились за обедом в кафе в Эхо-парке. «Было страшно», — говорит МакКинли. «Вплоть до того момента всё это было чем-то вроде учебного задания».

К концу свидания с Шейлой обоим стало ясно, что притяжения не возникло. На следующий день он отправился на второе свидание с привлекательным редактором блога из группы B. Он планировал романтическую прогулку вдоль озера в Эхо-парке, но она оказалась не в настроении. Она читала Пруста и была недовольна своей жизнью. «Это было несколько депрессивно», — говорит он.

Третье свидание тоже было с представительницей группы B. Он встретился с Элисон в баре в Корея-тауне. Она училась на сценариста, а на плече у неё была татуировка в виде спирали Фибоначчи. МакКинли напился корейского пива и очнулся в своём кабинете на следующее утро в тяжёлом похмелье. Он отправил Элисон сообщение на OkCupid, но она не ответила.

Отказ его расстроил, но он по-прежнему получал по 20 сообщений в день. Свидания благодаря его усовершенствованным аккаунтам превратились в совершенно другую игру. Теперь он мог игнорировать сообщения, состоявшие из одной фразы. Он отвечал только на те, где чувствовался юмор или если ему казалась интересной биография. Прежде, когда он был инициатором, ему приходилось писать от трёх до пяти сообщений, чтобы добиться единственного свидания. А теперь ему было достаточно одного ответа: «Мне кажется, ты классная. Хочешь встретиться?»

К двадцатому свиданию он начал замечать скрытые параметры. В более молодой группе у женщин было две или более татуировок, и они жили в восточной части Лос-Анджелеса. В другой большая часть женщин имела небольших собачек, которых они просто обожали.

Его первые свидания были тщательно спланированы. Но когда он решил ускорить «работу» со своей очередью, он перешёл к коротким встречам за обедом или чашкой кофе, зачастую ходя на два свидания в день. Он разработал набор личных правил для своего марафона по поиску любви. Во-первых, больше не выпивать. Заканчивать свидание в нужный момент, не затягивать. И никаких походов в кино или на концерт. «Ничего такого, где ваше внимание направлено на посторонний объект, а не на друг друга», — объясняет он. «Это неэффективно».

Любовь — это поле данных

Код МакКинли разделил женщин на статистически-идентифицируемый группы по схожести их ответов на вопросы. Одна из групп, которую он назвал «Зелёные» (greens), состояла из тех, кто был новичком в поиске любви в интернете; другие, так называемые «Саманты» (samanthas), были постарше и более дерзкие. Вот как отвечали разные группы на 4 самых популярных вопроса.

Спустя месяц свиданий с представительницами обеих групп, он решил, что тратит слишком много времени на дорогу, встречаясь с девушками из восточной части города, из группы татуированных. Он удалил свой аккаунт для группы А. Эффективность усилилась, но результаты были всё те же. Лето подходило к концу, он сходил на 55 свиданий, и каждое аккуратно записал в тетрадь. Только три из них закончились второй встречей, и только одно повторилось трижды.

Для большинства неудачные свидания заканчиваются проблемами с самооценкой. Но в случае МакКинли было ещё хуже: он засомневался в своих расчётах.

А потом пришло сообщение от Кристины Тин Вань, 28-летней художницы и активистки по отмене тюремного заключения. МакКинли появился в результатах её поискового запроса: парень 6 футов ростом, с голубыми глазами, недалеко от Калифорнийского университета, где она получала магистерское образование по искусству. Они совпадали на 91 процент.

Он встретил её в парке со скульптурами возле кампуса. Оттуда они отправились в суши-кафе при колледже. Он сразу всё почувствовал. Они болтали о книгах, искусстве, музыке. Когда она призналась, что слегка подправила свой аккаунт, прежде чем написать ему, он ответил ей рассказом о своём «взломе во имя любви». Рассказал ей всю историю.

«Я подумала, что это нехорошо и цинично», — говорит она. «И мне это понравилось».

Это было первое свидание номер 88. За ним последовало второе, и третье. Спустя две недели они оба приостановили активность своих аккаунтов на OkCupid.

«Думаю, то, что я сделал, было просто чуть более алгоритмично, масштабно и с использованием компьютера, но в целом на сайте все занимаются тем же самым», — говорит МакКинли. Каждый пытается создать оптимальный аккаунт, а у МакКинли были ещё и необходимые для этого данные.

Она согласна

Прошёл год после их первого свидания, и МакКинли и Тин Вань встретились со мной в суши-баре Вествуд, где начинались их отношения. МакКинли получил свою докторскую степень и сейчас получает второе высшее по музыке. Тин Вань отправилась на годовую стажировку по искусству в Катаре. А в Калифорнию приехала, чтобы навестить МакКинли. Они всегда на связи по Skype, и она уже несколько раз приезжала.

По моей просьбе МакКинли принёс свою тетрадь для записей. Тин Вань не видела её прежде. Страница за страницей МакКинли исписал её формулами и уравнениями, а в конце составил список женщин и свиданий с ними, сделав краткие заметки о каждой. Тин Вань, листая тетрадь, смеялась над особенно забавными моментами. 24 августа, например, он пригласил двух девушек на один и тот же пляж. «Это ужасно», — говорит она.

Для Тин Вань взлом OkCupid МакКинли — просто забавная история. Но вся эта математика и коды — всего лишь пролог к их общей истории. Истинный взлом в отношениях происходит тогда, когда вы встречаетесь. «Люди гораздо более сложны, чем их аккаунт», — говорит она. «Поэтому тот способ, благодаря которому мы познакомились, несколько поверхностен, но всё, что произошло потом — уж точно не поверхностно. Мы строили свои отношения большим трудом».

МакКинли соглашается: «У нас прекрасные отношения не только потому, что мы “совпали”. Это был всего лишь механизм для того, чтобы мы встретились. Мне удалось использовать OkCupid, чтобы найти любовь».

Она возмущается: «Ты меня не находил. Это я тебя нашла», — говорит она, толкая его локтем. Подумав, МакКинли признаёт, что она права. Спустя неделю Тин Вань возвращается в Катар, и в один из ежедневных разговоров по Skype МакКинли достаёт кольцо с бриллиантом и держит его перед веб-камерой. Она говорит: «Да».

Они пока точно не уверены, когда именно поженятся. Нужно ещё провести исследование, чтобы определить оптимальный день для свадьбы.

Этот материал является переводом оригинальной статьи Кевина Паулсена «How a Math Genius Hacked OkCupid to Find True Love» в Wired.

#Статья #статистика #интернет_знакомства #исследование #сервисы_онлайн_знакомств #OkCupid #Крис_МакКинли