{"id":1021,"title":"\u0412\u0435\u0447\u0435\u0440\u0438\u043d\u043a\u0438 \u043c\u043e\u0433\u0443\u0442 \u043d\u0435 \u0437\u0430\u043a\u0430\u043d\u0447\u0438\u0432\u0430\u0442\u044c\u0441\u044f. \u0421\u043f\u0430\u0441\u0438\u0431\u043e ZHU \u0437\u0430 \u044d\u0442\u043e","url":"\/redirect?component=advertising&id=1021&url=https:\/\/tjournal.ru\/umg\/503131-poslushat-novoe-zhu-priglashaet-na-reyv-v-obnovlennom-albome&placeBit=1&hash=5a1eabc8ce3fcd372b7e444efcc94d4e5b48d776e8b3a540b0c0e5191fdac8fa","isPaidAndBannersEnabled":false}

Как информацию наших профилей во «ВКонтакте» используют для маркетинговых исследований

Всем привет!

Как уже многие из нас знают, оставляя о себе информацию в социальных сетях (например, написав какой-то пост или лайкнув запись), вы оставляете за собой некий «цифровой след».

Не будем прибегать к научным терминам, так как это скучно, да и в целом не особо нужно, а перейдем сразу к делу. Также в этой теме не будут затронуты конспирологические теории (а хочется).

В этой статье я хочу рассказать об интересном проекте ребят из «Яндекса», которые проанализировали поведение пользователей музыкальных сообществ в «ВКонтакте» и любезно поделились методом проведения исследования и результатами методом тематического моделирования на GitHub (ссылка на исследование и все материалы к нему внизу).

Если у вас есть интерес к изучению поведения потребителей, или вам, допустим, необходимо написать курсач или дипломную работу по поведению потребителей – то вы можете воспользоваться инструкциями ребят. Инструкция работает, даже если ты не программист, однако попотеть все же придется.

Кстати, как же не хайпануть и не упомянуть Америку: цифровые следы потребителей и работа с цифровыми профилями потребителей также активно используются в политике. Так, еще в 2016 году команда Д. Трампа перед выборами использовала данные цифровых следов пользователей и отправила в социальных сетях свыше 175 тысяч вариаций сообщений американцам. Сообщения могли отличаться незначительными деталями, однако они были хорошо подстроены под каждого конкретного человека.

Несколько позже данная технология была использована волонтерами Д. Трампа для общения с жителями из разных штатов и даже районов, в данном случае стиль и лексикон общения с жителями варьировались в зависимости от результатов исследования. Чем закончились выборы, вы уже знаете.

Говоря о том, как использовать тематическое моделирование для наших изысканий, пропустим слишком технические детали, однако упомянем, что же все-таки сделали ребята:

  • Выбрали сообщества, которые нужно проанализировать;
  • Спарсили айди пользователей, а затем их стены;
  • Проанализировали получившиеся массивы данных, выкинули т.н. выбросы (про выбросы в статистике можно почитать здесь);
  • «Чистые» данные проанализировали методом тематического моделирования (читай здесь);
  • Интерпретировали результаты.

Звучит все довольно просто, однако это весьма долгая и интересная работа. Итак, какие для анализа были выбраны жанры: Эстрада, Попса, Рок, Метал, Классика, Рэп, Шансон, Джаз, Панк, Танцевальная, Инди, из них выбраны 134 исполнителя. Для каждого направления были найдены соответствующие сообщества во «ВКонтакте» по указанной выше процедуре. В результате анализа получили тематические профили любителей каждого из жанров.

Для чего это нужно

С точки зрения маркетинга это круто тем, что позволит повысить эффективность маркетинговой стратегии и улучшить уровень кастомизации маркетинговых сообщений, так как тематический профиль позволяет понять, что интересует потребителей и как они об этом говорят.

Несколько примеров результатов построения модели:

Первой у нас будет идти группа любителей шансона (рисунок ниже). Как мы видим, сложные модели имеют ряд недостатков, например, в данном случае мы можем наблюдать неинтерпретируемую тему.

В остальном любители шансона у себя на стене говорят о песнях о жизни и любви, о человеке, рассуждают на философские тематики, попсовых песнях, видимо, любят путешествовать и т.д.

В целом, у них довольно много обсуждений разных песен на стене, и в то же время им мало интересно обсуждение политики, довольно редко встречается обсуждение Тимати и репа в целом (почему-то связаны в одну тему рэп и говно я так и не понял, но темы могут интерпретироваться по-разному, это субъективный параметр).

Далее обсудим любителей песен Киркорова (о да, их можно выделить в один жанр). Тематический профиль графически отображен на рисунке ниже. Как видно из тематических профилей, любители песен Филиппа Киркорова любят писать благодарности за концерт (как же без них), рассуждать на философские темы, музыку, постят тексты попсовых песен. Темы Тимати, рэпа, политика и прочие (можете посмотреть на рисунке) им не особо интересны.

Последним рассмотрим довольно популярного современного исполнителя – Тимати. Рисунок уже по традиции ниже. Как видно, здесь уже зрители не пишут столько благодарностей за концерты по сравнению с Филиппом Бедросовичем, видимо это обусловлено психологическими характеристиками пользователей. Тоже любят порассуждать о жизни и о любви и т.д.

Еще с помощью Python можно посмотреть какие жанры сильно различаются между собой и какие схожи по косинусному расстоянию (рисунок ниже). Как мы видим, шансон и классика далеки друг от друга (логично же), как и шансон с джазом и джаз с попсой. В то же время есть много иных жанров, пользователи которых схожи между собой.

В целом тема довольно интересная и для маркетинга, и для личного опыта. Если вам интересно, как это работает, можно посмотреть проект с лекциями и кодом на GitHub. Там, если порыться, можно найти материалы по анализу сообществ с мемами разного качества.

Или можете посмотреть видео на YouTube без СМС и регистрации:

З.Ы. Экспертов приглашаю в комменты, что вы думаете о таком подходе?))

З.З.Ы. Спасибо всем за адекватную критику, в статье и правда было много косяков ;))

0
140 комментариев
Популярные
По порядку
Написать комментарий...
Вооруженный будильник

Комментарий удален по просьбе пользователя

Ответить
6
Развернуть ветку
Разный щит

Комментарий удален по просьбе пользователя

Ответить
1
Развернуть ветку
Вооруженный будильник

Комментарий удален по просьбе пользователя

Ответить
2
5 комментариев
Развернуть ветку
Эдуард Тункевичус

не соглашусь, посты в соцсети - это публичная информация, её можно собирать и это не запрещено)

Ответить
0
Развернуть ветку
Вооруженный будильник

Комментарий удален по просьбе пользователя

Ответить
0
3 комментария
Развернуть ветку
Любой якорь

а мне вот интересно, ваши профессиональные преподы из ВШЭ не учли тот факт, что налёты на любую площадку и лавина одинаково построенных статей вызывают негатив со стороны аудитории и с каждым разом становится только хуже? 

Ответить
5
Развернуть ветку
Эдуард Тункевичус

Я об этом думал, на самом деле

Настолько плох контент?

Ответить
1
Развернуть ветку
Любой якорь

Понимаешь, беда даже не в качестве (да, оно плохое), а в подходе - что вашем, что преподов. Не понимаю, как, будучи вроде как профессионалом в своём деле (раз уж ты учишь ему других), можно не предположить очевидного развития событий на площадке с давно сформировавшейся стилистикой, форматом статей и банально формой общения. 
Насколько понимаю, вам дали задание по сбору просмотров-классов-закладок. Вы выбрали одну из трёх площадок и понеслись. Но раз уж ты (не только ты, просто обращение к любому из вас) видишь реакцию аудитории на статью твоего коллеги (минусы, ржач, шутки про ВШЭ), дак подумай, как по-другому подать материал. 
Не нужны вот эти одинаковые "Всем привет", "Спасибо за внимание", они уместны только в презентации на лекции, никак не здесь и где-либо в интернете.
Ну и качество, конечно же, да. Видно, что большинство из вас наспех набросали нечто (ты вроде постарался, прости, не читала, но на глаз выглядит хотя бы отформатированно), чтобы отмахнуться от работы. И это а - неуважение к себе и б - неуважение к площадке (картинка крёстного отца), на которую ты идёшь в ожидании лайков. Если ты приходишь, зарегистрировавшись час назад, и ляпаешь аудитории в лицо непроработанное студзадание, то тебе и в ответ прилетит то же самое. 
А годный, интересный контент всегда приветствуется.
И по формату. У тебя и твоих коллег материалы совершенно одинаковы, если даже пробежаться по ним взглядом: этакая стандартная экзаменационная работа. Абзац, картинка, график, ссылка, абзац, ссылка, график. Стилистика тоже одинаковая. Надо избавляться от этого - почитайте статьи, не знаю, на N+1, посмотрите, как они строятся. 

Ответить
2
29 комментариев
Развернуть ветку
Степан Маслов

Может в этом и состоит их эксперимент, они изучают реакцию аудитории "онлайн журналов" на налёты своих подопытных

Ответить
1
Развернуть ветку
Любой якорь

Нет, у них там задание написать любую статью и собрать определённое кол-во лайков, просмотров и закладок

Ответить
0
6 комментариев
Развернуть ветку
Разный щит

Комментарий удален по просьбе пользователя

Ответить
4
Развернуть ветку
Эдуард Тункевичус

Приватные профили удалены из выборки) Не хотел технические детали описывать) ссылку добавил, спасибо за коммент)

Ответить
1
Развернуть ветку
Максоний

Самый очевидный вопрос: ВШЭ?

Ответить
2
Развернуть ветку
Эдуард Тункевичус

Ага) Скоро Вышка будет местным мемом))

Ответить
1
Развернуть ветку
Любой якорь

Вижу статью без нормального форматирования - ставлю дизлайк и не читаю.
Заебали.

Ответить
2
Развернуть ветку
Эдуард Тункевичус

Можно линк на статью с норм форматированием? Я не понимаю тебя

Ответить
0
Развернуть ветку
Любой якорь

Обратись к редакторам - они не редко рады помочь в оформлении хороших статей. @Сергей Звезда например.

Ответить
1
5 комментариев
Развернуть ветку
Любой якорь

Экспертов приглашаю в комменты, что вы думаете о таком подходе?))
в жопу контакт, ваши профили и маркетинговые исследования

Ответить
1
Развернуть ветку
Эдуард Тункевичус

В следующий раз будем анализировать Tj тогда)))

Ответить
2
Развернуть ветку
Любой якорь

Наканецта

Ответить
0
Развернуть ветку
Посторонний

Маркетинговые исследования проводяться как правило для эффективного маркетинга, а не для подбора контента под личный интерес. Вк - крупная соцсеть, в которой можно рекламиться, и эффективней, если реклама хорошо подобрана под ЦА.

Ответить
0
Развернуть ветку
Разный щит

Комментарий удален по просьбе пользователя

Ответить
2
1 комментарий
Развернуть ветку
Эдуард Тункевичус

ну не скажи, это улучшение рекомендательных сервисов в том числе

Ответить
0
3 комментария
Развернуть ветку
Посторонний

Чем хорошо косинусное расстояние (не эксперт), чем лучше корреляции? Вначале не заметил и подумал было, вторая, для неё значения незначительны. Можно на тех же данных сделать корреляцию наверное?
Да и в кс, значения изменяются от 0 к 1, да? 0,23 там уже - высокое значение?

Ответить
0
Развернуть ветку
Эдуард Тункевичус

я строил корреляции между темами, а не группами, но между группами тоже думаю можно ее построить

Ответить
0
Развернуть ветку
Посторонний

Дополнил вопросом. И да, корреляция более известна, было б интересно её увидеть.

Ответить
0
1 комментарий
Развернуть ветку
Степан Маслов

повысить эффективность маркетинговой стратегии
Всегда было интересно увидеть какие-то реальные _кейсы_ повышения конверсии (или как там у них это говно называется) такими методами, типа эффективность рекламы с учётом тематического профиля / без учёта, или растёт только бюджет у маркетологов?

Ответить
0
Развернуть ветку
Вооруженный будильник

Комментарий удален по просьбе пользователя

Ответить
0
Развернуть ветку
Эдуард Тункевичус

Кстати об этой теме, таргетинг, норм машина работает, сегодня часов в 6 на улице говорил со знакомой что круто было бы купить турник домой, в 18:55 первая реклама о турниках в вк....

Ответить
0
15 комментариев
Развернуть ветку
Степан Маслов

Несомненно, просто хотелось бы увидеть презентацию "качественная методика -> количественный выхлоп". Наверное в открытом виде для неспециалистов такого и не бывает

Ответить
0
1 комментарий
Развернуть ветку
Эдуард Тункевичус

По затратам такое исследование дешевле классического количественного, так как нужен один кодер

Ответить
0
Развернуть ветку
Вооруженный будильник

Комментарий удален по просьбе пользователя

Ответить
0
7 комментариев
Развернуть ветку
Посторонний

А, чуть ключевое не забыл спросить - как посты распредлелялись по темам, вручную? Если автоматически, то как, по каким признакам? Автоматически, по кр. мере если не сильно заморачиваться, может быть значимый % ошибок, особенно в случае иронии/пародии на контент другой темы/направленности, плюс бывают важны вложения (фото/видео/аудио).

Ответить
0
Развернуть ветку
Эдуард Тункевичус

я так понял, что это вероятностная модель, которая считает вероятность упоминания документа в той или иной теме. Там какой-то сложный механизм, связанный с распределением Дирихле (на этом этапе мой мозг отключился)

Но в целом, если тебя хватит, можешь почитать презу, там подробно расписано.

Ответить
0
Развернуть ветку
Посторонний

 я так понял
В смысле, ты юзал для этого (для распределения постов по темам) что-то стороннее, что? А мог попасть в разные темы, например, на  60% одна, на 40% другая? Это было бы более гибко и релевантно.

Ответить
0
20 комментариев
Развернуть ветку
Посторонний

Нет ссылки в
 (про выбросы в статистике можно почитать здесь)

Ответить
0
Развернуть ветку
Эдуард Тункевичус

спасибо, адейтну)

Ответить
0
Развернуть ветку
Посторонний

На всякий, тут можно давать ссылки на слова/фразы. 

Ответить
0
1 комментарий
Развернуть ветку
Владимир Прохоровитч

не вкурил, множество тем задается или получается уже в результате анализа?

Ответить
0
Развернуть ветку
Эдуард Тункевичус

получается в рез-те анализа, их кол-во задается мануально

Ответить
0
Развернуть ветку
Владимир Прохоровитч

судя по скрину выше и pdf, темы и набор слов все таки захардкожены

Ответить
0
1 комментарий
Развернуть ветку
Процентный спрей

Комментарий удален по просьбе пользователя

Ответить
0
Развернуть ветку
Читать все 140 комментариев
null