{"id":912,"title":"\u041f\u043e\u0447\u0435\u043c\u0443 \u043a\u0430\u043d\u0430\u0434\u0441\u043a\u0438\u0435 \u043b\u044e\u0431\u0438\u0442\u0435\u043b\u0438 \u043a\u0432\u0430\u0434\u0440\u043e\u0446\u0438\u043a\u043b\u043e\u0432 \u043f\u043e\u043a\u0443\u043f\u0430\u044e\u0442 \u0437\u0430\u043f\u0447\u0430\u0441\u0442\u0438 \u0432 \u0420\u043e\u0441\u0441\u0438\u0438","url":"\/redirect?component=advertising&id=912&url=https:\/\/vc.ru\/pochta\/325041-kak-kanadskie-lyubiteli-snegohodov-i-kvadrociklov-otkryli-dlya-sebya-rossiyu&placeBit=1&hash=cd4c11b0c5494bf89049a9ca742e24d7dc78c6cc04a793c3204946531d5630c3","isPaidAndBannersEnabled":false}

Как информацию наших профилей во «ВКонтакте» используют для маркетинговых исследований

Всем привет!

Как уже многие из нас знают, оставляя о себе информацию в социальных сетях (например, написав какой-то пост или лайкнув запись), вы оставляете за собой некий «цифровой след».

Не будем прибегать к научным терминам, так как это скучно, да и в целом не особо нужно, а перейдем сразу к делу. Также в этой теме не будут затронуты конспирологические теории (а хочется).

В этой статье я хочу рассказать об интересном проекте ребят из «Яндекса», которые проанализировали поведение пользователей музыкальных сообществ в «ВКонтакте» и любезно поделились методом проведения исследования и результатами методом тематического моделирования на GitHub (ссылка на исследование и все материалы к нему внизу).

Если у вас есть интерес к изучению поведения потребителей, или вам, допустим, необходимо написать курсач или дипломную работу по поведению потребителей – то вы можете воспользоваться инструкциями ребят. Инструкция работает, даже если ты не программист, однако попотеть все же придется.

Кстати, как же не хайпануть и не упомянуть Америку: цифровые следы потребителей и работа с цифровыми профилями потребителей также активно используются в политике. Так, еще в 2016 году команда Д. Трампа перед выборами использовала данные цифровых следов пользователей и отправила в социальных сетях свыше 175 тысяч вариаций сообщений американцам. Сообщения могли отличаться незначительными деталями, однако они были хорошо подстроены под каждого конкретного человека.

Несколько позже данная технология была использована волонтерами Д. Трампа для общения с жителями из разных штатов и даже районов, в данном случае стиль и лексикон общения с жителями варьировались в зависимости от результатов исследования. Чем закончились выборы, вы уже знаете.

Говоря о том, как использовать тематическое моделирование для наших изысканий, пропустим слишком технические детали, однако упомянем, что же все-таки сделали ребята:

  • Выбрали сообщества, которые нужно проанализировать;
  • Спарсили айди пользователей, а затем их стены;
  • Проанализировали получившиеся массивы данных, выкинули т.н. выбросы (про выбросы в статистике можно почитать здесь);
  • «Чистые» данные проанализировали методом тематического моделирования (читай здесь);
  • Интерпретировали результаты.

Звучит все довольно просто, однако это весьма долгая и интересная работа. Итак, какие для анализа были выбраны жанры: Эстрада, Попса, Рок, Метал, Классика, Рэп, Шансон, Джаз, Панк, Танцевальная, Инди, из них выбраны 134 исполнителя. Для каждого направления были найдены соответствующие сообщества во «ВКонтакте» по указанной выше процедуре. В результате анализа получили тематические профили любителей каждого из жанров.

Для чего это нужно

С точки зрения маркетинга это круто тем, что позволит повысить эффективность маркетинговой стратегии и улучшить уровень кастомизации маркетинговых сообщений, так как тематический профиль позволяет понять, что интересует потребителей и как они об этом говорят.

Несколько примеров результатов построения модели:

Первой у нас будет идти группа любителей шансона (рисунок ниже). Как мы видим, сложные модели имеют ряд недостатков, например, в данном случае мы можем наблюдать неинтерпретируемую тему.

В остальном любители шансона у себя на стене говорят о песнях о жизни и любви, о человеке, рассуждают на философские тематики, попсовых песнях, видимо, любят путешествовать и т.д.

В целом, у них довольно много обсуждений разных песен на стене, и в то же время им мало интересно обсуждение политики, довольно редко встречается обсуждение Тимати и репа в целом (почему-то связаны в одну тему рэп и говно я так и не понял, но темы могут интерпретироваться по-разному, это субъективный параметр).

Далее обсудим любителей песен Киркорова (о да, их можно выделить в один жанр). Тематический профиль графически отображен на рисунке ниже. Как видно из тематических профилей, любители песен Филиппа Киркорова любят писать благодарности за концерт (как же без них), рассуждать на философские темы, музыку, постят тексты попсовых песен. Темы Тимати, рэпа, политика и прочие (можете посмотреть на рисунке) им не особо интересны.

Последним рассмотрим довольно популярного современного исполнителя – Тимати. Рисунок уже по традиции ниже. Как видно, здесь уже зрители не пишут столько благодарностей за концерты по сравнению с Филиппом Бедросовичем, видимо это обусловлено психологическими характеристиками пользователей. Тоже любят порассуждать о жизни и о любви и т.д.

Еще с помощью Python можно посмотреть какие жанры сильно различаются между собой и какие схожи по косинусному расстоянию (рисунок ниже). Как мы видим, шансон и классика далеки друг от друга (логично же), как и шансон с джазом и джаз с попсой. В то же время есть много иных жанров, пользователи которых схожи между собой.

В целом тема довольно интересная и для маркетинга, и для личного опыта. Если вам интересно, как это работает, можно посмотреть проект с лекциями и кодом на GitHub. Там, если порыться, можно найти материалы по анализу сообществ с мемами разного качества.

Или можете посмотреть видео на YouTube без СМС и регистрации:

З.Ы. Экспертов приглашаю в комменты, что вы думаете о таком подходе?))

З.З.Ы. Спасибо всем за адекватную критику, в статье и правда было много косяков ;))

0
140 комментариев
Популярные
По порядку
Написать комментарий...

Комментарий удален по просьбе пользователя

6

Комментарий удален по просьбе пользователя

1

Комментарий удален по просьбе пользователя

2

не соглашусь, посты в соцсети - это публичная информация, её можно собирать и это не запрещено)

0

Комментарий удален по просьбе пользователя

0
Террористический месяц

а мне вот интересно, ваши профессиональные преподы из ВШЭ не учли тот факт, что налёты на любую площадку и лавина одинаково построенных статей вызывают негатив со стороны аудитории и с каждым разом становится только хуже? 

5

Я об этом думал, на самом деле

Настолько плох контент?

1
Террористический месяц

Понимаешь, беда даже не в качестве (да, оно плохое), а в подходе - что вашем, что преподов. Не понимаю, как, будучи вроде как профессионалом в своём деле (раз уж ты учишь ему других), можно не предположить очевидного развития событий на площадке с давно сформировавшейся стилистикой, форматом статей и банально формой общения. 
Насколько понимаю, вам дали задание по сбору просмотров-классов-закладок. Вы выбрали одну из трёх площадок и понеслись. Но раз уж ты (не только ты, просто обращение к любому из вас) видишь реакцию аудитории на статью твоего коллеги (минусы, ржач, шутки про ВШЭ), дак подумай, как по-другому подать материал. 
Не нужны вот эти одинаковые "Всем привет", "Спасибо за внимание", они уместны только в презентации на лекции, никак не здесь и где-либо в интернете.
Ну и качество, конечно же, да. Видно, что большинство из вас наспех набросали нечто (ты вроде постарался, прости, не читала, но на глаз выглядит хотя бы отформатированно), чтобы отмахнуться от работы. И это а - неуважение к себе и б - неуважение к площадке (картинка крёстного отца), на которую ты идёшь в ожидании лайков. Если ты приходишь, зарегистрировавшись час назад, и ляпаешь аудитории в лицо непроработанное студзадание, то тебе и в ответ прилетит то же самое. 
А годный, интересный контент всегда приветствуется.
И по формату. У тебя и твоих коллег материалы совершенно одинаковы, если даже пробежаться по ним взглядом: этакая стандартная экзаменационная работа. Абзац, картинка, график, ссылка, абзац, ссылка, график. Стилистика тоже одинаковая. Надо избавляться от этого - почитайте статьи, не знаю, на N+1, посмотрите, как они строятся. 

2

Может в этом и состоит их эксперимент, они изучают реакцию аудитории "онлайн журналов" на налёты своих подопытных

1
Террористический месяц

Нет, у них там задание написать любую статью и собрать определённое кол-во лайков, просмотров и закладок

0

Комментарий удален по просьбе пользователя

4

Приватные профили удалены из выборки) Не хотел технические детали описывать) ссылку добавил, спасибо за коммент)

1

Самый очевидный вопрос: ВШЭ?

2

Ага) Скоро Вышка будет местным мемом))

1
Террористический месяц

Вижу статью без нормального форматирования - ставлю дизлайк и не читаю.
Заебали.

2

Можно линк на статью с норм форматированием? Я не понимаю тебя

0
Террористический месяц

Обратись к редакторам - они не редко рады помочь в оформлении хороших статей. @Сергей Звезда например.

1
Террористический месяц

Экспертов приглашаю в комменты, что вы думаете о таком подходе?))

в жопу контакт, ваши профили и маркетинговые исследования

1

В следующий раз будем анализировать Tj тогда)))

2
Террористический месяц

Наканецта

0

Маркетинговые исследования проводяться как правило для эффективного маркетинга, а не для подбора контента под личный интерес. Вк - крупная соцсеть, в которой можно рекламиться, и эффективней, если реклама хорошо подобрана под ЦА.

0

Комментарий удален по просьбе пользователя

2

ну не скажи, это улучшение рекомендательных сервисов в том числе

0

Чем хорошо косинусное расстояние (не эксперт), чем лучше корреляции? Вначале не заметил и подумал было, вторая, для неё значения незначительны. Можно на тех же данных сделать корреляцию наверное?
Да и в кс, значения изменяются от 0 к 1, да? 0,23 там уже - высокое значение? ред.

0

я строил корреляции между темами, а не группами, но между группами тоже думаю можно ее построить

0

Дополнил вопросом. И да, корреляция более известна, было б интересно её увидеть.

0

повысить эффективность маркетинговой стратегии

Всегда было интересно увидеть какие-то реальные _кейсы_ повышения конверсии (или как там у них это говно называется) такими методами, типа эффективность рекламы с учётом тематического профиля / без учёта, или растёт только бюджет у маркетологов?

0

Комментарий удален по просьбе пользователя

0

Кстати об этой теме, таргетинг, норм машина работает, сегодня часов в 6 на улице говорил со знакомой что круто было бы купить турник домой, в 18:55 первая реклама о турниках в вк....

0

Несомненно, просто хотелось бы увидеть презентацию "качественная методика -> количественный выхлоп". Наверное в открытом виде для неспециалистов такого и не бывает

0

По затратам такое исследование дешевле классического количественного, так как нужен один кодер

0

Комментарий удален по просьбе пользователя

0

А, чуть ключевое не забыл спросить - как посты распредлелялись по темам, вручную? Если автоматически, то как, по каким признакам? Автоматически, по кр. мере если не сильно заморачиваться, может быть значимый % ошибок, особенно в случае иронии/пародии на контент другой темы/направленности, плюс бывают важны вложения (фото/видео/аудио).

0

я так понял, что это вероятностная модель, которая считает вероятность упоминания документа в той или иной теме. Там какой-то сложный механизм, связанный с распределением Дирихле (на этом этапе мой мозг отключился)

Но в целом, если тебя хватит, можешь почитать презу, там подробно расписано.

0

 я так понял

В смысле, ты юзал для этого (для распределения постов по темам) что-то стороннее, что? А мог попасть в разные темы, например, на  60% одна, на 40% другая? Это было бы более гибко и релевантно. ред.

0

Нет ссылки в
 (про выбросы в статистике можно почитать здесь)

0

спасибо, адейтну)

0

На всякий, тут можно давать ссылки на слова/фразы. 

0

не вкурил, множество тем задается или получается уже в результате анализа?

0

получается в рез-те анализа, их кол-во задается мануально

0

судя по скрину выше и pdf, темы и набор слов все таки захардкожены

0

Комментарий удален по просьбе пользователя

0
Читать все 140 комментариев
null