[ { "id": 1, "label": "100%×150_Branding_desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "cndo", "p2": "ezfl" } } }, { "id": 2, "label": "1200х400", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "cndo", "p2": "ezfn" } } }, { "id": 3, "label": "240х200 _ТГБ_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "i", "ps": "cndo", "p2": "fizc" } } }, { "id": 4, "label": "240х200_mobile", "provider": "adfox", "adaptive": [ "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "i", "ps": "cndo", "p2": "flbq" } } }, { "id": 5, "label": "300x500_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "cndo", "p2": "ezfk" } } }, { "id": 6, "disable": true, "label": "1180х250_Interpool_баннер над комментариями_Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "clmf", "p2": "ffyh" } } }, { "id": 7, "disable": true, "label": "Article Footer 100%_desktop_mobile", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fjxb" } } }, { "id": 8, "label": "Fullscreen Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "cndo", "p2": "fjoh" } } }, { "id": 9, "label": "Fullscreen Mobile", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "cndo", "p2": "fjog" } } }, { "id": 10, "disable": true, "label": "Native Partner Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyb" } } }, { "id": 11, "disable": true, "label": "Native Partner Mobile", "provider": "adfox", "adaptive": [ "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyc" } } }, { "id": 12, "label": "Кнопка в шапке", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "cndo", "p2": "fdhx" } } }, { "id": 13, "label": "DM InPage Video PartnerCode", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox_method": "create", "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "cndo", "p2": "flvn" } } } ] { "gtm": "GTM-NDH47H" }
{ "author_name": "Roman Solovev", "author_type": "self", "tags": [], "comments": 48, "likes": 42, "favorites": 12, "is_advertisement": false, "section": "club" }
16 925
Клуб
Редактирование закрыто

«***, мы умели отдохнуть красиво»: анализ и визуализация текстов «Кровостока»

Рейтинг часто используемых слов в песнях и доля нецензурной лексики.

Поделиться

В избранное

В избранном

Всем привет! Решил завести новое хобби. Анализировать и визуализировать всё, что меня заинтересует – от всякой ерунды до более-менее серьёзных вещей. Надеюсь это делать с какой-то периодичностью, но пока не знаю, как пойдёт. Первое, чем хотелось бы с вами поделиться, — это небольшая визуализация текстов Кровостока.

«Кровосток» — культовая группа нулевых, которая для большинства не нуждается в представлении. Не то, чтобы я большой их фанат, но такие вещи как «Куртец» и «Биография», действительно цепляют. Давно хотел провести небольшой анализ их творчества и визуально его представить.

Начнём с того, что у них есть 5 студийных альбомов: «Река Крови» (2004), «Сквозное» (2006), «Гантеля» (2008), «Студень» (2012) и «Ломбард» (2015). Для анализа я буду использовать только их без всяких синглов. У меня есть список вопросов, на которые я хочу получить ответы.

1. Какие слова чаще встречаются в лирике Кровостока?

2. Каков общий процент мата по всем альбомам?

3. Какая динамика у доли мата в текстах по годам?

Облако слов

Всего в пяти альбомах представлено 10 911 слов, если исключить частицы, предлоги, союзы и местоимения (которые в данном анализе я считаю мусором). Из них 426, а именно 3,9 % – это мат, то есть слова, у которых один из четырех знакомых нам корней. Какие же слова являются самыми популярными? Давайте взглянем.

Сразу дам систему обозначений, которую я использовал для завуалирования мата (как же я, простите, ******** [устал] отлавливать эти слова, хочется сказать – ребята, давайте жить нецензурно):

HHH – мужской половой орган.

BBBTB – выражение раздражения, удивления.

BBB – краткая форма выражения раздражения, удивления.

PPPPPPP – нечто непонятное, ненужное или нежелательное.

PPPPPP – оценка чего-либо как очень плохого, тяжёлого, непреодолимого.

PPPPP – женский половой орган.

ZZZZZ – проблемы, сложности.

EEEEE – инициативно совершать половой акт.

ZZZZZZZ – очень хорошо, прекрасно, великолепно.

Можете в комментариях писать, правильно ли опознали все слова.

Облако слов из текстов «Кровостока»

Как можно увидеть, пять самых популярных слов – это «HHH», «можно», «сдохнуть», «есть» и «жизнь». Я немного поленился приводить все существительные к именительному падежу, кроме слова «HHH», и глаголы в совершенную форму, так что некоторые слова могли набрать больше баллов.

Больший интерес вызовет изучение всей картины из слов. В облаке проглядывается романтика 90-х, темы секса и наркотиков, некая беспросветность жизни и описание чувств лирического героя. В принципе, я думаю, этого словарного запаса хватит, чтобы написать одну из книг про криминал и Россию, которые можно купить в ларьках на станциях электричек.

Динамика мата по годам

Теперь давайте взглянем на то, как менялась доля мата в текстах Кровостока из альбома в альбом. Интерактивный график можно пощупать здесь, а статическую картинку прилагаю ниже.

Матерная структура текстов «Кровостока»

Количество слов из альбома в альбом было примерно одинаковым, разве что на фоне выделяется «Сквозное». На первых пластинках доля мата держалась на уровне около 3%, а на последних выросла до 5%. Говорит ли это о том, что словарный запас цензурных слов «Кровостока» стал иссякать? Ну *** знает, можем в комментариях обсудить, если кому интересно поделиться будет мнением.

На этом я заканчиваю свой пост. Вероятно, у кого-то возник вопрос, зачем вообще эта статья? Просто хочу немного поучаствовать в создании несерьёзной аналитики. Почему она вообще должна быть серьёзной? В общем, законом не запрещено, как говорится.

P.S. Если есть идеи по анализу и визуализации чего-нибудь интересного, то я не прочь вписаться.

Куда делись эти подписи?
Роман Соловьёв

Материал дополнен редакцией
Популярные материалы
Показать еще
{ "is_needs_advanced_access": true }

Лучшие комментарии

Дискуссии по теме
доступны только владельцам клубного аккаунта

Купить за 75₽
Авторизоваться

Преимущества
клубного аккаунта

  • отсутствие рекламы
  • возможность писать комментарии и статьи
  • общение с членами клуба
Подробнее

Преимущества
клубного аккаунта

  • отсутствие рекламы
  • возможность читать и писать комментарии
  • общение с членами клуба
  • возможность создавать записи

Сколько это стоит?

Членство в клубе стоит всего 75₽ в месяц. Или даже дешевле при оплате за год.

Что такое клуб?

Клуб ТЖ это сообщество единомышленников. Мы любим читать новости, любим писать статьи, любим общаться друг с другом.

Вступить в клуб

Комментарии Комм.

Популярные

По порядку

Прямой эфир

Вы не против подписаться на важные новости от TJ?

Нет, не против