[ { "id": 1, "label": "100%×150_Branding_desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "cndo", "p2": "ezfl" } } }, { "id": 2, "label": "1200х400", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "cndo", "p2": "ezfn" } } }, { "id": 3, "label": "240х200 _ТГБ_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "i", "ps": "cndo", "p2": "fizc" } } }, { "id": 4, "label": "240х200_mobile", "provider": "adfox", "adaptive": [ "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "i", "ps": "cndo", "p2": "flbq" } } }, { "id": 5, "label": "300x500_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "cndo", "p2": "ezfk" } } }, { "id": 6, "disable": true, "label": "1180х250_Interpool_баннер над комментариями_Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "clmf", "p2": "ffyh" } } }, { "id": 7, "label": "Article Footer 100%_desktop_mobile", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byswn", "p2": "fjxb" } } }, { "id": 8, "label": "Fullscreen Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "cndo", "p2": "fjoh" } } }, { "id": 9, "label": "Fullscreen Mobile", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "cndo", "p2": "fjog" } } }, { "id": 10, "disable": true, "label": "Native Partner Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyb" } } }, { "id": 11, "disable": true, "label": "Native Partner Mobile", "provider": "adfox", "adaptive": [ "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyc" } } }, { "id": 12, "label": "Кнопка в шапке", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "cndo", "p2": "fdhx" } } }, { "id": 13, "label": "DM InPage Video PartnerCode", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox_method": "create", "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "cndo", "p2": "flvn" } } }, { "id": 14, "label": "Yandex context video banner", "provider": "yandex", "yandex": { "block_id": "VI-223677-0", "render_to": "inpage_VI-223677-0-101273134", "adfox_url": "//ads.adfox.ru/228129/getCode?p1=byaeu&p2=fpjw&puid1=&puid2=&puid3=&puid4=&puid8=&puid9=&puid11=&puid12=&puid13=&puid14=&puid21=&puid22=&puid31=&fmt=1&pr=" } }, { "id": 15, "label": "Плашка на главной", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byudv", "p2": "ftjf" } } } ]
{ "author_name": "memoryfull ", "author_type": "self", "tags": [], "comments": 167, "likes": 77, "favorites": 13, "is_advertisement": false, "section_name": "blog", "id": "44110", "is_wide": "" }
memoryfull
8 048
Блоги

Вежливость пользователей TJ

Неделю назад Kat Vance проанализировал все комментарии пользователей TJ за 5 лет. С помощью этих данных я создал индекс вежливости пользователей на основе написанных вами комментариев.

Поделиться

В избранное

В избранном

(интерактивная версия, работает приближение и клик, показаны 4445 пользователей, написавших не менее 10 комментариев, по оси x средняя вежливость комментариев пользователя, по оси у — количество написанных им комментариев, цвет означает среднюю оценку комментариев)

Самые грубые и вежливые пользователи

Лидерами по грубости оказались:

1. Qpwoeiruty Alskdjfhgmzxncbv (вежливость: 0.994, ср. оценка комментариев: -16.846)
2. Gleb Chernobay (вежливость: 1.013, ср. оценка комментариев: -2.273)
3. Крэйтор (вежливость: 1.013, ср. оценка комментариев: 0.200)
4. Djack Warflow (вежливость: 1.018, ср. оценка комментариев: 0.000)
5. Артем Федоров (вежливость: 1.020, ср. оценка комментариев: -12.524)

Самыми же вежливыми стали:
1. Евгений Зелёный (вежливость: 1.245, ср. оценка комментариев: 13.600)
2. Дискорд (вежливость: 1.222, ср. оценка комментариев: -6.700)
3. Дмитрий Рылов (вежливость: 1.221, ср. оценка комментариев: 0.133)
4. Max Zacepin (вежливость: 1.212, ср. оценка комментариев: 0.500)
5. Алексей Гончаров (вежливость: 1.203, ср. оценка комментариев: 3.154)

Оценки не взвешены по количеству комментариев. Если вы оставили больше 10 комментариев, вы можете прочитать топ-5 ваших самых грубых комментариев по ссылке, которую я оставлю в комментариях к этой записи, чтобы не подводить редакцию TJ под регулирование Роскомнадзора.

Как это сделано

Конечно, все написанные выше слова «вежливый» и «грубый» следует заключить в кавычки. Этот эксперимент не претендует на моральную или иную оценку. Иронично, что самыми вежливыми признаны спамеры, боты и участники этой акции, которые не оставили больше никаких комментариев. Как писал Томас Элиот:

Endless invention, endless experiment,
Brings knowledge of motion, but not of stillness;
Knowledge of speech, but not of silence;
Knowledge of words, and ignorance of The Word.

T. S. Eliot, The Rock, 1934

Каждый ваш комментарий я разбил на слова, каждое из которых превратил в вектор размерностью 500 чисел из word2vec модели, натренированной Arefyev et al. (2015) на 150ГБ русской литературы — 170МБ+ ваших комментариев оказалось недостаточно для тренировки.

Согласно дистрибутивной гипотезе, такие вектора содержат информацию о значении слов. Потом я усреднил вектора слов для каждого комментария и получил его 500-размерный семантический слепок. Далее я избрал этот комментарий (NSFW) как референтно грубый. Осталось вычислить L2-Евклидово расстояние от вектора каждого комментария до вектора указанного референтно грубого комментария. Это дало меру «вежливости» комментария — как далеко он находится от избранного грубого с точки зрения их семантических векторов. Потом я усреднил такую дистанцию-«вежливость» по пользователям и отобразил ее на графике.

Конечно, описанный подход не без недостатков: мы точно можем выявить крайне грубые комментарии, а вот с градациями грубости сложнее. Проблемы могли возникнуть на этапе усреднения, выбора референтного комментария, выбора меры расстояния. Научить машину понимать смысл текста — задача, требующая не только большого количества тренировочных данных, но и архитектурной магии.

Популярные материалы
Показать еще
{ "is_needs_advanced_access": true }

Лучшие комментарии

Дискуссии по теме
доступны только владельцам клубного аккаунта

Купить за 75₽
Авторизоваться

Преимущества
клубного аккаунта

  • отсутствие рекламы
  • возможность писать комментарии и статьи
  • общение с членами клуба
Подробнее

Преимущества
клубного аккаунта

  • отсутствие рекламы
  • возможность читать и писать комментарии
  • общение с членами клуба
  • возможность создавать записи

Сколько это стоит?

Членство в клубе стоит всего 75₽ в месяц. Или даже дешевле при оплате за год.

Что такое клуб?

Клуб ТЖ это сообщество единомышленников. Мы любим читать новости, любим писать статьи, любим общаться друг с другом.

Вступить в клуб

Комментарии Комм.

Популярные

По порядку

0

Прямой эфир

Вы не против подписаться на важные новости от TJ?

Нет, не против