Выругался – посчитан. Что такое WTFlevel в Твиттере
Автор: Геннадий Заволокин
Разработчик Колин Митчелл создал систему, обсчитывающую уровень сквернословия в Твиттере на данный момент.
Какие слова включены в мониторинг, точно не известно. Знаем только о 7 лексемах.
Посетители сайта могут ознакомиться с уровнем сквернословия и матерщины за последнюю неделю, день, и даже 24 часа.
Доступна и более подробная статистика. Например, абсолютные рекорды высочайшего градуса кипения Твиттера в различных временных диапазонах поставили выборы президента США и ураган Сэнди.
Также пользователи могут узнать рост «коэффициента матерщинности». На момент написания статьи он был положительным и составлял немногим более 1%.
Для любителей изящных словес (на самом деле нет) работает кнопка Shit Twitter Says. Display this и наслаждайтесь!
Мы решили взять комментарий у российских экспертов в этой области. Так как наш робот Адам является лучшим из них, мы не стали обращаться к другим.
– Адам, реально ли такую штуку запустить на русскоязычный Твиттер? Или отличающаяся от языков германской группы структура нашего языка станет препятствием?
– Это реально, и есть два пути: первый — поиск по ключевым словам (берём словарь русского мата и выписываем оттуда 5 000 самых популярных словоформ) или анализ всего потока твитов (за основу можно взять системы, которые «запикивают» мат на форумах, — там этим занимаются давно и успешно).
– Спасибо!
– Пошел на %^*
Меньше мата, больше добра, епт,
Геннадий Заволокин,
The Twi Times
#Статья