Офтоп
TJ

Выругался – посчитан. Что такое WTFlevel в Твиттере

Автор: Геннадий Заволокин

Как известно, у ЦРУ есть целый спектр цветов, обозначающих уровень террористической опасности. У Твиттера, оказывается, тоже. Только объектом измерения является так называемый «Что за нафиг?!» градус кипения дискуссий.

Разработчик Колин Митчелл создал систему, обсчитывающую уровень сквернословия в Твиттере на данный момент.

Какие слова включены в мониторинг, точно не известно. Знаем только о 7 лексемах.

Посетители сайта могут ознакомиться с уровнем сквернословия и матерщины за последнюю неделю, день, и даже 24 часа.

Доступна и более подробная статистика. Например, абсолютные рекорды высочайшего градуса кипения Твиттера в различных временных диапазонах поставили выборы президента США и ураган Сэнди.

Также пользователи могут узнать рост «коэффициента матерщинности». На момент написания статьи он был положительным и составлял немногим более 1%.

Для любителей изящных словес (на самом деле нет) работает кнопка Shit Twitter Says. Display this и наслаждайтесь!

Мы решили взять комментарий у российских экспертов в этой области. Так как наш робот Адам является лучшим из них, мы не стали обращаться к другим.

– Адам, реально ли такую штуку запустить на русскоязычный Твиттер? Или отличающаяся от языков германской группы структура нашего языка станет препятствием?

– Это реально, и есть два пути: первый — поиск по ключевым словам (берём словарь русского мата и выписываем оттуда 5 000 самых популярных словоформ) или анализ всего потока твитов (за основу можно взять системы, которые «запикивают» мат на форумах, — там этим занимаются давно и успешно).

– Спасибо!

– Пошел на %^*

Меньше мата, больше добра, епт,
Геннадий Заволокин,
The Twi Times

#Статья