Учёные использовали Твиттер, чтобы научить компьютер распознавать сарказм

Учёные из Университета Карнеги — Меллон, расположенного в Питтсбурге, использовали Твиттер для создания компьютерного алгоритма, обнаруживающего сарказм. О результатах своего исследования они рассказали в научной работе под названием «Контекстное обнаружение сарказма в Твиттере» (Contextualized Sarcasm Detection on Twitter).

«Теория большого взрыва»

Обнаружение сарказма в тексте с помощью компьютера является непростой задачей, так как подобные насмешки зачастую обретают ироничный смысл только в контексте. Если провести рядовой речевой анализ, машина может просто не найти никакого юмора.

Поэтому в качестве платформы для исследования учёные выбрали Твиттер. В своём алгоритме они учитывали несколько основных факторов, включая ключевые слова (например, «clearly», «shocked» и «gasp» — аналоги русскоязычного «ага, конечно»), хэштеги (#lol и #sarcasm), а также местоположение, возраст и пол автора вместе с коммуникациями с другими пользователями и текстами его предыдущих твитов.

Благодаря анализу комбинации из текстовых и контекстных параметров учёным удалось создать программу, которая определяет наличие сарказма в записи с вероятностью 85%.

В рамках эксперимента удалось установить, что больше всего склонны к сарказму пользователи мужского пола без верификации и, вероятно, с ненастоящим именем в профиле.

Кроме того, тег #sarcasm оказался вводящим в заблуждение — чаще всего он применяется для пояснения мыслей, которые могут быть неправильно поняты неосведомлённой аудиторией, а не реальным сарказмом.

По мнению учёных, их система может быть применена для автоматической модерации контента. В социальных сетях нередки случаи, когда профили или отдельные записи пользователей блокируются из-за какой-либо шутки, неправильно воспринятой алгоритмом проверки или контролирующим органом.

Например, в 2013 году шуточный твит бывшего шеф-редактора TJ Султана Сулейманова на тему суицида был заблокирован на территории России.

{ "author_name": "Вадим Елистратов", "author_type": "self", "tags": ["sarcasm","lol"], "comments": 10, "likes": 22, "favorites": 0, "is_advertisement": false, "subsite_label": "flood", "id": 21478, "is_wide": true, "is_ugc": true, "date": "Fri, 22 Jan 2016 21:05:47 +0300" }
Комментарии

Соответствующий шар

2

Подскажите, кто различает, в этой статье есть сарказм?

Греческий франт

2

Например, в 2013 году шуточный твит бывшего шеф-редактора TJ Султана Сулейманова на тему суицида был заблокирован на территории России.

Ну надо же, какой неожиданный пример!

Офтоп
дискуссии в сообществе доступны только владельцам клубного аккаунта
С клубным аккаунтом вы сможете
создавать записи и вести дискуссии в закрытых сообществах
наслаждаться нашим сайтом без рекламы
помочь проекту и почувствовать себя лучше
Купить за 75₽

Прямой эфир

[ { "id": 1, "label": "100%×150_Branding_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox_method": "createAdaptive", "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "cndo", "p2": "ezfl" } } }, { "id": 2, "label": "1200х400", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "cndo", "p2": "ezfn" } } }, { "id": 3, "label": "240х200 _ТГБ_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "i", "ps": "cndo", "p2": "fizc" } } }, { "id": 4, "label": "240х200_mobile", "provider": "adfox", "adaptive": [ "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "i", "ps": "cndo", "p2": "flbq" } } }, { "id": 5, "label": "300x500_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "cndo", "p2": "ezfk" } } }, { "id": 6, "disable": true, "label": "1180х250_Interpool_баннер над комментариями_Desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "clmf", "p2": "ffyh" } } }, { "id": 7, "label": "Article Footer 100%_desktop_mobile", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byswn", "p2": "fjxb" } } }, { "id": 8, "label": "Fullscreen Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "cndo", "p2": "fjoh" } } }, { "id": 9, "label": "Fullscreen Mobile", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "cndo", "p2": "fjog" } } }, { "id": 10, "disable": true, "label": "Native Partner Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyb" } } }, { "id": 11, "disable": true, "label": "Native Partner Mobile", "provider": "adfox", "adaptive": [ "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyc" } } }, { "id": 12, "label": "Кнопка в шапке", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "cndo", "p2": "fdhx" } } }, { "id": 13, "label": "DM InPage Video PartnerCode", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox_method": "createAdaptive", "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "cndo", "p2": "flvn" } } }, { "id": 14, "label": "Yandex context video banner", "provider": "yandex", "yandex": { "block_id": "VI-223677-0", "render_to": "inpage_VI-223677-0-130073047", "adfox_url": "//ads.adfox.ru/228129/getCode?pp=h&ps=cndo&p2=fpjw&puid1=&puid2=&puid3=&puid4=&puid8=&puid9=&puid10=&puid21=&puid22=&puid31=&puid32=&puid33=&fmt=1&dl={REFERER}&pr=" } }, { "id": 15, "label": "Плашка на главной", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byudv", "p2": "ftjf" } } }, { "id": 16, "label": "Кнопка в шапке мобайл", "provider": "adfox", "adaptive": [ "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "ccydt", "p2": "ftwx" } } }, { "id": 17, "label": "Stratum Desktop", "provider": "adfox", "adaptive": [ "desktop" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "cndo", "p2": "fzvb" } } }, { "id": 18, "label": "Stratum Mobile", "provider": "adfox", "adaptive": [ "tablet", "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "cndo", "p2": "fzvc" } } } ]
Не пропустите самое важное,
что происходит в интернете
Подписаться на push-уведомления