Интернет
Женя Кузьмин

Нейросветов и Нейромедуза — как они появились в твиттере, и что про «нейродвойников» думают реальные Светов и «Медуза»

Пародийные аккаунты в соцсетях вышли на новый уровень: зачем имитировать кого-то, если можно обучить нейросеть?

Пародийные аккаунты в соцсетях — довольно стандартная вещь. Пользователи берут какую-либо медийную личность и «примеряют» её образ, оставляя посты и сообщения в её стиле. В твиттере таких профилей множество — от пародийного аккаунта бывшего главного дизайнера Apple Джонни Айва до бога и Владимира Путина.

Но всё это — проекты конкретных авторов, которые сами придумывают посты в выбранном стиле. При этом развитие технологий уже позволяет взять нейросеть и «научить» её чужой стилистике с помощью датасетов. Человеку остаётся выбирать наиболее интересные сгенерированные примеры.

Так в 2020 году набрал популярность твиттер Neural Meduza, генерирующий абсурдные заголовки на основе реальных заголовков издания «Медуза». А в начале декабря появился профиль «Нейросветов», пародирующий члена ЛПР Михаила Светова. За несколько дней на него подписались почти 2 тысячи пользователей.

TJ узнал, как работают «нейродвойники» и что про них думают настоящие Светов и «Медуза».

* * *

Аккаунт Neural Meduza создал Андрей Клименко, автор телеграм-канала Neural Shit. Началось всё ещё в 2019 году, когда пользователи твиттера в шутку предложили скрестить заголовки новостей «Медузы» и «Медиазоны». Клименко в ответ на это сделал скрипт, который действительно генерирует заголовки с помощью цепей Маркова.

Так на канале появилась регулярная рубрика «нейроновости», где проходили постоянные эксперименты с датасетом: контент от интернет-СМИ разбавляли текстами Оксимирона или «Кровостока», создавая необычные сочетания. Помимо этого в Neural Shit публиковали другие форматы, например, нейроуголовный кодекс РФ с несуществующими статьями.

Блок telegram недоступен

Затем цепи Маркова заменила полноценная нейросеть — модель GPT-2 компании OpenAI Илона Маска, которая умеет создавать связные тексты. Ранее её адаптировали под русский язык и применяли, например, для «дописывания» любых текстов и стихов.

Так появилась Neural Meduza — Клименко обучил нейросеть на заголовках реальной «Медузы». «Датасет с их заголовками первый под руку попался», — объяснял выбор автор. В конце сентября к изначальному датасету добавились тысячи заголовков издания Lenta.ru. В итоге нейросеть генерирует новости из «параллельной реальности», а в твиттер попадают наиболее примечательные варианты, отобранные «руками».

За несколько месяцев Neural Meduza набрала популярность — 19 тысяч подписчиков в твиттере и ещё 6 тысяч в телеграме. Туда всё ещё попадают только заголовки, хотя в основном канале Клименко при помощи нейросети уже генерирует полноценные новости.

Нейросветов появился 3 декабря: сначала идеей сделать подобный аккаунт поделилась пользовательница твиттера Анна Велликок во время флемшоба с публикацией заметок на телефоне. А реализовал её основатель компании «Vee Security Россия» и автор канала «Сайберсекьюрити и Ко» Александр Литреев.

Твиты от имени Нейросветова генерируются на основе датасета, составленного из постов реального Михаила Светова. Литреев рассказал TJ про работу «нейродвойника».

Пока [для генерации твитов] используются и цепи Маркова, и довольно простая сеть на TensorFlow. На цепях Маркова (с небольшой дополнительной логикой) мы пытаемся выбирать слова для предложения, а с помощью TensorFlow — строить его правильно. Сейчас разбираюсь в GPT-3 и пытаюсь переписать [Нейросветова] на него.

Датасет не сильно большой — изначально около 4 тысяч более-менее свежих твитов. Я выгрузил некоторые ролики из YouTube-канала Светова, в них из аудиодорожки планирую извлечь субтитры и добавить в скоуп данных. Ещё думал «скормить» туда ЖЖ, но лень подсохшие сервисы трогать руками.

Это мой третий или четвертый раз в жизни, когда я играюсь с нейросетями, работая с текстами. Развлекаюсь, короче.

Александр Литреев
* * *

Вопрос с пародийными аккаунтами всегда приходит к тому, как к ним относятся объекты пародии. И реакция на подобное бывает очень разной, независимо от того, пишет от имени «двойника» настоящий человек или нейросеть. TJ спросил у настоящих Михаила Светова и главного редактора «Медузы» Ивана Колпакова о пародийных твиттер-аккаунтах.

У нас нет никакой связи с автором «Нейромедузы», но я большой поклонник этого твиттера, подписан на него и всё время за ним слежу. Это очень остроумная нейросеть.

Иван Колпаков

[Нейросветов] засоряет выдачу, и с него идёт много мусорных комментариев, поэтому [я его] забанил.

А так, отношение такое же, как к любому пародийному аккаунту: мне нравится, что я вызываю у людей сильные эмоции, и они посвящают мне своё время. Раз мои сообщения выдерживают испытание шуткой, значит я интересен и неплохо доношу свои мысли. Всегда приятно видеть этому подтверждение.

Михаил Светов

#twitter #нейросети #технологии #соцсети