Интернет
Даша Лейзаренко

Нейросеть «Порфирьевич» дописывает любые тексты и стихи на русском языке. Это аналог алгоритма компании Илона Маска

Адаптацию создал разработчик из Москвы, чтобы убедить своего друга заниматься нейросетями.

Разработчик из Москвы Михаил Гранкин создал русский аналог нейросети GPT-2 компании OpenAI Илона Маска, которая умеет генерировать тексты на основе пары предложений. TJ пообщался с автором адаптации алгоритма.

OpenAI использовали GPT-2 для генерации фейковых новостей, но опубликовали только часть алгоритма — полная версия не попала в открытый доступ из-за потенциальной опасности ИИ, способного распространять правдоподобные фейки. «Порфирьевич» работает по такому же принципу: нужно ввести связный текст на русском языке и нажать «Дополнить». Если нажать на кнопку ещё раз, нейросеть предложит новый вариант.

TJ проверил работу алгоритма на популярных за последний месяц новостях — текст курсивом дописала нейросеть.

Новость о том, что WADA на четыре года лишило Россию права участвовать в международных турнирах

Новость о недвижимости Аскер-заде

Новость о том, что «Россия 1» вырезала слово «протесты» из песни «Би-2»​

Проверка показала, что с художественными текстами алгоритм справляется лучше.

​Лев Толстой, «Война и мир»

Виктор Пелевин, «iPhuck X»

​Сергей Довлатов, «Чемодан»

Михаил рассказал, что решил адаптировать GPT-2 на русский язык, чтобы убедить своего друга заняться нейросетями. Разработчик уверен, что нейронные сети — это просто и «круто», а каждый может научиться их использовать.

Крупные IT-компании вкладывают огромные деньги в AI. Результаты исследований публикуются открыто, почти всегда вместе с кодом. То есть результат многомиллиардных инвестиций раздают бесплатно на GitHub каждый день. И компании ещё соревнуются в том, кто больше раздаст этого добра. Количество публикаций и качество результатов растут невероятными темпами. В результате образуется разрыв — индустрия не успевает применить на практике всё, что публикуют исследователи.

Делать исследования, создавать новую архитектуру нейронных сетей —сложно, а пользоваться готовыми нейросетями – очень просто. Отсюда получается рецепт успеха: взять с полочки результат многомиллиардных инвестиций и применить его к своей задаче.

Михаил Гранкин

Изначально Михаил хотел создать нейросеть, которая бы генерировала стихи. Для этого ему сначала нужно было обучить сеть класса NLG (natural language generation) русскому языку. Он выбрал GPT-2, поскольку это «лучшая нейросеть в своём классе». Разработчик самостоятельно обучил её на работах Достоевского, Толстого, Пушкина, Булгакова, Гоголя и Пелевина.

Михаил назвал нейросеть «Порфирьевич» в честь «полицейско-литературного» робота по имени Порфирий Петрович из романа «iPhuck X» Виктора Пелевина. Интерфейс разработал фрилансер из Иркутска Артемий Дорошков.

«Порфирьевич» доступен не только через браузер. Сгенерировать новый текст можно и с помощью подключенного к нейросети Telegram-бота, который создал разработчик из Украины Юрий Лу. Бота подключили не до конца корректно: он может перестать работать в любой момент. При этом Михаил выступил за открытое использование своего алгоритма.

Михаил модернизировал «Порфирьевича» для своей оригинальной идеи — обучил его на всех стихах, «которые смог найти». В результате разработчик создал Telegram-бот «Нейропоэт», который умеет дописывать стихи.

Мой дядя самых честных правил,

Когда не в шутку занемог,

Он уважать себя заставил

И лучше выдумать не мог.

И смеяться от всей души

На беду, только можете вы!

Мне же всё он этот случай вспоминает,

Певущий, как песня удалая,

Всех, кому он прощенья просит,

И долго голову ломает...


Александр Пушкин

Ты меня не любишь, не жалеешь,

Разве я немного не красив?

Не смотря в лицо, от страсти млеешь,

Мне на плечи руки опустив.

А может быть и еще хуже,

А может быть, и я не так хорош,

Да я тебе не скажу!

Я — как страшная тень, от дождя,

Я — как серый ветер ночи

От твоих полуоткрытых губ,

От твоих слезинок на щеках.

Я — как гром, я — как гром, я — как гром.

Я здесь, в коридоре, на полу,

Затрубил звонко и грозно.

Я убью тебя, о, как это можно!

Я убью тебя, о, как это можно!

Я убил, о, как это можно!

Выстрелил в сердце твое, в груди,

Да не бойся, что я убил тебя!

Зачем же мне скрывать что-то?

Ведь я люблю тебя.


Сергей Есенин

#нейросети #ии #openai #интервью