Технологии

Google создала роботов-официантов для сотрудников — они могут приносить «что-нибудь вкусненькое» и протирать стол

С помощью нейросетей роботы научились воспринимать трудные языковые запросы, состоящие из ряда задач.

Google совместно с Everyday Robots (обе компании принадлежат холдингу Alphabet) разработала новых экспериментальных роботов, основанных на языковых ИИ-моделях. Хотя основная цель проекта — изучение методики обучения роботов, в качестве теста они выполняют функции официантов и обслуживают сотрудников офисов Google.

Чтобы система могла лучше распознавать запрос человека, разработчики использовали нейросети, а именно обучающиеся языковые модели. С их помощью робот может выполнить не только конкретную задачу, например, «принеси яблоко», но и более абстрактный запрос: «я разлил воду, можешь помочь?» или «я только что тренировался, нужно восстановить силы».

Во время первых тестов языковые модели понимали запрос, но предлагали часто бесполезное решение. К примеру, на жалобу о пролитом напитке GPT-3 предлагала пропылесосить жидкость, а нейросеть FLAN просто извинялась. Результаты стали лучше, когда авторы идеи объединили модель PaLM с уже подготовленным для роботов ПО, распознающем задачу и действие. Новая система PaLM-SayCan сперва распознаёт запрос, а затем трансформирует его в набор наиболее походящих в контекст задач.

Демонстрация распознавания задачи роботом

Систему обучили на десятках тысяч примеров выполнения запросов, среди которых отдельно выделили успешно завершённые. Кроме того, роботы анализируют окружающее пространство кухни, находят знакомые предметы и продолжают обучаться на своём опыте. Первые результаты показали, что системе удаётся верно выбрать правильную последовательность действий в 84% случаев, а в 74% — успешно выполнить поставленную задачу.

Авторы проекта настроены позитивно — совмещение языковых моделей с интерфейсом роботов уже помогло сократить количество ошибок понимания запросов в два раза. В будущем такие системы позволят людям куда проще взаимодействовать с роботами — пользователи смогут их программировать, используя свою естественную речь.

#роботы #новости #google