Технологии
Яна Ломакина

«Яндекс» опубликовал крупнейший набор данных беспилотных автомобилей для конкурса моделей машинного обучения

Компания называет набор самым большим в мире массивом данных такого типа в открытом доступе.

Компания открыла набор данных беспилотных автомобилей для исследований в области машинного обучения и автономного транспорта. База содержит более 1600 часов движения, разбитых на 600 тысяч размеченных фрагментов поездок на дорогах России, Израиля и США в разную погоду. Об этом TJ рассказали представители «Яндекса».

Датасет опубликовали для совместного с учёными из Оксфорда и Кембриджа конкурса Shifts Challenge. Его участники должны создать на основе предоставленного датасета устойчивые к «сдвигу данных» модели машинного обучения.

Сдвиг данных возможен везде, где модели машинного обучения сталкиваются с неопределённостью и неизвестными данными.

Если вы привыкли водить машину в небольшом городе, то в Москве вы не сразу адаптируетесь к трафику и, скорее всего, поначалу будете более осторожны на дороге. Это и есть сдвиг данных. Вы можете оценить его масштаб и скорректировать свои действия. Машинно обученные модели должны уметь делать то же самое — оценивать величину сдвига и эффективно действовать в новых условиях. От того, насколько хорошо алгоритм может работать при сдвиге данных, будет зависеть широта его применения.

Андрей Малинин

Для конкурса Shifts Challenge исследователи «Яндекса» предоставили данные «Яндекс.Переводчика», «Яндекс.Погоды» и беспилотных технологий, которые часто сталкиваются со сдвигом. В компании выбрали три области:

  • предсказание траектории движения транспорта и пешеходов на дороге;
  • прогнозирование погоды;
  • машинный перевод текстов.

Все данные набора обезличены. Например, датасет по беспилотным автомобилям содержит высокоточные карты маршрутов и треки всех окружающих машин и пешеходов (их положение, скорость, ускорение и пр.), но не использует видео, где были бы видны номера машин или лица прохожих. Скачать данные можно на GitHub.

Конкурс Shifts Challenge проходит с 16 июля по 30 ноября. В каждой области выберут по три победителя — за первое место приз 5 тысяч долларов, второе — три тысячи, третье — тысяча.

#новости #яндекс #беспилотники #машинноеобучение