«Яндекс» опубликовал крупнейший набор данных беспилотных автомобилей для конкурса моделей машинного обучения
Компания называет набор самым большим в мире массивом данных такого типа в открытом доступе.
Компания открыла набор данных беспилотных автомобилей для исследований в области машинного обучения и автономного транспорта. База содержит более 1600 часов движения, разбитых на 600 тысяч размеченных фрагментов поездок на дорогах России, Израиля и США в разную погоду. Об этом TJ рассказали представители «Яндекса».
Датасет опубликовали для совместного с учёными из Оксфорда и Кембриджа конкурса Shifts Challenge. Его участники должны создать на основе предоставленного датасета устойчивые к «сдвигу данных» модели машинного обучения.
Сдвиг данных возможен везде, где модели машинного обучения сталкиваются с неопределённостью и неизвестными данными.
Если вы привыкли водить машину в небольшом городе, то в Москве вы не сразу адаптируетесь к трафику и, скорее всего, поначалу будете более осторожны на дороге. Это и есть сдвиг данных. Вы можете оценить его масштаб и скорректировать свои действия. Машинно обученные модели должны уметь делать то же самое — оценивать величину сдвига и эффективно действовать в новых условиях. От того, насколько хорошо алгоритм может работать при сдвиге данных, будет зависеть широта его применения.
Для конкурса Shifts Challenge исследователи «Яндекса» предоставили данные «Яндекс.Переводчика», «Яндекс.Погоды» и беспилотных технологий, которые часто сталкиваются со сдвигом. В компании выбрали три области:
- предсказание траектории движения транспорта и пешеходов на дороге;
- прогнозирование погоды;
- машинный перевод текстов.
Все данные набора обезличены. Например, датасет по беспилотным автомобилям содержит высокоточные карты маршрутов и треки всех окружающих машин и пешеходов (их положение, скорость, ускорение и пр.), но не использует видео, где были бы видны номера машин или лица прохожих. Скачать данные можно на GitHub.
Конкурс Shifts Challenge проходит с 16 июля по 30 ноября. В каждой области выберут по три победителя — за первое место приз 5 тысяч долларов, второе — три тысячи, третье — тысяча.
#новости #яндекс #беспилотники #машинноеобучение