Исследователи MIT научили компьютер предсказывать действия людей лучше самих людей Статьи редакции

В MIT разработали алгоритм анализа массивов данных Data Science Machine, умеющий самостоятельно выбирать из имеющихся параметров релевантные для предсказаний будущих тенденций. По результатам тестов он обошёл в точности прогнозов большинство людей, перед которыми были поставлены аналогичные задачи. Об этом сообщает MIT News.

Факультет электротехники и компьютерных наук MIT. Фото MIT News

Для проверки работы системы исследователи MIT провели три отдельных соревнования, в которых помимо компьютера участвовало ещё 906 команд, сформированных из людей.

Data Science Machine обогнал 615 из них: в одном из случаев точность прогноза алгоритма составила 96% от показателя лидера, во втором — 94%, в третьем — 87%. При этом «человеческие» команды составляли свои методики для предсказаний в течение нескольких месяцев, а Data Science Machine сделал это за срок от двух до 12 часов.

В одном из случаев командам нужно было на основе данных о посещениях студенческого сайта MIT определить вероятность того, отчислят ли студента из института в течение следующих десяти дней. Выяснилось, что главными факторами было то, за какое время до дедлайна студент начинает работать над какой-либо задачей, и насколько больше времени он проводит на сайте, изучая конкретный предмет, чем его одногруппники. Сайт MIT не записывал эти показатели напрямую, однако Data Science Machine — и другим участникам эксперимента — удалось получить их через анализ всего массива данных.

В другом соревновании нужно было спрогнозировать эффективность размещения ветряных электростанций на основе данных от метеорологических станций. Data Science Machine смогла получать в три раза более точные предсказания работы электростанций на два года вперёд, чем делают профессиональные консультанты-аналитики в области энергетики.

Главной задачей Data Science Machine является выбор наиболее значимых для исследования переменных. Программисты не задают их вручную: алгоритм определяет их сам, проводя анализ корреляции между различными данными и используя машинное самообучение.

Например, в распоряжении системы может оказаться несколько баз данных с записями об определённых покупках. В одной из них могут быть две колонки: артикул товара и его цена. В другой — список покупок конкретного покупателя.

Сравнивая эти две базы, система обнаружит одинаковые артикулы и построит зависимость: на её основе Data Science Machine сможет высчитать общую сумму заказа, средний чек, минимальный чек и другие переменные, которые помогут в дальнейших предсказаниях. Впоследствии алгоритм перебирает и комбинирует эти переменные, делая предсказания на основе небольшого массива данных и постепенно улучшая показатель точности.

Создатели Data Science Machine — Макс Кантер (Max Kanter), который пишет диссертацию по своему алгоритму, и его научный руководитель Калян Вирамачанени (Kalyan Veeramachaneni), исследователь лаборатории компьютерных наук и искусственного интеллекта MIT. Более подробное описание Data Science Machine они собираются представить на конференции IEEE International, которая пройдёт в Париже с 19 по 21 октября.

0
12 комментариев
Написать комментарий...
Бытовой блик

Комментарий недоступен

Ответить
Развернуть ветку
Органический фитиль

А этот компьютер может предсказывать действия женщин?

Ответить
Развернуть ветку
Критический спрей
Ответить
Развернуть ветку
Сталинский ключ

DRIVER_IRQL_NOT_LESS_OR_EQUAL -- нет. Это кейс, когда в женщину вставили что-то не то.

Ответить
Развернуть ветку
Объективный пришелец

Ещё на один шаг ближе к полноценному ИИ.

Ответить
Развернуть ветку
Финансовый шар

Или еще одна демонстрация практического применения Data Mining.

Ответить
Развернуть ветку
Невозможный Женя

Порадуемся за АНБ, которое наконец-то сможет нормально обрабатывать весь тот сумасшедший объем данных, который записывает.

Ответить
Развернуть ветку
Мучительный диод

А у анб все давно с этим хорошо. Можно на kaggle посмотреть - там похожими вещами относительно давно занимаются. А у анб спецы наверняка хорошие.

Ответить
Развернуть ветку
Частый огонь

Комментарий недоступен

Ответить
Развернуть ветку
Агрессивный ящик

Человек регулярно напарывается и публикуется и ничего, живем же как-то

Ответить
Развернуть ветку
Всевозможный щит

Это же психоистория, посоны! К успеху идем!

Ответить
Развернуть ветку
Постоянный кофе

А в паблик выложат?

Ответить
Развернуть ветку
Читать все 12 комментариев
null