Истории
Алексей Боржонов

Онлайн-карту распространения Covid-19 от университета Джонса Хопкинса использует весь мир. Её создали три человека

А данные поначалу вносили вручную.

Карта университета Джонса Хопкинса

Онлайн-карта распространения вируса, созданная в университете Джонса Хопкинса, стала одним из главных источников информации во время пандемии. К данным с сайта обращаются пользователи со всего мира, на него ссылаются крупнейшие СМИ и официальные лица.

The Wall Street Journal поговорил с основателями проекта и рассказал его историю.

Карту создали три человека — профессор и аспиранты

В январе Лорен Гарднер, доцент инженерного факультета университета Джонса Хопкинса, обсуждала в университетской кофейне новый вирус с двумя аспирантами из Китая. Один из них, Эншен Донг, специалист в области географии и картографии, переживал за семью, которая живёт в провинции к северу от Уханя.

Лорен Гарднер

Фото Уилла Кирка, университет Джонса Хопкинса

Аспиранты предложили отследить, как распространяется инфекция, и Гарднер, которая исследует влияние транспортных систем на распространение болезней, согласилась.

Им потребовался день, чтобы создать карту, впоследствии ставшей одним из главных проектов эпохи пандемии. 22 января сайт запустили.

Поначалу данные приходилось вводить вручную. Потом систему автоматизировали

На старте данные брали с нескольких сайтов, новостных сводок и из Твиттера. Так как заболевание на тот момент распространялось в основном в Китае, то основным источником информации был DXY.cn — сообщество китайских медработников, которое отслеживало распространение вируса на местном уровне.

Гарднер рассказывала Nature Index, что изначально её команда хотела строить математические модели распространения вируса, но потом решила сделать данные доступными для всех. Учёные не ожидали, что проект будет интересен кому-либо за пределами научного сообщества.

Мы думали, что было бы круто, если несколько десятков или, скажем, сотен специалистов когда-нибудь захотели бы воспользоваться картой.

Лорен Гарднер

Поначалу Эншен Донг вручную вбивал данные о новых случаях заболевания, тратив на это от 13 до 15 часов в день в свободное от учёбы время. Со временем, когда болезнь стала активно распространяться и за пределами Китая, систему усложнили и сделали автоматизированной.

К команде присоединились новые люди из университета, данные по США стали собирать отдельно по городам и штатам. Всего, говорит Гарднер, информацию отслеживают по 7000 точкам, которые включают в себя десятки источников. Теперь основная задача команды — обрабатывать поступающую информацию. Это делают в том числе с помощью «системы обнаружения аномалий», которая выявляет необычные входные данные.

Члены команды, которая работает над проектом Фото Уилла Кирка, университет Джонса Хопкинса

Среди источников, откуда поступает информация, — сайты ВОЗ, Центра США по контролю и профилактике заболеваний (CDC), Европейский центр по профилактике и контролю заболеваний (ECDC), СМИ и департаменты здравоохранения по всему миру.

Гарднер признаёт, что многое хотела бы улучшить в проекте, но команде не хватает людей.

Если бы у нас было 100 человек, мы бы могли собрать фидбек и что-то сделать с ним. Это было бы замечательно. Но к сожалению, многие вещи ускользают от нас.

Лорен Гарднер

Учёные уверены, что официальная статистика заболевших не отражает реальную картину

Гарднер рассказала, что даже внутри одной страны подходы к сбору статистических данных различаются от региона к региону. Например, в штате Нью-Йорк докладывают о смертях людей с положительными тестами на Covid-19, при этом в Нью-Йорке (город) включают в статистику и тех, кто только проявлял характерные для болезни симптомы.

Гарднер вспоминает ситуацию, когда пришлось обновлять статистику во Франции — власти учли смерти от вируса в домах престарелых, и число умерших в стране выросло на 40%.

Сложная ситуация и с тестированием. В Нью-Йорке проводится больше 6,5 тысячи тестов на 100 тысяч человек, а в Аризоне на такое же число людей проводится только 1,5 тысячи тестов.

Из-за разных подходов к сбору данных, а также из-за разного охвата тестирования, официальные данные по всему миру ниже реальных, уверена Гарднер. Тем не менее её команда не должна судить об этой информации, и если власти сообщают о возможных случаях заболевания, то информацию включат в карту.

Как я могу выяснить, сколько вероятных смертей во всех 4000 точках на карте? Это невозможно. Достаточно сложно хотя бы просто собирать данные, которые появляются.

Лорен Гарднер

Информацию с сайта университета используют люди со всего мира

К данным университета Джонса Хопкинса обращаются официальные лица, на них также ссылаются мировые СМИ. По статистике SimilarWeb, в марте сайт arcgis.com, на котором размещена карта, посетили около полумиллиарда человек.

Вице-президент Майк Пенс в чрезвычайных операций Министерства здравоохранения и социальных служб в Вашингтоне. На заднем плане — карта университета Джонса Хопкинса.

Фото Эндрю Храника, AP

Американское правительство, пишет WSJ, не разработало подобного проекта. Есть страница Центра США по контролю и профилактике заболеваний (CDC), но она обновляется не так часто. Такая же проблема с сайтом ВОЗ.

Профессор экономики в университета Вайоминга Дэвид Финоф, который изучает патогены и пандемии считает, что данные с карты хоть и «не идеальные», но «бесценные» в сравнении с ситуацией, если бы никакой карты не было.

#covid19