Технологии
Алексей Никитченко

Предсказать через нейросети: как суперкомпьютеры «заменяют» синоптиков, и почему от них ждут идеальных прогнозов

Метеоданные проходят сложный путь, требующий невероятной точности. А потом оказываются на вашем экране в «Яндекс.Погоде» или Gismeteo.

Сотрудник изучает данные с метеоспутника Фото Европейского космического агентства

Прогнозы погоды настолько доступны, что стали частью современной цивилизации, — теперь ими пользуются повсеместно: от авиации и сельского хозяйства до рядовых горожан, выбирающих одежду перед выходом из дома.

Но за кулисами предсказаний стоит не мало технических устройств, программ и технологий по всей планете и за её пределами, обеспечивающих как комфорт людей, так и безопасность жизней.

Радары, спутники, суперкомпьютеры и нейросети — просто о сложном устройстве современного прогноза погоды.

Где и как начинается предсказывание погоды

Метеоданные каждой страны не держатся в тайне, а свободно распространяются и формируют глобальную систему наблюдений. Первыми составляют готовые карты и сводки текущей погоды крупные метеоцентры государств, называющиеся мировыми.

Для вычислений у метеоцентров есть суперкомпьютер: британское Метеорологическое бюро прогнозирует погоду на системе Cray, а вскоре ожидает обновлённый суперкомпьютер за 1,2 миллиарда фунтов. На платформе Cray работает и суперкомпьютер Гидрометцентра.

Суть в том, что современная прогностическая метеорология — это физико-математическое и технологическое направление. Для того, чтобы решить с максимальной точностью те сложные уравнения, которые описывают атмосферные процессы, нам и необходим суперкомпьютер. Чем мощнее ресурсы суперкомпьютера, тем точнее прогноз погоды.

Роман Вильфанд

Японский Фугаку, первый в списке 500 самых мощных суперкомпьютеров, моделирует погоду, этим же занимается и IBM Summit, второй после Фугаку. Суперкомпьютеры — одно из ключевых звеньев в улучшении точности прогноза погоды.

Прогноз мировых метеоцентров глобален, они смотрят на атмосферу в целом, не рассчитывая ожидаемые осадки вплоть до районов города, тогда как локальным прогнозом занимаются местные метеослужбы и частные компании. Мощности суперкомпьютеров используются и для моделирования долговременных последствий глобального потепления.

Система Cray британского Метеорологического бюро Фото Met Office

Суперкомпьютеры прогнозируют погоду, рассчитывая модели. Они основаны на уравнениях гидротермодинамики и состоят из сотен тысяч строк кода, моделирующих атмосферу. В качестве исходных данных в модель загружаются метеопоказания из глобальной системы наблюдения, а результатом вычислений становится прогноз погоды на будущее.

В последние несколько лет метеорологи надеются на квантовые компьютеры для прогнозирования. Даже сверхмощные суперкомпьютеры не способны учесть все нюансы, тогда как квантовые вычисления могли бы легко их принимать и находить решения быстрее. Это позволило бы спасать больше жизней и снизить материальный ущерб в случае катастроф.

Как устроены глобальные модели атмосферы

Наиболее популярны из этой категории модели GFS (США) и ECMWF (Европа), прогнозирующие погоду по всему миру. Американская модель предоставляет все данные бесплатно, а европейская за деньги: годовой доступ будет стоить до 148 тысяч евро. ECMWF считается более точной и надёжной.

Когда в 2012 году в сторону США двигался ураган Сэнди, модель GFS предсказывала безопасность жителям побережья, а европейская ECMWF — катастрофу. В октябре ураган всё же достиг суши, унеся жизни нескольких сотен людей. Тогда в американском обществе разгорелась дискуссия о работоспособности GFS.

Европейская модель тоже ошибается. В 2015 году она неверно предсказала снежный шторм в Нью-Йорке, тогда как американская GFS правильно определила перемещение бури к востоку от города и меньшее количество осадков.

Обе модели представляют атмосферу планеты в виде ячеек сетки: вертикальных и горизонтальных. В каждой ячейке атмосфера постоянно меняется, определяя и состояние других ячеек. Для точности в моделях учтены многие нюансы, например, влияние океана и поверхности суши, солнечного света и снега.

Так глобальные модели представляют атмосферу. Цвета обозначают температуру, а стрелочки — направления воздушных масс «Яндекс»

Когда суперкомпьютер закончил модельные вычисления, становится известен прогноз погоды на некоторый срок. Но этот прогноз детерминированный, то есть жёстко определённый. Если в начальных метеоданных содержалась микроскопическая ошибка, то в перспективе нескольких дней она превратится в огромную неточность — это называется «эффект бабочки».

Чтобы бороться с таким эффектом, учёные используют ансамблевые прогнозы. В модель с помощью генератора псевдослучайных чисел подставляются искусственные ошибки. Например, метеостанция прислала температуру +10, а в модель дополнительно загружаются значения +9 или +8. По результатам десятков повторных вычислений суперкомпьютера образуется график с прогнозами.

Если один прогноз указывает на потепление, а все остальные на похолодание, то такой прогноз ошибочен. Ансамблевый метод позволяет лучше обнаруживать и ураганы, рассматривая весь спектор возможных изменений в атмосфере. Существуют также мультимодельные прогнозы, когда будущее состояние погоды определяется как среднее значение прогнозов нескольких моделей.

Мультимодельный ансамблевый прогноз. Синим цветом изображены прогнозы разных метеомоделей, оранжевым цветом — ансамбли модели GFS (расчёты с искусственными ошибками) Meteoblue

GFS и ECMWF полезны не только для общего наблюдения за атмосферой, но и для локальных прогнозов. Частные компании используют их в собственном предугадывании погоды на местном уровне: как «сырые» данные для последующей «шлифовки».

Чем локальные модели лучше глобальных

Глобальные модели видят атмосферу в целом, а суперкомпьютеры имеют пределы возможностей. Чтобы удовлетворить оба критерия, используется большая сетка: разрешение в американской GFS составляет 28 километров, а при долгосрочном прогнозе 70 километров. Чем больше сетка, тем грубее прогноз и тем легче суперкомпьютеру его вычислить.

Но огрубление приводит к неточным прогнозам на локальном уровне. Климат в городе может зависеть от таких факторов как плотность городской застройки, площадь асфальтовых дорог или наличие поблизости гор, чьи вершины не видят глобальные модели, принимая их за один холм.

Самой популярной из локальных считается модель WRF или Weather Research and Forecasting, берущая истоки от американской GFS. Это open source программа на языке программирования Fortran, её можно бесплатно скачать с GitHub и запустить дома. Это не готовый продукт, а скорее полуготовая основа, поэтому она требует много времени для донастройки.

Принцип работы WRF такой же, что и у глобальных моделей — исходные метеоданные загружаются в программу, а после расчётов становится известен прогноз погоды. Но в WRF разрешение сетки лучше (от полукилометра), несколько иные уравнения и методы их обработки. Всё это позволяет учитывать больше локальных нюансов.

Вид сетки WRF с разрешением от девяти до одного километра. Чёрным цветом обозначено городское землепользование, остальными цветами — пастбища и пахотные земли  Researchgate, Thomas Lauvaux

Несмотря на знания человечества о физике атмосферы, многие явления остаются непонятными, либо не до конца исследованными. Это находит отражение и в моделях, поэтому ни одни из них, как глобальные, так и локальные — не могут предсказать погоду абсолютно точно.

Для решения проблемы в локальных моделях применяют машинное обучение. Допустим, модель считает, что в Архангельске пойдёт снег, но при данных условиях атмосферы раньше, когда она так считала, на самом деле снега не было. Алгоритмы обнаруживают такую закономерность и вносят коррективы.

На тех же принципах они могут выбирать лучшую модель из нескольких для прогноза в данных метеоусловиях, учитывая насколько точными эти модели были в прошлом. Нейросети помогают частным компаниям улучшить и визуализацию, склеивая на карте показания радаров и спутников. Искусственный интеллект — ещё одно звено в улучшении точности прогноза погоды.

Как прогнозируют погоду в России

Официальным прогнозом погоды в России занимается Гидрометцентр, один из научно-исследовательских институтов федеральной службы Росгидромет. Раз в три часа региональные метеостанции передают погодные данные в центральные метеостанции, занятые их первичным сбором и обработкой. Ещё через 20 минут готовые данные получает Гидрометцентр, изучает и делится со Всемирной Метеорологической Организацией.

Прогнозы Гидрометцентра дополнительно корректирует синоптик, основываясь на своих знаниях и опыте. Обнаружением ураганов и других опасных атмосферных явлений тоже занимаются люди, передавая в МЧС свои оценки для дальнейшего оповещения. Частные компании не могут заниматься тем же — это прерогатива государственных органов.

Чтобы собирать метеоданные и прогнозировать погоду в России, понадобится лицензия Росгидромета. Её имеют несколько десятков компаний, большинство из которых закупают или берут бесплатно прогнозы, а потом транслируют их на собственных площадках. Наиболее популярные сервисы «Яндекс.Погода» и Gismeteo поступают иначе — обрабатывают метеоданные и предсказывают погоду самостоятельно.

Станция приёма информации с метеоспутников в дата-центре «Яндекса» «Яндекс»

Gismeteo собирает метеоданные через Всемирную Метеорологическую Организацию, радары, спутники, метеостанции. После обработки в математических моделях готовый прогноз корректируется синоптиком и наносится на карту для пользователей.

«Яндекс» использует другую стратегию: сначала компания покупала прогнозы у сервиса Foreca и транслировала их, а с 2015 года запустила технологию «Метеум» для самостоятельной работы. Она основана на четырёх иностранных прогнозах и одном собственном, — его делают с помощью модели WRF с применением нейросетей и возможностью пользователей рассказать о реальной погоде.

Глобальные и локальные модели не вычисляются единожды на весь срок вперёд. По мере поступления свежих метеоданных они перерасчитываются, поэтому утром субботний прогноз — дождь, а к вечеру он может смениться на пасмурное небо.

Несмотря на технические возможности «Яндекса», в компании отмечают и сложность прогнозирования погоды в России. Метеостанции расположены далеко друг от друга, а радары почти всецело находятся в европейской части, причём некоторые из них имеют слепые зоны из-за близлежащих построек — всё это сказывается на точности прогноза погоды.

Влияние пандемии на прогноз погоды

Хотя сбор метеоданных происходит по большей части автономно, пандемия повлияла на точность прогноза. Отдельные самолёты около 40 крупных компаний, например UPS Airlines, Southwest Airlines и Kenya Airways, оборудованы датчиками, передающими метеостанциям температуру, ветер, влажность и другие показатели во время полёта. Из-за пандемии все они оказались на стоянке и перестали делиться информацией.

Необходимость в изоляции также привела к проблемам в обслуживании некоторых метеостанций, особенно в отдалённых и труднодоступных местах. Например, специалисты оказались вынуждены пропустить экспедиции по очистке и калибровке датчиков в море.

Метеобуй, собирающий метеоданные в море Фото Океанографического института Вудс-Хол

Из-за пандемии прогноз погоды ухудшился по показателям температуры поверхности, влажности, давления и скорости ветра, главным образом из-за отсутствия наблюдений с самолётов, тогда как прогноз осадков не претерпел существенных изменений. Это прослеживается в отдалённых местах, таких как Гренландия, Сибирь, Антарктика и пустыня Сахара, где сети метеостанций развиты слабо.

Прогноз температуры в марте-мае 2020 года показывал дополнительное смещение на 0,5–1,0°C по сравнению с мартом-маем 2017-2019 годов в южных полярных регионах. С другой стороны, плотная сеть метеостанций Западной Европы и США свела на нет влияние пандемии на местный прогнозы погоды. К тому же, метеоспутники продолжали наблюдать за атмосферой, являясь одним из главных источников информации.

Как собирают метеоданные по всей планете

Чтобы узнать будущую погоду, необходимо знать текущую — для этого существует сеть из источников метеоданных. Это метеостанции, зонды, радары, спутники, датчики на самолётах и кораблях. Все устройства круглосуточно собирают информацию о состояниях атмосферы и передают её в метеорологические центры.

Метеостанция состоит из приборов для метеоизмерений: термометров, гигрометров, барометров и других устройств. Они откалиброваны одинаково по всему миру и производят замеры синхронно для точности. Белый цвет не случайность — он меньше всего нагревает оборудование.

Так выглядит метеостанция, расположенная в районе ВДНХ. Белые коробки на ножках, похожие на улей, защищают приборы внутри

Часть станций расположена в виде автономных устройств в труднодоступных местах, таких как горы или моря. Разнообразие форм позволяет покрыть наибольшую площадь — чем шире знания об атмосфере сейчас, тем точнее прогноз в будущем.

Метеозонд представляет собой шар с гелием или водородом, который поднимает в небо радиозонд — устройство для измерений и их передачи на землю. Полёт длится несколько часов, после чего шар взрывается, а радиозонд опускается на парашюте.

Около 20% из всех запущенных радиозондов США возвращаются государству, — этому способствует инструкция с просьбой не красть, а бескорыстно вернуть оборудование метеоцентру, другая часть пропадает бесследно. Падающие радиозонды регулярно пугают людей, принимающих устройства за НЛО или бомбы, но позволяют метеоданным стать точнее.

«Вот такая хрень только что залетела в огород. Пенопластовый тубус, начинённый электроникой. Работает от трёх пальчиковых батареек. Паниковать или продать?» Участник форума hodor об упавшем радиозонде

Но у метеостанций и радиозондов есть недостатки: первые собирают данные только возле себя, расположены далеко друг от друга, не знают размеры осадков, а вторые слишком дорогие и одноразовые. Это становится особенной проблемой в прогнозировании ураганов и других опасных атмосферных явлений, возникающих и развивающихся стремительно.

На помощь синоптикам пришли радары: антенна излучает электромагнитные волны в виде импульсов, часть из которых сталкивается с препятствием, например, каплями дождя. Первоначальный импульс рассеивается, в том числе и по направлению обратно к радару, помогая определить положение в пространстве, скорость и другие характеристики препятствия.

Современные радары круглосуточно строят трёхмерный снимок атмосферы в радиусе около 200-250 километров рядом с собой. Это позволяет описать погоду вплоть до микрорайона. Видеть дальше радару сложно — на расстояниях свыше 250 километров луч сильно отрывается от поверхности из-за кривизны Земли, обнаруживая только крупные облака и надвигающиеся штормы.

Снимок метеорадара Гидрометцентр

Но и радары несовершенны. Первая проблема в цене: разместить их повсеместно порой невыгодно, из-за чего точность прогноза ухудшается. В России они расположены преимущественно в европейской части, а в Австралии главным образом вдоль побережья. Ещё одна проблема — зона видимости. Крупные постройки могут загораживать обзор, создавая слепые зоны, а низкие осадки оказываются невидимы из-за кривизны планеты.

Устройствами без слепых зон и с хорошей масштабируемостью выступили метеорологические спутники. Они наблюдают за планетой в глобальном масштабе через датчики, определяя температуру поверхности Земли, снеговой, ледовый, облачный покровы и не только. Современный прогноз погоды основывается на них, тогда как метеостанции и радары лишь корректируют и дополняют полученные данные.

Часть спутников отслеживает всю планету (полярно-орбитальные), а другая часть вращается синхронно с Землёй, как бы зависая над одной и той же точкой (геостационарные). Последние более удобны для наблюдений за атмосферой в одном месте.

Данные со спутника Meteosat 8. Он стационарно находится над Индийским океаном и делает снимки каждые 15 минут Гидрометцентр

Метеостанции, зонды, радары, спутники, а также датчики с самолётов и кораблей непрерывно дополняют данные друг друга, создавая полноценную картину происходящего в атмосфере для будущих прогнозов.

Почему в прогнозе погоды возникают ошибки

Точность современного прогноза в России на завтрашний день составляет около 97%, на пять дней вперед – порядка 85%, на 10-14 дней – около 60%, а на месяц около 30%. По данным американского агентства NOAA, точность прогноза погоды в США на пять дней около 90%, на семь дней примерно 80%, тогда как на 10 дней и более лишь 50%. В среднем точность прогноза по всем моделям ухудшается на 2-3% в день. На эти показатели влияет три основных фактора:

Иллюстрация того, как улучшалась точность прогноза с 1974 года на примере тропического циклона Трейси Схема Австралийского бюро метеорологии

  • Неполнота наблюдений. Текущее состояние атмосферы известно приближённо, поскольку многие области планеты наблюдаются приборами слабо — океаны, тропические широты, пустыни. Увеличивать плотность сети глобального наблюдения можно, но не бесконечно, поэтому данные никогда не станут полными;
  • Несовершенство моделей. Несовершенные метеоданные поступают в несовершенные метеомодели, поэтому точность снова ухудшается. Некоторые явления физики атмосферы по-прежнему неизвестны и неучтены в моделях, другая часть явлений не учитывается вовсе или огрубляется, поскольку даже современные суперкомпьютеры окажутся в затруднении рассчитать такие модели оперативно. Ошибки сглаживаются опытными синоптиками на местах, особенно в отношении сложных явлений (туманы, гололёд), но это возможно не везде;
  • «Эффект бабочки». Небольшие ошибки и погрешности в начальных метеоданных имеют свойство вырастать до уровня ошибок случайного прогноза. Это вызвано сложностью и неустойчивостью атмосферы.

В большинстве развитых стран прогнозы даже на ближайшие дни выпускаются только в вероятностном виде. Поскольку атмосфера — газовая среда, где всё хаотично, даже на ближайший час абсолютно точный прогноз невозможен. Какими бы ни были суперкомпьютеры, даже они не могут преодолеть неопределенность.

Роман Вильфанд

Статья создана участником Лиги авторов. О том, как она работает и как туда вступить, рассказано в этом материале.

#погода #технологии #яндекс #лонгриды #лигаавторов