Прогноз пандемии коронавируса. Нормальное распределение

Прогноз развития эпидемии в России​ coronavirussia.online
В закладки
Слушать

Как и все сознательные люди, я сижу дома и пытаюсь себя всячески развлечь. Но со всех утюгов только и слышно, что про коронавирус.

Решил я узнать, когда же закончится эта канитель. Покопался в интернете и на то время ничего конкретного ни нашел.

На своей работе я уже давно ничего не программировал, а руки-то чешутся. Вот и придумал написать сайт, который соберет данные из открытых источников, красиво их отобразит их, да и еще сделает прогноз, что будет дальше.

Согласно статистике, развитие эпидемий в мире происходит по нормальному закону распределения Гаусса. Его и взял за основу.

Для начала подключился к открытым источникам и научился выкачивать данные раз в 15 минут. Отобразил их красиво с помощью Chart.js и перешел к прогнозу. Взял для работы функцию нормального распределения

y(t) = b · e -c·(t-a)2

Исходные данные ti — ежедневные отметки времени xi — число активных случаев болезни в этот день

Взял натуральный логарифм от y(t) и от данных xi

ui = ln(xi) u(t) = ln(y) = ln(b) - c·t2 + 2c·a·t - c·a2

Сделаем замены: А=-с; B=2a·c; C=ln(b)-c·a2; Получаем

u(t) = A·t2 + B·t + C

Чтобы найти А, В и С — использую метод наименьших квадратов, согласно которому сумма по i от 1 до n квадратов разностей

Σ(xi - y(ti))2 -> min

должна стремится к минимуму.

Назовем эту сумму Ф (A, В, С)

Продифференцируем dФ по dA, dB и dC. Производные при это должны быть равны нулю.

Получаем систему уравнений

A·Σti4 + B·Σti3 + C·Σti2 = Σui·ti2

A·Σti3 + B·Σti2 + C·Σti = Σui·ti

A·Σti2 + B·Σti + C·n = Σui

Решаем эту систему по методу Крамера

А = ∆A/∆

B = ∆B/∆

C = ∆C/∆

Находим нужные коэффициенты a, b , c для исходной функции

И, вуаля, готово! Программируем и рисуем красивые графики и узнаем когда это кончится!

Так как данные обновляются с появлением новых случаев, и мой прогноз обновляется тоже.

Чем больше данных, тем точнее прогноз. На данный момент, реальные данные экспертов в Италии говорят о пике эпидемии, и кривая Гаусса показывает тоже самое.

​Прогноз развития эпидемии в Италии coronavirussia.online

По ссылке ниже смотрите прознозы для других стран и для всей планеты

Данные обновляются каждые 15 минут и прогнозы соответственно тоже!

Будьте здоровы!

{ "author_name": "Коронавирус Онлайн", "author_type": "self", "tags": [], "comments": 120, "likes": 73, "favorites": 73, "is_advertisement": false, "subsite_label": "science", "id": 155655, "is_wide": false, "is_ugc": true, "date": "Thu, 02 Apr 2020 13:53:47 +0300", "is_special": false }
Объявление на TJ
0
120 комментариев
Популярные
По порядку
Написать комментарий...

Поверхностный динозавр

28

выглядит слишком оптимистично, прям вот как единорог верхом на снежном человеке (хотя у меня был трояк по алгебре и я, возможно, просто не секу), но я буду в это верить, потому что задолбалась от постоянных скачков состояния от "мы все умрём" до "всё будет ок"

Ответить
12

задолбалась от постоянных скачков состояния

Состояние "пофиг" не пробовала?

Ответить

Поверхностный динозавр

Учебный
10

Не умею, я очень тревожная 

Ответить

Принятый космос

Поверхностный
0

Не тревожься, если тебе не 60+ 
Посидишь дома с соплями, покашляешь. 

Ответить

Поверхностный динозавр

Принятый
12

я не за себя, за близких переживаю(

Ответить
1

Мне в тяжёлые моменты помогал новопассит, а иногда помогали гомеопатические дозы вина.

Ответить

Поверхностный динозавр

Marat
0

я и так на таблетосах :D

Ответить
3

Мы все умрем, но это ок.

Ответить
18

Согласно статистике, развитие эпидемий в мире происходит по нормальному закону распределения Гаусса.

Пруф или Петрик.
Вы ведь не физик, да? Гауссов профиль получается только в простейших моделях заражения в одномерном ограниченном пространстве. У вас же здесь распространение по поверхности сферы, здесь даже модельный профиль должен быть не симметричен по времени, не говоря уже о миллионах факторов, в том числе таких важных, как распределение людей по площади. Всё это накапливает сомнения в предсказательной силе ваших графиков.
Да и вообще, по маленькой краюхе восстановливать дальний порядок - это крайне некорректная задача. Это означает, что малое изменение начального параметра может привести к сильному изменению всего графика. Работает эффект рычага. Особенно это важно, учитывая, что точки далеко не идеально ложатся на кривую, то есть есть погрешности. Это означает, что погрешность итогового графика окажется слишком большой, чтобы весь расчёт считался надёжным предсказанием. Вы можете сами это оценить, посчитав дисперсию и построив два графика для разных концов стартового распределения параметров.

Ответить
9

Ну и вообще с моих позиций статья о том, как вы изобрели велосипед, который едет очень плохо. Конечно, МНК и метод Крамерса - это, конечно, хорошо, но неужели нет готовых решений для этого? В распространенных матпакетах типа Матлаба или Маткада функции подгона идут из коробки.

Ответить
0

Конечно я не претендую на правоту данного подхода, поэтому и описал что и как  делал, чтобы знатоки математики и физики смогли доказать что так нельзя или неправильно.

А готовые решения в Матлабе и Маткаде конечно же есть, но каждый день заходить в матлаб и грузить данные не удобно, а тут я и любой человек может с телефона следить что и как.

Если карантинные меры подействуют, то через несколько дней мы увидим совсем другой прогноз и по числу зараженных и по времени. Но с другой стороны мы будем знать что они подействовали и на сколько это приблизило окончание это ситуации

Ответить
0

А готовые решения в Матлабе и Маткаде конечно же есть, но каждый день заходить в матлаб и грузить данные не удобно, а тут я и любой человек может с телефона следить что и как.

Я их привёл как пример. Я просто удивлён: неужели в том языке, на котором вы пишите, нет готовых пакетов на гитхабе под такие популярные задачи?

Ответить
13

ты, наверное, пропустил, что pornhub, халявный премиум всем дали ....

спасибо за сайт 

Ответить
2

Точно, пошел смотреть

Ответить
0

Поработал, можно и отдохнуть

Ответить
8

Вот несколько моментов смутили:
1) Статистика идёт только по тем, кто проверился. Полной картины мы не знаем.
2) Распределение же должно иметь некий изгиб в момент, когда внедрили карантины и самоизоляции. И конечно когда стали проверять больше. Ну и учитывая факт, что умирают не все, и вылечиваются по разным сценариям. 

Например мне кажется более логична модель того же  Plague Inc, где когда находят лекарство, число зараженных падает значительно быстрее, чем до лекарства.

Ответить
3

Ясно что факторов много, но в итоге по статистике все равно получиться приблизительно нормальное распределение

Ответить
4

Самое главное допущение как раз про распределение. Инфу и пруфы что это действительно статистически значимая модель можно? 

Ответить
1

Прошу "пруф что ND применимо к эпидемии", кидают вики на ND. Пока кишки по веткам не рабросает?

Ответить
0

Нормальное распределение - это все же распределение. Случайной величины около среднего значения. Каждое значение независимо от других. А вот применять НР для процесса в динамике, где по оси Х не разброс, а вообще время, и где значение в момент времени зависит от этого же значения на предыдущем отрезке? По-моему совсем разные процессы.

Ответить
1

Можно на Китай посмотреть, где все закончилось, как образец. Там плюс-минус все отражено в действительном графике роста больных и он похож на норм. распределение (ну почти) 

Ответить
0

Да нифига он не нормальный. Критерий колмогорова-смирнова на пуассоне лучше сойдется, чем на гауссе.

Ответить

Принятый космос

пиу-пиу
0

1) Статистика идёт только по тем, кто проверился. Полной картины мы не знаем.

А можно как то иначе оформить?)))

Ответить
4

Бро, похоже это единственный сайт со всеми графиками в одном месте. Причем кажется в начале много таких сайтов было, но потом все ушли в какую-то ебанину, вроде текстовой статистики – приходится ходить по 10 ресурсам, что бы собрать в одном место все.

Ответить
2

Спасибо, сохраняй в закладки!

Ответить
0

По России тут одна точка, ну а так да, по Китаю норм дашборд был настроен 

Ответить
4

У меня конечно анус в трубочку свернулся от такой смелой попытки натянуть сову на гаусс, но если тебе было весело, это самое главное.

Ответить
0

Смотри еще и Логнорму натянул)

Ответить
2

Это и есть Data seines?

Ответить

Принятый космос

Коронавирус
7

siemens

Ответить
0

Ты че пес я инженер!)

Ответить

Принятый космос

3

Единственное, чего не хватает, это распределение по возрастами. Было бы оч здорово

Ответить

Учащийся чувак

Принятый
0

Сообщение удалено

Ответить

Принятый космос

Учащийся
1

Не чувствую себя оскорбленным, а вот ты чето триггернулся

Ответить

Процессуальный цвет

3

Комментарий удален по просьбе пользователя

Ответить

Подходящий микроскоп

2

У Ирана какая-то херня с данными?

Ответить

Подходящий микроскоп

Подходящий
2
Ответить
0

видимо что-то скрывают... 

Ответить

Подходящий микроскоп

Коронавирус
3

ну судя по графику — наоборот преувеличивают) может в твоих расчетах затаился ошибочный аргумент?

Ответить
0

ХЗ, все расчеты представлены открыто специально чтобы внимательные эксперты нашли ошибки

Ответить

Подходящий

Коронав…
0

залей куданить на Хабр например

Ответить
0

Ох, лол. Ну, во-первых, формулы совершенно не читаемые. Никто не будет разбираться.
Во-вторых, у тебя там нет расчетов. Там просто формулы из учебника. Задача решается численными методами, ошибку искать негде. Да и зачем искать ошибку в расчетах там, где критерием ее отсутствия являются совпадающие линии на графике?
Ну и в-третьих, почему Гаусс? Ну, потому что гаусс много где. Просто используй его везде, 90% угадаешь, а 10% - ну я же не физик.
Можно много чего интересного нагуглить по теме и поразбираться, но ведь цель статьи не в этом, тут главное ссылочку на свой сайтик оставить, да?

Ответить
2

Время ставить на сайт google adsense ;)

Ответить
2

Теперь нашей власти не надо будет придумывать новые цифры, они просто будут следовать твоим графикам :D

Ответить

Принятый космос

0

в Хохланд все очень даже позитивненько

Ответить

Учащийся чувак

Принятый
1

@Сергей Звезда оскорбление украинцев

Ответить

Принятый космос

Учащийся
1

Не чувствую себя оскорбленным, а вот ты чето триггернулся [дважды]  

Ответить

Учащийся чувак

Принятый
–2

А я чувствую себя оскорбленным и не одобряю @Сергей Звезда забаньте его за оскорбление Украины и меня

Ответить

Принятый космос

Учащийся
–2

Хочешь что бы я тебя еще как-то оскорбил? Или бычки затушил об твою сладкую попку. Я ведь прекрасно понимаю, к чему ты клонишь...

Ответить
0

а где можно смотреть онлайн или ты так, на 5 мин заморочился ради картинки?

Ответить

Принятый космос

Orbital_Cat
0

Не понял тебя. Автор поста же скинул свой сайт. Ты о чем?

Ответить
0

ну там же нет хохляндии...

Ответить

Принятый космос

Orbital_Cat
1

В списке да. Я руками ввёл Ukraine. В ссылку. Его просто не видно. А так там все есть же

Ответить

Учащийся чувак

Принятый
–6

@Сергей Звезда почему не баните его

Ответить

Учебный яд

0

Прогноз невалиден. По крайней мере, представленный на скрине.

Ответить
3

Прогноз обновляется каждый день, когда поступают новые данные, чем больше данных, тем точнее прогноз

Ответить
1

Все-таки смею предположить, что прогноз не будет точным никогда. Процент бессимптомных носителей высок.

Ответить
1

А Украина?(

Ответить
0

Маловато данных пока.

Ответить
1

Я не совсем понял, почему пик прогноза по "болеющим" во вкладке "Весь мир" произойдёт примерно 17-20 мая, хотя если отдельно полистать страны, то во всех 17-20 мая - это почти полный спад по болеющим.

Ответить
1

А что там у хохлов?
п.с. прогноз австралии выглядит жутко

Ответить
1

2 коммента, скорее с точки зрения математики:
1) схрена ли эпидемия развивается по Гауссу (не придираюсь, правда не понимаю)
2) надо считать по когортам, где закладывать текущие показатели виральности

Ответить
0

вдогонку к Гаусу сделал Логнорму - она вроде лучше показывает

Вся сложность в том, что если брать кучу показателей от которых реально зависит развитие эпидемии, то ошибка будет умножаться от их неточности 

Ответить
1

Есть еще человеческий фактор и политическая поебота. Эти два коэффициента сложно предсказать, но они обычно бросаются в крайности.

Ответить
1

А прологарифмировать показатель степени и вынести множитель за скобки забыл?
Переделывай :)

Ответить
0

Не забыл, смотри внимательней)

Ответить
1

Обобщая все вопросы к прогнозу, понял что основной вопрос — это почему Гаусс?

У Китая склон спада более пологий чем склон подъема, что не похоже на симметричного Гаусса, но похоже на логнормальное распределение.

Добавил новый прогноз, на котором вместе отображаются и Гаусс и Логнорма

У некоторых стран, например у России, не считается долгосрочный прогноз - данные такие, что Логнорма очень хорошо проходит по точкам, но не чувствует пика и рисует его очень далеко и высоко. 
Для таких стран отображаю прогноз на 20 дней вперед. Думаю, по мере поступления новых данных, это пройдет.

А вообще, если по всем странам посмотреть, то Логнорма везде лучше, чем Гаусс. 

Как думаете для обсуждения нового прогноза,  сделать отдельный пост, где подробно расскажу о новом прогнозе?

https://coronavirussia.online/prognoz/All

Ответить
0

Еще непонятно как Африка себя поведет. 

Ответить
2

 непонятно как Африка себя поведет

Ответить
0

Сук, флешбекнуло тредами про раскраску пустынь и покатушками на  джипах по ним же.

Ответить

Налоговый огонь

Людмила
0

Они и как и китайцы всех переживут 

Ответить
0

В Танзании сейчас 20 заражённых. Первый был выявлен более 2 недель назад. Режим самоизоляции введён две недели назад 

Ответить

Учебный яд

Людмила
0

Простите, не удержался

Ответить
0

поцелуйсердечко)

Ответить
0

Заебись ник выбрал

Ответить
4

Я поясню диссонанс:

Начало статьи указывает на то что типа сделано от скуки отдельным индивидумом, все остальное же указывает на явное продвижение (коммерческое?) как некоей организации.

Ответить
0

Ну начинал от скуки (в том числе и в истаграмме мемы собирать), а потом втянулся, насчет коммерции не думал, как пойдет

Ответить
0

У тебя ерунда какая то получается, на примере Китая хорошо видно. Гаусс в начале растет, а потом падает, а кол-во зараженнных не падает, оно только растет.

Ответить
1

Красным обозначены не те, кто в данный момент заражены, а те, кто вообще был заражён

Ответить
0

А он по каким считает, ниче не пойму(

Ответить
0

Красные - заразились за все время. Оранжевое - болеют в данный момент. Красная шкала не может уменьшаться, оранжевая - может, потому что люди выздоравливают. Зеленая так же, как и красная, может только увеличиваться.

Ответить
0

Прогноз по оранжевой линии

Ответить
0

прогноз надо сделать каким то... фиолетовым. с желтым сливается.

Ответить

Чуждый дым

0

Опечатки

Ответить
–3

/gaus/Russia

Вообще-то он Гаусс, прогнозяторы.

Ответить
0

Некоторые страны видимо так публикуют данные, что по ним не строится функция(

Видимо что-то скрывают

Ответить

Ленинский танк88

Коронавирус
0

Ну невнятную ошибку всё равно не должно выдавать.

Ответить
0

Добавь переключатель на log шкалу

Ответить

Уголовный бинокль

0

т.е. судя по прогрозу, в России на пике будет заражено "всего" 27 000 человек? А в той же США 300 000 зараженных и они все ещё в начале графика? 

Ответить
0

Это просто статистическая модель, основанная на данных до вчерашнего дня (типа что будет если все продолжится в том же духе) а если например завтра появятся новые данные что количество новых случаев в России или США начинает падать или наоборот резко расти, то прогноз измениться и по пику и по длительности, так что надо следить каждый день

Ответить
0

А что происходит на графике в Норвегии? Почему прогноз не изменился под реалии?

Ответить
0

я хз, такие у них данные, как считается модель описано ниже, некоторые страны вообще не считает( 

Ответить
0

Видимо по тем точкам данных, что Австралия передает, только такая кривая строится, думаю со временем исправиться.

Ответить
0

если прогноз суммарных данных показывает меньше чем сумма локальных прогнозов - то в расчёте что-то явно не так

Ответить
0

А почему сразу не прогнозировать линию смерти и выздоровления хотя бы примерно, от прогноза всего заразившихся?
Например мы по другим странам знаем процент летальности, от и до, почему бы не накладывать эти от и до на графике и штриховать участок между ними, чтобы было ясно, мол вот это при летальности условной Италии/США, а вот это это летальность условной Кореи, а вот средняя. 
Всё это исходя из прогноза конкретной страны по зараженным.

Ответить
0

Яндекс карты плохо. Сделай OSM.

Ответить
0

Я в данный момент работаю в компании, которая находится под крылом Singapore Airlines. 30 марта был Board Meeting, на котором они сказали что в Юго-Восточной азии границы для перелетов начнут открывать дай бог к октябрю-декабрю, и то только в "хороших" странах, где еще с начала февраля как следует оберегались от вируса (про Индонезию например сказали что они будут в числе последних). А ведь Сингапур и многие подобные страны на несколько световых лет впереди могучей россюшки и подобных мест. Так что с расчетами на то что к июню всё будет заебись вас скорее всего будет ожидать крайне ахуительное продолжение года. Хотя конечно хотелось бы верить в лучшее.

Ответить
0

Нормальное распределение показателя процесса от времени встречается очень редко. Да никогда оно не встречается. Я даже не могу ни одного дифура придумать, который бы моделировал какой-нибудь процесс, где есть нормальное распределение по времени. Разве что если бы все заразились бы в один день, но есть расброс инкубационного периода, который (вдруг?) распределен близко к нормальному

Ответить
0

Можно попросить вас добавить Индонезию?

Ответить
0

Мужик, годный сервис. Хотел рассказать о нем в инсте, но он блокирует сторис о коронавирусе :(

Ответить

Руководящий холод

0

Не верю, что в России при ?130? Млн. Населения будет 30к зараженых, склоняюсь к 100-150к

Ответить
0

Зачем Гаусс? Просто смоделируй процесс. Мат модели есть готовые, ничего изобретать не надо. Вот тебе даже формулы :)

Ответить
0

у вас явно где-то ошибка. Только по Австралии на 27.06 показывает почти 9М а в мире на ту же дату чуть больше 1М
отрицательных показателей при этом ни в одной стране, конечно же, нет :) 

Ответить
0

Из-за того что каждая страна по разному диагностирует день ото дня, в базу попадает не совсем хорошая выборка, ну и прогноз в этом случае не получается.

Сейчас вроде Австралия  нормальную линию рисует

Ответить
0

ну вроде таких очевидных проблем и правда не вижу. а можете построить такой же прогноз по смертям и заболевшим?

Ответить
0

Там диванные войска без программирования из твиттера сделали свои прогнозы, на выдуманных коэффициентах, и там тоже вполне себе ничего прогноз - https://virology.su/prognoz.html как и все в принципе. 

Ответить
0

И всё таки модель Гауса не работает, более прогнозируемым остается модель SIR и её вариации. Но точно рассчитать под каждую страну не просто. Вот расчет для России. Прогноз строится в коридоре между худшим и лучшим случаями https://coronavirus-hub.ru/russia/ .Используется модель SIR

Ответить
Обсуждаемое
Разборы
Регулирование, «утечка мозгов», жалобы: о чём российская IT-отрасль говорила на встрече с Мишустиным
Одним из участников панели стал Telegram, который в последние два года официально не работал в России.
Новости
В Петербурге на флагштоке школы появился флаг ЛГБТ
Директор школы назвала это диверсией и обратилась в полицию.
Новости
Собор Святой Софии снова стал мечетью — турецкий суд отменил решение 1934 года о его превращении в музей
Инициатива вернуть собору статус мечети принадлежит президенту Турции. Против его идеи выступили РПЦ, госсекретарь США и правительство Греции.
Популярное за три дня
Истории
«Я живу на улице 15 дней»: TJ побывал на забастовке курьеров и пообщался с ними о конфликте с Delivery Club
Курьеры требовали встречи с руководством компании, вместо этого к ним пришёл «Левый фронт».
Новости
Губернатор Петербурга поздравил «Зенит» с победой в чемпионате России. Трибуны его освистали
Но Александр Беглов всё равно произнёс речь.
Новости
СМИ: полицейские из Улан-Удэ избили 17 летнего подростка и разорвали ему прямую кишку, снимая пытки на телефон
Мальчика обвиняли в краже. Суд арестовал троих полицейских.

Комментарии