{"id":919,"title":"\u041f\u043e \u043f\u0440\u0430\u0432\u0438\u043b\u0430\u043c \u0441\u043e\u0440\u0442\u0438\u0440\u043e\u0432\u043a\u0438, \u0431\u0443\u043c\u0430\u0436\u043d\u044b\u0435 \u0441\u0442\u0430\u043a\u0430\u043d\u0447\u0438\u043a\u0438 \u2014 \u0432\u043e\u0432\u0441\u0435 \u043d\u0435 \u0431\u0443\u043c\u0430\u0436\u043d\u044b\u0435","url":"\/redirect?component=advertising&id=919&url=https:\/\/vc.ru\/promo\/321539-instrukciya-kak-biznesu-vykidyvat-musor-po-umu&placeBit=1&hash=55dde85b85d8ed809ee55d77cc6b3f56fae5dc6ade5a1caa04a7da62ad7d9dbf","isPaidAndBannersEnabled":false}

Прогноз пандемии коронавируса. Нормальное распределение

Прогноз развития эпидемии в России​ coronavirussia.online

Как и все сознательные люди, я сижу дома и пытаюсь себя всячески развлечь. Но со всех утюгов только и слышно, что про коронавирус.

Решил я узнать, когда же закончится эта канитель. Покопался в интернете и на то время ничего конкретного ни нашел.

На своей работе я уже давно ничего не программировал, а руки-то чешутся. Вот и придумал написать сайт, который соберет данные из открытых источников, красиво их отобразит их, да и еще сделает прогноз, что будет дальше.

Согласно статистике, развитие эпидемий в мире происходит по нормальному закону распределения Гаусса. Его и взял за основу.

Для начала подключился к открытым источникам и научился выкачивать данные раз в 15 минут. Отобразил их красиво с помощью Chart.js и перешел к прогнозу. Взял для работы функцию нормального распределения

y(t) = b · e -c·(t-a)2

Исходные данные ti — ежедневные отметки времени xi — число активных случаев болезни в этот день

Взял натуральный логарифм от y(t) и от данных xi

ui = ln(xi) u(t) = ln(y) = ln(b) - c·t2 + 2c·a·t - c·a2

Сделаем замены: А=-с; B=2a·c; C=ln(b)-c·a2; Получаем

u(t) = A·t2 + B·t + C

Чтобы найти А, В и С — использую метод наименьших квадратов, согласно которому сумма по i от 1 до n квадратов разностей

Σ(xi - y(ti))2 -> min

должна стремится к минимуму.

Назовем эту сумму Ф (A, В, С)

Продифференцируем dФ по dA, dB и dC. Производные при это должны быть равны нулю.

Получаем систему уравнений

A·Σti4 + B·Σti3 + C·Σti2 = Σui·ti2

A·Σti3 + B·Σti2 + C·Σti = Σui·ti

A·Σti2 + B·Σti + C·n = Σui

Решаем эту систему по методу Крамера

А = ∆A/∆

B = ∆B/∆

C = ∆C/∆

Находим нужные коэффициенты a, b , c для исходной функции

И, вуаля, готово! Программируем и рисуем красивые графики и узнаем когда это кончится!

Так как данные обновляются с появлением новых случаев, и мой прогноз обновляется тоже.

Чем больше данных, тем точнее прогноз. На данный момент, реальные данные экспертов в Италии говорят о пике эпидемии, и кривая Гаусса показывает тоже самое.

​Прогноз развития эпидемии в Италии coronavirussia.online

По ссылке ниже смотрите прознозы для других стран и для всей планеты

Данные обновляются каждые 15 минут и прогнозы соответственно тоже!

Будьте здоровы!

0
120 комментариев
Популярные
По порядку
Написать комментарий...
Удивленный звук

выглядит слишком оптимистично, прям вот как единорог верхом на снежном человеке (хотя у меня был трояк по алгебре и я, возможно, просто не секу), но я буду в это верить, потому что задолбалась от постоянных скачков состояния от "мы все умрём" до "всё будет ок"

28
Удивленный звук

задолбалась от постоянных скачков состояния

Состояние "пофиг" не пробовала?

12
Удивленный звук

Не умею, я очень тревожная 

10

Мы все умрем, но это ок.

3

Согласно статистике, развитие эпидемий в мире происходит по нормальному закону распределения Гаусса.

Пруф или Петрик.
Вы ведь не физик, да? Гауссов профиль получается только в простейших моделях заражения в одномерном ограниченном пространстве. У вас же здесь распространение по поверхности сферы, здесь даже модельный профиль должен быть не симметричен по времени, не говоря уже о миллионах факторов, в том числе таких важных, как распределение людей по площади. Всё это накапливает сомнения в предсказательной силе ваших графиков.
Да и вообще, по маленькой краюхе восстановливать дальний порядок - это крайне некорректная задача. Это означает, что малое изменение начального параметра может привести к сильному изменению всего графика. Работает эффект рычага. Особенно это важно, учитывая, что точки далеко не идеально ложатся на кривую, то есть есть погрешности. Это означает, что погрешность итогового графика окажется слишком большой, чтобы весь расчёт считался надёжным предсказанием. Вы можете сами это оценить, посчитав дисперсию и построив два графика для разных концов стартового распределения параметров.

18

Ну и вообще с моих позиций статья о том, как вы изобрели велосипед, который едет очень плохо. Конечно, МНК и метод Крамерса - это, конечно, хорошо, но неужели нет готовых решений для этого? В распространенных матпакетах типа Матлаба или Маткада функции подгона идут из коробки.

9

Конечно я не претендую на правоту данного подхода, поэтому и описал что и как  делал, чтобы знатоки математики и физики смогли доказать что так нельзя или неправильно.

А готовые решения в Матлабе и Маткаде конечно же есть, но каждый день заходить в матлаб и грузить данные не удобно, а тут я и любой человек может с телефона следить что и как.

Если карантинные меры подействуют, то через несколько дней мы увидим совсем другой прогноз и по числу зараженных и по времени. Но с другой стороны мы будем знать что они подействовали и на сколько это приблизило окончание это ситуации

0

ты, наверное, пропустил, что pornhub, халявный премиум всем дали ....

спасибо за сайт 

13

Точно, пошел смотреть

2
Удивленный звук

Поработал, можно и отдохнуть

0

Вот несколько моментов смутили:
1) Статистика идёт только по тем, кто проверился. Полной картины мы не знаем.
2) Распределение же должно иметь некий изгиб в момент, когда внедрили карантины и самоизоляции. И конечно когда стали проверять больше. Ну и учитывая факт, что умирают не все, и вылечиваются по разным сценариям. 

Например мне кажется более логична модель того же  Plague Inc, где когда находят лекарство, число зараженных падает значительно быстрее, чем до лекарства. ред.

8

Ясно что факторов много, но в итоге по статистике все равно получиться приблизительно нормальное распределение

3

Самое главное допущение как раз про распределение. Инфу и пруфы что это действительно статистически значимая модель можно? 

4

Нормальное распределение - это все же распределение. Случайной величины около среднего значения. Каждое значение независимо от других. А вот применять НР для процесса в динамике, где по оси Х не разброс, а вообще время, и где значение в момент времени зависит от этого же значения на предыдущем отрезке? По-моему совсем разные процессы.

0

Можно на Китай посмотреть, где все закончилось, как образец. Там плюс-минус все отражено в действительном графике роста больных и он похож на норм. распределение (ну почти) 

1

Да нифига он не нормальный. Критерий колмогорова-смирнова на пуассоне лучше сойдется, чем на гауссе.

0
Удивленный звук

1) Статистика идёт только по тем, кто проверился. Полной картины мы не знаем.

А можно как то иначе оформить?)))

0

Бро, похоже это единственный сайт со всеми графиками в одном месте. Причем кажется в начале много таких сайтов было, но потом все ушли в какую-то ебанину, вроде текстовой статистики – приходится ходить по 10 ресурсам, что бы собрать в одном место все.

4

Спасибо, сохраняй в закладки!

2

По России тут одна точка, ну а так да, по Китаю норм дашборд был настроен 

0

Комментарий удален по просьбе пользователя

4

Комментарий удален по просьбе пользователя

2

Смотри еще и Логнорму натянул)

0

Это и есть Data seines?

2
Удивленный звук

siemens

7

Ты че пес я инженер!)

0
Удивленный звук

Единственное, чего не хватает, это распределение по возрастами. Было бы оч здорово

3
Удивленный звук

Комментарий удален по просьбе пользователя ред.

0
Удивленный звук

Не чувствую себя оскорбленным, а вот ты чето триггернулся

1
Удивленный звук

Комментарий удален по просьбе пользователя

3

У Ирана какая-то херня с данными?

2

видимо что-то скрывают... 

0

Время ставить на сайт google adsense ;)

2

Теперь нашей власти не надо будет придумывать новые цифры, они просто будут следовать твоим графикам :D

2
Удивленный звук

в Хохланд все очень даже позитивненько

0
Удивленный звук

Комментарий удален по просьбе пользователя

1
Удивленный звук

Не чувствую себя оскорбленным, а вот ты чето триггернулся [дважды]  

1

а где можно смотреть онлайн или ты так, на 5 мин заморочился ради картинки?

0
Удивленный звук

Не понял тебя. Автор поста же скинул свой сайт. Ты о чем?

0
Удивленный звук

Комментарий удален по просьбе пользователя

–6
Удивленный звук

Прогноз невалиден. По крайней мере, представленный на скрине.

0

Прогноз обновляется каждый день, когда поступают новые данные, чем больше данных, тем точнее прогноз

3

Все-таки смею предположить, что прогноз не будет точным никогда. Процент бессимптомных носителей высок.

1

А Украина?(

1

Маловато данных пока.

0

Я не совсем понял, почему пик прогноза по "болеющим" во вкладке "Весь мир" произойдёт примерно 17-20 мая, хотя если отдельно полистать страны, то во всех 17-20 мая - это почти полный спад по болеющим. ред.

1

А что там у хохлов?
п.с. прогноз австралии выглядит жутко

1

2 коммента, скорее с точки зрения математики:
1) схрена ли эпидемия развивается по Гауссу (не придираюсь, правда не понимаю)
2) надо считать по когортам, где закладывать текущие показатели виральности

1

вдогонку к Гаусу сделал Логнорму - она вроде лучше показывает

Вся сложность в том, что если брать кучу показателей от которых реально зависит развитие эпидемии, то ошибка будет умножаться от их неточности 

0

Комментарий удален по просьбе пользователя

1

А прологарифмировать показатель степени и вынести множитель за скобки забыл?
Переделывай :)

1

Не забыл, смотри внимательней)

0

Обобщая все вопросы к прогнозу, понял что основной вопрос — это почему Гаусс?

У Китая склон спада более пологий чем склон подъема, что не похоже на симметричного Гаусса, но похоже на логнормальное распределение.

Добавил новый прогноз, на котором вместе отображаются и Гаусс и Логнорма

У некоторых стран, например у России, не считается долгосрочный прогноз - данные такие, что Логнорма очень хорошо проходит по точкам, но не чувствует пика и рисует его очень далеко и высоко. 
Для таких стран отображаю прогноз на 20 дней вперед. Думаю, по мере поступления новых данных, это пройдет.

А вообще, если по всем странам посмотреть, то Логнорма везде лучше, чем Гаусс. 

Как думаете для обсуждения нового прогноза,  сделать отдельный пост, где подробно расскажу о новом прогнозе?

https://coronavirussia.online/prognoz/All

1

Еще непонятно как Африка себя поведет. 

0

 непонятно как Африка себя поведет

2
Удивленный звук

Сук, флешбекнуло тредами про раскраску пустынь и покатушками на  джипах по ним же.

0
Удивленный звук

Они и как и китайцы всех переживут 

0

В Танзании сейчас 20 заражённых. Первый был выявлен более 2 недель назад. Режим самоизоляции введён две недели назад 

0
Удивленный звук

Простите, не удержался

0

поцелуйсердечко)

0
Удивленный звук

Заебись ник выбрал

0
Удивленный звук

Я поясню диссонанс:

Начало статьи указывает на то что типа сделано от скуки отдельным индивидумом, все остальное же указывает на явное продвижение (коммерческое?) как некоей организации.

4

Комментарий удален по просьбе пользователя

0

Красным обозначены не те, кто в данный момент заражены, а те, кто вообще был заражён

1

Комментарий удален по просьбе пользователя

0
Удивленный звук

Опечатки

0

)) попрвил

0
Удивленный звук
2

/gaus/Russia

Вообще-то он Гаусс, прогнозяторы.

–3

Некоторые страны видимо так публикуют данные, что по ним не строится функция(

Видимо что-то скрывают

0
Удивленный звук

Ну невнятную ошибку всё равно не должно выдавать.

0

Добавь переключатель на log шкалу

0
Удивленный звук

т.е. судя по прогрозу, в России на пике будет заражено "всего" 27 000 человек? А в той же США 300 000 зараженных и они все ещё в начале графика? 

0

Это просто статистическая модель, основанная на данных до вчерашнего дня (типа что будет если все продолжится в том же духе) а если например завтра появятся новые данные что количество новых случаев в России или США начинает падать или наоборот резко расти, то прогноз измениться и по пику и по длительности, так что надо следить каждый день

0

А что происходит на графике в Норвегии? Почему прогноз не изменился под реалии?

0

я хз, такие у них данные, как считается модель описано ниже, некоторые страны вообще не считает( 

0

Видимо по тем точкам данных, что Австралия передает, только такая кривая строится, думаю со временем исправиться.

0

если прогноз суммарных данных показывает меньше чем сумма локальных прогнозов - то в расчёте что-то явно не так

0

А почему сразу не прогнозировать линию смерти и выздоровления хотя бы примерно, от прогноза всего заразившихся?
Например мы по другим странам знаем процент летальности, от и до, почему бы не накладывать эти от и до на графике и штриховать участок между ними, чтобы было ясно, мол вот это при летальности условной Италии/США, а вот это это летальность условной Кореи, а вот средняя. 
Всё это исходя из прогноза конкретной страны по зараженным.

0

Яндекс карты плохо. Сделай OSM.

0

Я в данный момент работаю в компании, которая находится под крылом Singapore Airlines. 30 марта был Board Meeting, на котором они сказали что в Юго-Восточной азии границы для перелетов начнут открывать дай бог к октябрю-декабрю, и то только в "хороших" странах, где еще с начала февраля как следует оберегались от вируса (про Индонезию например сказали что они будут в числе последних). А ведь Сингапур и многие подобные страны на несколько световых лет впереди могучей россюшки и подобных мест. Так что с расчетами на то что к июню всё будет заебись вас скорее всего будет ожидать крайне ахуительное продолжение года. Хотя конечно хотелось бы верить в лучшее.

0

Нормальное распределение показателя процесса от времени встречается очень редко. Да никогда оно не встречается. Я даже не могу ни одного дифура придумать, который бы моделировал какой-нибудь процесс, где есть нормальное распределение по времени. Разве что если бы все заразились бы в один день, но есть расброс инкубационного периода, который (вдруг?) распределен близко к нормальному ред.

0

Можно попросить вас добавить Индонезию?

0

Мужик, годный сервис. Хотел рассказать о нем в инсте, но он блокирует сторис о коронавирусе :(

0
Удивленный звук

Не верю, что в России при ?130? Млн. Населения будет 30к зараженых, склоняюсь к 100-150к

0

Зачем Гаусс? Просто смоделируй процесс. Мат модели есть готовые, ничего изобретать не надо. Вот тебе даже формулы :)

0

у вас явно где-то ошибка. Только по Австралии на 27.06 показывает почти 9М а в мире на ту же дату чуть больше 1М
отрицательных показателей при этом ни в одной стране, конечно же, нет :) 

0

Из-за того что каждая страна по разному диагностирует день ото дня, в базу попадает не совсем хорошая выборка, ну и прогноз в этом случае не получается.

Сейчас вроде Австралия  нормальную линию рисует

0

Там диванные войска без программирования из твиттера сделали свои прогнозы, на выдуманных коэффициентах, и там тоже вполне себе ничего прогноз - https://virology.su/prognoz.html как и все в принципе. 

0

И всё таки модель Гауса не работает, более прогнозируемым остается модель SIR и её вариации. Но точно рассчитать под каждую страну не просто. Вот расчет для России. Прогноз строится в коридоре между худшим и лучшим случаями https://coronavirus-hub.ru/russia/ .Используется модель SIR

0
Читать все 120 комментариев
null