2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. На страницу Пред.  1 ... 28, 29, 30, 31, 32, 33, 34 ... 241  След.
 
 Re: Коронавирус
Сообщение10.03.2020, 16:52 
Заслуженный участник


20/08/14
11179
Россия, Москва
NikolayPrimachenko в сообщении #1443994 писал(а):
Да, есть большие пессимисты:
Это не то, я говорил про смещение фаз смерти и фактического выздоровления, в статистику они попадают со значительным смещением по датам, что в случае развивающейся эпидемии сильно влияет на оценку уровня смертности.
А что величина $D$ задерживается от величины $C$ в оценках сильнее двух недель и неизвестно на сколько точно я говорил давно, потому и не считаю оценку $D/C$ адекватной при нестабильной величине $C-D-R$ (количестве текущих случаев заражения), т.е. при развивающейся эпидемии.
И более того, при малом значении хоть $D$, хоть $R$, хоть $C$ я не считаю оценку смертности адекватной, статистика единичными случаями не занимается. Именно поэтому статистика по Китаю вне Хубея с её смертностью в $1\%$ недостоверна, там везде буквально единичные случаи смерти.
А вот давайте прикинем смертность в других странах, даже без всяких поправок на даты:
для Южной Кореи $D/C=54/7513=0.7\%$, $D/(D+R)=54/(54+247)=18\%$;
для Италии $D/C=463/9172=5\%$, $D/(D+R)=463/(463+724)=39\%$;
для Испании $D/C=35/1512=2.3\%$, $D/(D+R)=35/(35+32)=52\%$;
для Франции $D/C=30/1412=2.1\%$, $D/(D+R)=30/(30+12)=71\%$;
для Германии $D/C=2/1281=0.2\%$, $D/(D+R)=2/(2+18)=10\%$;
для США $D/C=27/729=3.7\%$, $D/(D+R)=27/(27+15)=64\%$;
для Японии $D/C=10/543=1.8\%$, $D/(D+R)=10/(10+102)=9\%$;
для Ирана величина $R/C=2731/8042=34\%$ (т.е. уже выздоровело треть всех заболевших) совершенно нереальна для развивающейся эпидемии и потому цифры считаю некорректными (например выписывают без повторного теста или вообще по исчезновении симптомов).
Что из этого видим? А видим что даже если вот прям с сегодняшнего дня больше не будет ни одного нового заболевшего, то в Италии смертность не ниже $5\%$, в США не менее $4\%$, во Франции, Испании, Японии не менее $2\%$, и только Южная Корея ниже $1\%$ (Германию исключаю из-за $D=2$, это слишком мало для статистических выводов). Но ей веры собственно и нет, там из-за быстрого распространения вируса просто ещё не успели умереть те, кто всё же умрёт. Ну и о каком $<1\%$ вне Хубея можно говорить?! Огромные цифры $D/(D+R)$ показывают что эпидемия только-только развивается, первые умершие уже есть, а первые выздоровевшие только-только начинают появляться, но если взять $D_{-14}$ (умершие две недели назад, причём похоже для Южной Кореи и Италии, единственных более-менее адекватных по данному показателю, надо брать разные временные смещения), то эта величина будет околонулевой и статистика снова станет неадекватной.

 Профиль  
                  
 
 Re: Коронавирус
Сообщение10.03.2020, 17:30 
Аватара пользователя


11/12/16
13311
уездный город Н
Dmitriy40 в сообщении #1444054 писал(а):
Именно поэтому статистика по Китаю вне Хубея с её смертностью в $1\%$ недостоверна, там везде буквально единичные случаи смерти.


В Китае вне Хубея:
а) $111$ случаев смерти
б) $13171$ подтвержденных случаев
это единичные случаи? :shock:

Dmitriy40 в сообщении #1444054 писал(а):
А вот давайте прикинем смертность в других странах, даже без всяких поправок на даты:

На искажения может влиять куча факторов, некоторые из них перечислялись в теме. Есть ещё, например, такой: в США "бомба" попала в дом престарелых, и подавляющее большинство умерших оттуда. Это
а) и общий коэффициент смертности "утягивает" вверх.
б) и оценки количества заболевших через количество умерших получаются сильно завышенными.

При развивающемся процессе $D/C$ и $D/(D+R)$ дают очень разные оценки. Что мы собственно и наблюдаем во всех странах, кроме Китая (и наблюдали ранее в Китае).

 Профиль  
                  
 
 Re: Коронавирус
Сообщение10.03.2020, 20:03 


16/08/19
104
Си Цзиньпин приехал сегодня в Ухань и пообщался с местными жителями:
https://www.youtube.com/watch?v=8cqOutF8XIs

 Профиль  
                  
 
 Re: Коронавирус
Сообщение10.03.2020, 21:11 
Заслуженный участник


20/08/14
11179
Россия, Москва
EUgeneUS в сообщении #1444058 писал(а):
Dmitriy40 в сообщении #1444054 писал(а):
Именно поэтому статистика по Китаю вне Хубея с её смертностью в $1\%$ недостоверна, там везде буквально единичные случаи смерти.

В Китае вне Хубея:
а) $111$ случаев смерти
б) $13171$ подтвержденных случаев
это единичные случаи? :shock:

Да, это именно что единичные случаи — в каждой провинции буквально по несколько смертей. Нигде нет полусотни и более. Всего в двух более десяти (13 и 22). При среднем по провинциям всего в 3.7. Для статистики это и есть единичные случаи, я считаю.

 Профиль  
                  
 
 Re: Коронавирус
Сообщение11.03.2020, 06:43 
Аватара пользователя


11/12/16
13311
уездный город Н
Dmitriy40
Но мы же не рассматриваем каждую провинцую отдельно.
А в совокупности данных достаточно.

 Профиль  
                  
 
 Re: Коронавирус
Сообщение11.03.2020, 07:25 
Заслуженный участник


20/08/14
11179
Россия, Москва
EUgeneUS
Кажется я уже говорил Вам, что усреднение улучшает статистику (повышает достоверность) только при выполнении ряда необходимых условий (типа независимости данных). Если данные окажутся скоррелированными, а это вполне возможно (например умерли лишь самые-самые тяжёлые/запущенные случаи), то никаким усреднением реальную картину не получите (сколь бы много данных ни было). А когда данных мало, то слишком велик вклад случайных факторов. Потому и надо много случаев в каждой выборке (провинции), чтобы случайные факторы усреднились практически в ноль, а когда там по 2.7 случая в среднем по 28 провинциям (кроме двух топ), ну что на них может усредниться-то ... :facepalm:

 Профиль  
                  
 
 Re: Коронавирус
Сообщение11.03.2020, 10:45 
Заслуженный участник


07/07/09
5408
mathpath в сообщении #1444105 писал(а):
Си Цзиньпин приехал сегодня в Ухань


Ситуации стабилизировалась благодаря соблюдению карантина и выявлению инфицированных (через отслеживание контактов в последние несколько дней с оказавшимися инфицированными на сегодняшний день).
Что будет в Ухане, если ослабить карантин и перестать отслеживать контакты ?

Почему Европа не ввела такие меры?

 Профиль  
                  
 
 Re: Коронавирус
Сообщение11.03.2020, 16:52 


16/08/19
104
Говорят, что в Ухани уже заработали заводы-филиалы от хонды и ниссана

 Профиль  
                  
 
 Re: Коронавирус
Сообщение11.03.2020, 17:49 
Заслуженный участник


20/08/14
11179
Россия, Москва
Выскажу своё субъективное мнение.
Xey в сообщении #1444276 писал(а):
Что будет в Ухане, если ослабить карантин и перестать отслеживать контакты ?
Учитывая что инкубационный период порядка двух недель (выбросы в плюс единичны и погоды не делают) и уменьшение количество заражённых (active case) с 18 февраля, то ничего страшного не будет. Может кого-то и пропустят, но быстро обнаружат и новый очаг оперативно закарантинят.
Xey в сообщении #1444276 писал(а):
Почему Европа не ввела такие меры?
Это уже вопрос скорее конспирологический. Какой-то деятель ВОЗ (ссылка была выше в теме) прямо сказал про Италию "это была ошибка, что не отнеслись серьёзно и не ввели карантин для прибывающих из Китая". Ошиблись с оценкой рисков. Пожалели свою экономику. Засмущались идти против прав и свобод граждан (а карантин это ограничение). Возможных причин много и правду мы не узнаем, разве что кто-то напишет мемуары лет через 30. Да и правда может быть не одна (а стечением многих обстоятельств у многих людей). Вообще выяснять мотивы не слишком продуктивно, лучше оценивать объективные поступки.

 Профиль  
                  
 
 Re: Коронавирус
Сообщение11.03.2020, 20:52 
Заслуженный участник


20/08/14
11179
Россия, Москва
ВОЗ таки объявило пандемию.

В РФ уже 28 заразившихся (из них 15 в Москве). По РФ данных не заметил, по Москве говорят взрослые не ходили на работу, а ребенок (который без симптомов) в школу, так что вероятность вспышки очага мала. Впрочем это увидим в ближайшие дни.
Под наблюдением находятся "около тысячи" человек в Москве, кто контактировал с заразившимися. Ещё о 700 переданы данные туда куда они уехали. Это к тому что цепочки таки отслеживаются, во всяком случае в Москве.

В Ухане прекратили работу все временные госпитали в связи с выпиской последних заразившихся. Остальные я так понимаю остаются в обычных госпиталях. Общественный транспорт и некоторые предприятия возвращаются к нормальной работе. Но карантин с провинции пока не снят.

 Профиль  
                  
 
 Re: Коронавирус
Сообщение11.03.2020, 21:21 
Аватара пользователя


11/12/16
13311
уездный город Н
Dmitriy40 в сообщении #1444262 писал(а):
Кажется я уже говорил Вам, что усреднение улучшает статистику (повышает достоверность) только при выполнении ряда необходимых условий (типа независимости данных). Если данные окажутся скоррелированными, а это вполне возможно (например умерли лишь самые-самые тяжёлые/запущенные случаи), то никаким усреднением реальную картину не получите (сколь бы много данных ни было).


Да, Вы это говорили.
И даже можно пофантазировать, какие могут факторы, приводящие к не независимости данных. Например, это может быть возрастная категория пациентов в кластерном случае. Попадет вирус в казарму или в общежитие университета, либо в дом престарелых - смертность будет сильно разная.
Но это всё слова, пока не посчитаны числа.
А я их посчитал. Вот каким образом:
1. Взял данные по провинциям за 7 марта (просто подвернулась удобная для экспорта табличка в таймлайне на английской вики).
2. Посчитал коэффициент смертности по всем провинциям (кроме Хубея) и средний.
3. В качестве модели (нулевой гипотезы) взял распределение Пуассона.
4. Для каждой провинции посчитал p-value.
5. Так как у нас не одна гипотеза, а много - по количеству провинций, то нужно делать поправки на множественную проверку гипотез
6. Поправки смотрел сразу три
а) Метод Холма (поправка Холма — Бонферрони)
б) Метод Шидака-Холма
в) Метод Бенджамини — Хохберга
7. По а) и б) проверку не прошли всего четыре провинции (на рисунке выделено зеленой обводкой). По в) - больше.
Вывод 1: да, статистика не всех провинций "укладывается" в распределение Пуассона, с $\lambda = p N$, где $\lambda$ - параметр распределения Пуассона, $p$ - вероятность умереть, оцененная по суммарной статистике (около $0.85 \%$), $N$ - количество случаев в провинции.

8. Далее начал удалять "выбросы" вверх, пересчитывая всё. После удаления пятой точки - всё сошлось. Все оставшиеся точки прошли проверку нулевой гипотезы по всем трем методам корректировки для множественных гипотез.
Удаленные точки выделены на рисунке красной обводкой. При этом оценка смертности оказалась $0.56 \%$

Вывод 2: выбросы вверх имеются в небольшом количестве провинций (5 из 30). Что в них произошло - бомба попала в дом престарелых, или пропустили бессимптомные случаи точно сказать сложно.

Изображение

 Профиль  
                  
 
 Re: Коронавирус
Сообщение11.03.2020, 23:04 
Заслуженный участник


20/08/14
11179
Россия, Москва
EUgeneUS
Наверное я что-то не понимаю.
Какие у Вас получились p-value для отвергания нулевой гипотезы? Т.е. что совпадение с выбранным Вами распределением не случайно? Я не оспариваю, мне просто интересно.

Ещё не понял можно ли вообще делать выборочную селекцию данных (выкидывание провинций) без учёта её эффекта, мне казалось это грубейшее нарушение и должно резко снижать достоверность оценки (без введения поправок на такую селекцию).

Давайте так, какова вероятность точно нулевой смертности в Jiangsu с $610$ заболевшими и выздоровевшими ($21$ текущих с неизвестным вердиктом пока оставим за скобками)? При пусть всего двух разных коэффициентах смертности, $1\%$ (или сколько там хотите) и $5\%$? Будет ли по ней пройден порог p-value хотя бы $<0.05$? Мне даже это совсем не очевидно. Если Вы посчитали, поделитесь пожалуйста. Мне кажется будет очевидно что действует неизвестный фактор снижения смертности (примерно в 5-10 раз, вместо примерно шести-тридцати смертей их ноль).

Я плохо (да что там стесняться, вообще не) понимаю статистику, потому мне эти распределения и методы тёмный лес, но исходя из того что знаю, надо выдвинуть предположение что смертность составляет $D/C=111/12054=0.92\%$ и посчитать p-value для этой гипотезы по данным всех 30-ти провинций (причём как именно объединять данные по провинциям я сомневаюсь). И вот уже этой величиной p-value и оперировать. А не получать смертность по аппроксимации данных. Что Вы посчитали я не понимаю.

У меня полное ощущение что смертность по этим 30-ти провинциям сильно занижена по неизвестным причинам (объективным, без конспирологии).

Для меня пока очевидно что смертность по 30-ти провинциям составляет от $D/C=111/12054=0.92\%$ до $(A+D)/C=(823+111)/12054=7.75\%$ (если вдруг умрут все кто ещё не выздоровел), вот в этих рамках. Разумеется диапазон неадекватно широк, в $7\%$ естественно не верю, но и $1\%$ для меня сомнительны (не как объективная реальность, её не отрицаю, а как отсутствие неизвестных факторов, не обязательно действующих за пределами Китая, Вы же для этого проценты считаете, прикинуть мировые показатели).

 Профиль  
                  
 
 Re: Коронавирус
Сообщение11.03.2020, 23:35 
Заслуженный участник
Аватара пользователя


11/12/05
9957
Некая подборка

https://www.worldometers.info/coronavir ... rus-cases/

 Профиль  
                  
 
 Re: Коронавирус
Сообщение12.03.2020, 00:08 
Заслуженный участник


20/08/14
11179
Россия, Москва
Посмотрел страны по которым на worldometers.info есть отдельные графики, Италия, Франция, Испания практически с 24-26 февраля натуральная экспонента, т.е. карантин по видимому до сих пор неэффективен. В США, Англии и Германии экспонента просматривается примерно от 1-4-5 марта, т.е. тоже карантин как минимум малоэффективен.
В Южной Корее развитие эпидемии видимо удалось остановить, там рост практически прекратился.
Во многих странах дневной прирост за сегодня превышает десяток процентов, это кошмар.
Такими темпами миллионы заразившихся в мире уже не кажутся фантастикой. :-(

 Профиль  
                  
 
 Re: Коронавирус
Сообщение12.03.2020, 07:54 
Аватара пользователя


11/12/16
13311
уездный город Н
Dmitriy40
1. Порог для p-value выбрал стандартный - $0.05$.
2. Значения для Jangsu
А) Пуассон, коэффициент смертности $0.85$, $p-value = 0.0045$
Б) Бином, коэффициент смертности $0.85$, $p-value=0.0044$
В) Пуассон, коэффициент смертности $0.56$, $p-value = 0.0295$
Г) Бином, коэффициент смертности $0.56$, $p-value=0.0292$.

3. Еще меньше для Zeijang:
А) Пуассон, коэффициент смертности $0.85$, $p-value = 0.0004$
Б) Бином, коэффициент смертности $0.85$, $p-value=0.0003$
В) Пуассон, коэффициент смертности $0.56$, $p-value = 0.0088$
Г) Бином, коэффициент смертности $0.56$, $p-value=0.0088$

4. Однако, с поправками для множественного тестирования гипотез и та, и другая провинция тест проходит.

Вечером повторю расчет по более свежим данным и выложу результат с подробностями

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней.  [ Сообщений: 3602 ]  На страницу Пред.  1 ... 28, 29, 30, 31, 32, 33, 34 ... 241  След.

Модератор: Модераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: mihaild


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group