2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. На страницу Пред.  1 ... 28, 29, 30, 31, 32, 33, 34 ... 241  След.
 
 Re: Коронавирус
Сообщение10.03.2020, 16:52 
Заслуженный участник


20/08/14
11765
Россия, Москва
NikolayPrimachenko в сообщении #1443994 писал(а):
Да, есть большие пессимисты:
Это не то, я говорил про смещение фаз смерти и фактического выздоровления, в статистику они попадают со значительным смещением по датам, что в случае развивающейся эпидемии сильно влияет на оценку уровня смертности.
А что величина $D$ задерживается от величины $C$ в оценках сильнее двух недель и неизвестно на сколько точно я говорил давно, потому и не считаю оценку $D/C$ адекватной при нестабильной величине $C-D-R$ (количестве текущих случаев заражения), т.е. при развивающейся эпидемии.
И более того, при малом значении хоть $D$, хоть $R$, хоть $C$ я не считаю оценку смертности адекватной, статистика единичными случаями не занимается. Именно поэтому статистика по Китаю вне Хубея с её смертностью в $1\%$ недостоверна, там везде буквально единичные случаи смерти.
А вот давайте прикинем смертность в других странах, даже без всяких поправок на даты:
для Южной Кореи $D/C=54/7513=0.7\%$, $D/(D+R)=54/(54+247)=18\%$;
для Италии $D/C=463/9172=5\%$, $D/(D+R)=463/(463+724)=39\%$;
для Испании $D/C=35/1512=2.3\%$, $D/(D+R)=35/(35+32)=52\%$;
для Франции $D/C=30/1412=2.1\%$, $D/(D+R)=30/(30+12)=71\%$;
для Германии $D/C=2/1281=0.2\%$, $D/(D+R)=2/(2+18)=10\%$;
для США $D/C=27/729=3.7\%$, $D/(D+R)=27/(27+15)=64\%$;
для Японии $D/C=10/543=1.8\%$, $D/(D+R)=10/(10+102)=9\%$;
для Ирана величина $R/C=2731/8042=34\%$ (т.е. уже выздоровело треть всех заболевших) совершенно нереальна для развивающейся эпидемии и потому цифры считаю некорректными (например выписывают без повторного теста или вообще по исчезновении симптомов).
Что из этого видим? А видим что даже если вот прям с сегодняшнего дня больше не будет ни одного нового заболевшего, то в Италии смертность не ниже $5\%$, в США не менее $4\%$, во Франции, Испании, Японии не менее $2\%$, и только Южная Корея ниже $1\%$ (Германию исключаю из-за $D=2$, это слишком мало для статистических выводов). Но ей веры собственно и нет, там из-за быстрого распространения вируса просто ещё не успели умереть те, кто всё же умрёт. Ну и о каком $<1\%$ вне Хубея можно говорить?! Огромные цифры $D/(D+R)$ показывают что эпидемия только-только развивается, первые умершие уже есть, а первые выздоровевшие только-только начинают появляться, но если взять $D_{-14}$ (умершие две недели назад, причём похоже для Южной Кореи и Италии, единственных более-менее адекватных по данному показателю, надо брать разные временные смещения), то эта величина будет околонулевой и статистика снова станет неадекватной.

 Профиль  
                  
 
 Re: Коронавирус
Сообщение10.03.2020, 17:30 
Аватара пользователя


11/12/16
13850
уездный город Н
Dmitriy40 в сообщении #1444054 писал(а):
Именно поэтому статистика по Китаю вне Хубея с её смертностью в $1\%$ недостоверна, там везде буквально единичные случаи смерти.


В Китае вне Хубея:
а) $111$ случаев смерти
б) $13171$ подтвержденных случаев
это единичные случаи? :shock:

Dmitriy40 в сообщении #1444054 писал(а):
А вот давайте прикинем смертность в других странах, даже без всяких поправок на даты:

На искажения может влиять куча факторов, некоторые из них перечислялись в теме. Есть ещё, например, такой: в США "бомба" попала в дом престарелых, и подавляющее большинство умерших оттуда. Это
а) и общий коэффициент смертности "утягивает" вверх.
б) и оценки количества заболевших через количество умерших получаются сильно завышенными.

При развивающемся процессе $D/C$ и $D/(D+R)$ дают очень разные оценки. Что мы собственно и наблюдаем во всех странах, кроме Китая (и наблюдали ранее в Китае).

 Профиль  
                  
 
 Re: Коронавирус
Сообщение10.03.2020, 20:03 


16/08/19
121
Си Цзиньпин приехал сегодня в Ухань и пообщался с местными жителями:
https://www.youtube.com/watch?v=8cqOutF8XIs

 Профиль  
                  
 
 Re: Коронавирус
Сообщение10.03.2020, 21:11 
Заслуженный участник


20/08/14
11765
Россия, Москва
EUgeneUS в сообщении #1444058 писал(а):
Dmitriy40 в сообщении #1444054 писал(а):
Именно поэтому статистика по Китаю вне Хубея с её смертностью в $1\%$ недостоверна, там везде буквально единичные случаи смерти.

В Китае вне Хубея:
а) $111$ случаев смерти
б) $13171$ подтвержденных случаев
это единичные случаи? :shock:

Да, это именно что единичные случаи — в каждой провинции буквально по несколько смертей. Нигде нет полусотни и более. Всего в двух более десяти (13 и 22). При среднем по провинциям всего в 3.7. Для статистики это и есть единичные случаи, я считаю.

 Профиль  
                  
 
 Re: Коронавирус
Сообщение11.03.2020, 06:43 
Аватара пользователя


11/12/16
13850
уездный город Н
Dmitriy40
Но мы же не рассматриваем каждую провинцую отдельно.
А в совокупности данных достаточно.

 Профиль  
                  
 
 Re: Коронавирус
Сообщение11.03.2020, 07:25 
Заслуженный участник


20/08/14
11765
Россия, Москва
EUgeneUS
Кажется я уже говорил Вам, что усреднение улучшает статистику (повышает достоверность) только при выполнении ряда необходимых условий (типа независимости данных). Если данные окажутся скоррелированными, а это вполне возможно (например умерли лишь самые-самые тяжёлые/запущенные случаи), то никаким усреднением реальную картину не получите (сколь бы много данных ни было). А когда данных мало, то слишком велик вклад случайных факторов. Потому и надо много случаев в каждой выборке (провинции), чтобы случайные факторы усреднились практически в ноль, а когда там по 2.7 случая в среднем по 28 провинциям (кроме двух топ), ну что на них может усредниться-то ... :facepalm:

 Профиль  
                  
 
 Re: Коронавирус
Сообщение11.03.2020, 10:45 
Заслуженный участник


07/07/09
5408
mathpath в сообщении #1444105 писал(а):
Си Цзиньпин приехал сегодня в Ухань


Ситуации стабилизировалась благодаря соблюдению карантина и выявлению инфицированных (через отслеживание контактов в последние несколько дней с оказавшимися инфицированными на сегодняшний день).
Что будет в Ухане, если ослабить карантин и перестать отслеживать контакты ?

Почему Европа не ввела такие меры?

 Профиль  
                  
 
 Re: Коронавирус
Сообщение11.03.2020, 16:52 


16/08/19
121
Говорят, что в Ухани уже заработали заводы-филиалы от хонды и ниссана

 Профиль  
                  
 
 Re: Коронавирус
Сообщение11.03.2020, 17:49 
Заслуженный участник


20/08/14
11765
Россия, Москва
Выскажу своё субъективное мнение.
Xey в сообщении #1444276 писал(а):
Что будет в Ухане, если ослабить карантин и перестать отслеживать контакты ?
Учитывая что инкубационный период порядка двух недель (выбросы в плюс единичны и погоды не делают) и уменьшение количество заражённых (active case) с 18 февраля, то ничего страшного не будет. Может кого-то и пропустят, но быстро обнаружат и новый очаг оперативно закарантинят.
Xey в сообщении #1444276 писал(а):
Почему Европа не ввела такие меры?
Это уже вопрос скорее конспирологический. Какой-то деятель ВОЗ (ссылка была выше в теме) прямо сказал про Италию "это была ошибка, что не отнеслись серьёзно и не ввели карантин для прибывающих из Китая". Ошиблись с оценкой рисков. Пожалели свою экономику. Засмущались идти против прав и свобод граждан (а карантин это ограничение). Возможных причин много и правду мы не узнаем, разве что кто-то напишет мемуары лет через 30. Да и правда может быть не одна (а стечением многих обстоятельств у многих людей). Вообще выяснять мотивы не слишком продуктивно, лучше оценивать объективные поступки.

 Профиль  
                  
 
 Re: Коронавирус
Сообщение11.03.2020, 20:52 
Заслуженный участник


20/08/14
11765
Россия, Москва
ВОЗ таки объявило пандемию.

В РФ уже 28 заразившихся (из них 15 в Москве). По РФ данных не заметил, по Москве говорят взрослые не ходили на работу, а ребенок (который без симптомов) в школу, так что вероятность вспышки очага мала. Впрочем это увидим в ближайшие дни.
Под наблюдением находятся "около тысячи" человек в Москве, кто контактировал с заразившимися. Ещё о 700 переданы данные туда куда они уехали. Это к тому что цепочки таки отслеживаются, во всяком случае в Москве.

В Ухане прекратили работу все временные госпитали в связи с выпиской последних заразившихся. Остальные я так понимаю остаются в обычных госпиталях. Общественный транспорт и некоторые предприятия возвращаются к нормальной работе. Но карантин с провинции пока не снят.

 Профиль  
                  
 
 Re: Коронавирус
Сообщение11.03.2020, 21:21 
Аватара пользователя


11/12/16
13850
уездный город Н
Dmitriy40 в сообщении #1444262 писал(а):
Кажется я уже говорил Вам, что усреднение улучшает статистику (повышает достоверность) только при выполнении ряда необходимых условий (типа независимости данных). Если данные окажутся скоррелированными, а это вполне возможно (например умерли лишь самые-самые тяжёлые/запущенные случаи), то никаким усреднением реальную картину не получите (сколь бы много данных ни было).


Да, Вы это говорили.
И даже можно пофантазировать, какие могут факторы, приводящие к не независимости данных. Например, это может быть возрастная категория пациентов в кластерном случае. Попадет вирус в казарму или в общежитие университета, либо в дом престарелых - смертность будет сильно разная.
Но это всё слова, пока не посчитаны числа.
А я их посчитал. Вот каким образом:
1. Взял данные по провинциям за 7 марта (просто подвернулась удобная для экспорта табличка в таймлайне на английской вики).
2. Посчитал коэффициент смертности по всем провинциям (кроме Хубея) и средний.
3. В качестве модели (нулевой гипотезы) взял распределение Пуассона.
4. Для каждой провинции посчитал p-value.
5. Так как у нас не одна гипотеза, а много - по количеству провинций, то нужно делать поправки на множественную проверку гипотез
6. Поправки смотрел сразу три
а) Метод Холма (поправка Холма — Бонферрони)
б) Метод Шидака-Холма
в) Метод Бенджамини — Хохберга
7. По а) и б) проверку не прошли всего четыре провинции (на рисунке выделено зеленой обводкой). По в) - больше.
Вывод 1: да, статистика не всех провинций "укладывается" в распределение Пуассона, с $\lambda = p N$, где $\lambda$ - параметр распределения Пуассона, $p$ - вероятность умереть, оцененная по суммарной статистике (около $0.85 \%$), $N$ - количество случаев в провинции.

8. Далее начал удалять "выбросы" вверх, пересчитывая всё. После удаления пятой точки - всё сошлось. Все оставшиеся точки прошли проверку нулевой гипотезы по всем трем методам корректировки для множественных гипотез.
Удаленные точки выделены на рисунке красной обводкой. При этом оценка смертности оказалась $0.56 \%$

Вывод 2: выбросы вверх имеются в небольшом количестве провинций (5 из 30). Что в них произошло - бомба попала в дом престарелых, или пропустили бессимптомные случаи точно сказать сложно.

Изображение

 Профиль  
                  
 
 Re: Коронавирус
Сообщение11.03.2020, 23:04 
Заслуженный участник


20/08/14
11765
Россия, Москва
EUgeneUS
Наверное я что-то не понимаю.
Какие у Вас получились p-value для отвергания нулевой гипотезы? Т.е. что совпадение с выбранным Вами распределением не случайно? Я не оспариваю, мне просто интересно.

Ещё не понял можно ли вообще делать выборочную селекцию данных (выкидывание провинций) без учёта её эффекта, мне казалось это грубейшее нарушение и должно резко снижать достоверность оценки (без введения поправок на такую селекцию).

Давайте так, какова вероятность точно нулевой смертности в Jiangsu с $610$ заболевшими и выздоровевшими ($21$ текущих с неизвестным вердиктом пока оставим за скобками)? При пусть всего двух разных коэффициентах смертности, $1\%$ (или сколько там хотите) и $5\%$? Будет ли по ней пройден порог p-value хотя бы $<0.05$? Мне даже это совсем не очевидно. Если Вы посчитали, поделитесь пожалуйста. Мне кажется будет очевидно что действует неизвестный фактор снижения смертности (примерно в 5-10 раз, вместо примерно шести-тридцати смертей их ноль).

Я плохо (да что там стесняться, вообще не) понимаю статистику, потому мне эти распределения и методы тёмный лес, но исходя из того что знаю, надо выдвинуть предположение что смертность составляет $D/C=111/12054=0.92\%$ и посчитать p-value для этой гипотезы по данным всех 30-ти провинций (причём как именно объединять данные по провинциям я сомневаюсь). И вот уже этой величиной p-value и оперировать. А не получать смертность по аппроксимации данных. Что Вы посчитали я не понимаю.

У меня полное ощущение что смертность по этим 30-ти провинциям сильно занижена по неизвестным причинам (объективным, без конспирологии).

Для меня пока очевидно что смертность по 30-ти провинциям составляет от $D/C=111/12054=0.92\%$ до $(A+D)/C=(823+111)/12054=7.75\%$ (если вдруг умрут все кто ещё не выздоровел), вот в этих рамках. Разумеется диапазон неадекватно широк, в $7\%$ естественно не верю, но и $1\%$ для меня сомнительны (не как объективная реальность, её не отрицаю, а как отсутствие неизвестных факторов, не обязательно действующих за пределами Китая, Вы же для этого проценты считаете, прикинуть мировые показатели).

 Профиль  
                  
 
 Re: Коронавирус
Сообщение11.03.2020, 23:35 
Заслуженный участник
Аватара пользователя


11/12/05
10056
Некая подборка

https://www.worldometers.info/coronavir ... rus-cases/

 Профиль  
                  
 
 Re: Коронавирус
Сообщение12.03.2020, 00:08 
Заслуженный участник


20/08/14
11765
Россия, Москва
Посмотрел страны по которым на worldometers.info есть отдельные графики, Италия, Франция, Испания практически с 24-26 февраля натуральная экспонента, т.е. карантин по видимому до сих пор неэффективен. В США, Англии и Германии экспонента просматривается примерно от 1-4-5 марта, т.е. тоже карантин как минимум малоэффективен.
В Южной Корее развитие эпидемии видимо удалось остановить, там рост практически прекратился.
Во многих странах дневной прирост за сегодня превышает десяток процентов, это кошмар.
Такими темпами миллионы заразившихся в мире уже не кажутся фантастикой. :-(

 Профиль  
                  
 
 Re: Коронавирус
Сообщение12.03.2020, 07:54 
Аватара пользователя


11/12/16
13850
уездный город Н
Dmitriy40
1. Порог для p-value выбрал стандартный - $0.05$.
2. Значения для Jangsu
А) Пуассон, коэффициент смертности $0.85$, $p-value = 0.0045$
Б) Бином, коэффициент смертности $0.85$, $p-value=0.0044$
В) Пуассон, коэффициент смертности $0.56$, $p-value = 0.0295$
Г) Бином, коэффициент смертности $0.56$, $p-value=0.0292$.

3. Еще меньше для Zeijang:
А) Пуассон, коэффициент смертности $0.85$, $p-value = 0.0004$
Б) Бином, коэффициент смертности $0.85$, $p-value=0.0003$
В) Пуассон, коэффициент смертности $0.56$, $p-value = 0.0088$
Г) Бином, коэффициент смертности $0.56$, $p-value=0.0088$

4. Однако, с поправками для множественного тестирования гипотез и та, и другая провинция тест проходит.

Вечером повторю расчет по более свежим данным и выложу результат с подробностями

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней.  [ Сообщений: 3602 ]  На страницу Пред.  1 ... 28, 29, 30, 31, 32, 33, 34 ... 241  След.

Модератор: Модераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group