Коронавирус: как мы себя обманываем
Я прекрасно понимаю, что степень истерии на фоне коронавируса привела общество к конфликту между последователями и отрицателями всеобщей паники. Достаточно острая групповая поляризации не вызывала особого желания излагать свою точку зрения на широкую публику. Но когда меня всюду начали преследовать конспирологические теории и бездумные толкования данных, то я понял, что утешающих аргументов очень мало и решил восполнить их дефицит.
Искажение смертности
Уверен для многих станет откровением факт того, что количество смертей при наличии коронавируса, зафиксированных в ВОЗ, не является числом смертей от коронавируса.
А как вы думали? Новая для человечества инфекция ещё до конца не изучена, но в больнице из пригорода какого-нибудь Ливорно уже умеют определять смерть от неё? Назвать причину смерти - это же не баг при компиляции отловить. Всё гораздо сложнее.
Есть заключительный клинический диагноз. Основное заболевание может включать несколько нозологических форм. Существует понятие конкурирующих заболеваний, которыми одновременно страдал умерший и каждое из которых в отдельности могло привести к смерти.
Есть ещё заключение о причине смерти по результатам патологоанатомического вскрытия, а также случаи его расхождения с заключительным клиническим диагнозом, которые разрешаются экспертной комиссией.
Именно поэтому ВОЗ чёрным по белому пишет:
Определение истинной смертности от COVID-19 требует дополнительного времени. Сегодняшние данные свидетельствуют о том, что общий коэффициент смертности составляет 3–4%, при этом уровень смертности от инфекции будет ниже.
Однако большинство людей никогда не углубляется в методологию какого-либо исследования. Им достаточно увидеть в одной табличке слова «cases» и «deaths», чтобы самовольно выдвинуть свою интерпретацию этих данных — «смертность от коронавируса».
Столь поверхностное изучение беспокоящего вопроса приводит к искажённому восприятию действительности. Заражённого коронавирусом человека, который выпрыгнул из окна или умер от IV стадии рака, миллионы жителей нашей планеты неосознанно будут считать за жертву страшной эпидемии. Ситуация настолько абсурдна, что я не удивлюсь, если у кого-то моя прямая цитата ВОЗ с указанием ссылки на источник вызовет сомнения.
Зачем тогда вообще публиковать такую смертность? — спросят некоторые. Как аналитик отвечу, что в статистике есть прокси-величины. И в нашем случае, например, предоставляется возможность сравнить их с общей или естественной смертностью. Да, будет велика доля погрешности, но изучать новую инфекцию можно долго, а действовать всемирной организации здравоохранения нужно быстро.
Итальянский прецедент
Находясь в пределах китайских границ коронавирус беспокоил значительно меньшее количество людей. Новый всплеск истерики возник на фоне пугающего информационного поля в Италии и резких действий местного правительства.
Более 12 000 заражённых, около 1000 смертей и жесткий карантин. Италия заставляет нас особенно переживать за здоровье наших родителей и стариков, поскольку в Италии наибольшее количество смертей среди заражённых приходится на людей околопенсионного возраста и старше.
Я бывал в Италии и, в сравнении с Россией, численное превосходство пожилых граждан на улицах городов заметно даже невооружённым глазом. Воспоминания об этом натолкнули меня на мысль о необходимости изучения демографических данных.
Выяснилось, что в Италии самое старое население в Европе. Почти 22% граждан старше 65, медианный возраст составляет 45 лет. К слову, в России лишь 15% граждан старше 65 лет, а медиана равна 40 годам, в США — 16% и 38 лет соответственно. А теперь давайте взглянем на дистрибуцию коронавируса по возрасту:
Очевидно, что высокий уровень смертности среди заражённых итальянцев в первую очередь обусловлен возрастным фактором. Убеждённость в обратном свидетельствует о непонимании ошибки базового процента. Для сомневающихся в моих словах рекомендую прочитать статью в Scientific American.
При этом, глядя на график, мы видим, что пожилые люди значительно чаще подвержены заражению даже в пропорциональном соотношении. Отсюда рождается гипотеза о том, что иммунитет стариков менее приспособлен к коронавирусу.
Но такое явление не характерно для коронавируса в целом. В Корее, например, основная группа заражённых приходится на возраст от 20 до 29 лет — 29% случаев от общего числа. В Китае около 15% заражённых составляет группа 70+, что почти в два раза меньше, чем в Италии или Франции.
Напоминаю, что коронавирус не является подлинной причиной смерти. Следовательно мы не можем утверждать, что риск смертельной опасности коронавируса для стариков кратно выше. Но факт остаётся фактом — люди преклонного возраста с подтверждённым коронавирусом погибают значительно чаще.
Невозможно не согласиться с тем, что гистограмма естественной смертности с разбивкой по возрасту внешне будет очень похожа на ту, что вы видите выше, ибо чем человек старше, тем вероятнее риск его смерти. Поэтому давайте мы попробуем сравнить смертельность при наличии инфекции с естественной смертностью.
Для этого нам нужно сопоставить данные по смертности в пересчёте на тысячу человек от национального бюро статистики Италии вместе с данными по количеству умерших среди заражённых от dall'Istituto Superiore di Sanità.
Коэффициент смертности из первой таблицы равен 1.05%, из второй — 5.8%. Значит ли это, что летальность самой инфекции находится где-то на уровне 4%? — Отнюдь нет. Вы же не забыли, что 76% заражённых старше 51 года? Такая выборка разительно отличается от демографии итальянского населения и сейчас я вам это проиллюстрирую.
При равномерном распределении естественная смертность в категории 90+ будет равна 24% ((180.7+299.6)/2). А значение для той же группы в таблице COVID-19 равно 19%. То есть смертность среди заражённых получается меньше естественной.
Вряд ли кто-то подумает, что коронавирус ещё и излечивает людей, но, в то что он убивает каждого четвёртого старика верят многие. Хотя это одинаковые по степени абсурдности выводы.
Плохо, что мы не можем определить даже приблизительный уровень летальности инфекции, сравнив общие значения. Мы обязательно допустим ошибку при распределении, поскольку в таблицах приведены разные возрастные когорты.
Более того, данные по естественной смертности базируются на сотнях тысяч записей, в то время как выборка по умершим итальянцам с подтверждённым коронавирусом пока не превышает и тысячи человек. Мы не знаем насколько репрезентативна данная выборка.
Для детей, например, разница в смертности тоже будет отрицательной, ибо детские смерти случаются, а детских смертей с подтверждённой инфекцией ещё не зафиксировано.
Посмотрите также на половой признак. Бабульки значительно лучше переносят вирус или быть может, вирус здесь вообще не причём и мы наблюдаем сезон повышенной смертности среди мужчин, который увеличивает общую смертность? — Неизвестно.
Конкретных цифр по летальности вируса не существует. Их смогут определить только сотрудники ВОЗ. Существующие частные предположения — безответственная глупость. Моей же целью было донесение мысли о том, что риск смертельной опасности коронавируса в сознании большинства кратно завышен и не имеет ничего общего с действительностью.
Глобальный коллапс
Мы выяснили, что смертность при коронавирусе не есть смертность от коронавируса, а числовые показатели естественной смертности могут выглядеть значительно страшнее таковых от новой эпидемии. Однако на Хабре есть статья с почти пятью миллионами просмотров и в ней говорится следующее:
Известна летальность. В этом сценарии используется 1% (подробности обсудим позже). Это означает, что где-то 12 февраля в регионе уже было около сотни случаев, и только один из них закончился смертью 17 дней спустя.
Теперь используйте среднее время удвоения случаев для коронавируса — это 6,2 дней. Таким образом, за 17 дней, прошедших перед смертью этого человека, число случаев должно было умножиться на ≈8 (=2^(17/6)). Выходит, что если не диагностировать все случаи без исключения, то всего одна подтверждённая смерть в день означает 800 истинных случаев заражения в этот же день.
В штате Вашингтон сегодня 22 погибших. Используя наши приблизительные расчёты, получаем ≈16000 истинных случаев коронавируса только сегодня. Это столько же, сколько официальных случаев в Италии и Иране вместе взятых.
Откуда взялся 1% летальности? — Оказывается, автор статьи, некий Томас Пуэйо, для выявления этого коэффициента ориентировался на данные по ситуации в круизном лайнере Diamond Princess: с 706 заболевшими, 6 смертями и 100 выздоровлениями.
Глядя на эти значения Томас делает вывод: «итоговая летальность будет в диапазоне от 1% до 6,5%». После этого он берёт самый щадящий процент, ловким движением мозговых извилин показывает, как вирус поглотит мир и оставляет читателя с мыслью о том, что это был продемонстрирован ещё лучший сценарий при летальности всего в 1%.
В моей голове просто не укладывается, как эта чушь могла так взрасти на Хабре. Не знать нюанса про летальность вируса и смертность при нём — нормально. Но как программисты, математики, аналитики и прочие хабравчане допустили проекцию 6 смертей при 706 заболевших на население всей планеты?
По вашему это репрезентативная выборка? А глядя на кульбит Томаса с утверждением 16 000 случаев заражения на основе 22 погибших, неужели никто не понимает, что вероятности так не работают? Вас не смутило, что самому молодому пассажиру Diamond Princess среди погибших было 70 лет?
И это при том, что причины смерти пассажиров неизвестны. Для тех, кто по-прежнему не видит ничего странного в арифметике Томаса, процитирую профессора эпидемиологии в Стэнфордском университете Джона Иоаннидиса:
Projecting the Diamond Princess mortality rate onto the age structure of the U.S. population, the death rate among people infected with Covid-19 would be 0.125%. But since this estimate is based on extremely thin data - there were just seven deaths among the 700 infected passengers and crew - the real death rate could stretch from five times lower (0.025%) to five times higher (0.625%).
Я верю, что господин Пуэйо публиковал свою цидульку с самыми благими намерениями. Но весь его труд пропитан ошибками при индукции и импликации данных. Мне недосуг писать детальное опровержение столь дилетантской работы. Такие статьи должны быть заблокированы по причине дезинформации населения.
Бесконечные экспоненты
Полагаю, что большинство из вас уже встречали подобные графики в сети. Но гораздо меньше человек читает официальные отчёты ВОЗ. В одном из них, опубликованном 6 марта, написано:
Одним из главных различий между китайским вирусом и обычным гриппом является скорость передачи. Грипп имеет более короткий инкубационный период и серийный интервал (время между последовательными случаями) — три дня. Для COVID-19 этот период составляет пять-шесть дней. Это означает, что грипп распространяется быстрее коронавируса.
Так к чему тогда все эти экспоненты, склоняющие читателя к ассоциациям с бубонной чумой? Некоторые могут указать мне на то, что смертность с подтверждённым коронавирусом варьируется от 3% до 4%, в то время как непосредственная летальность от сезонного гриппа меньше 0.1%.
Опять же, нельзя путать общую смертность с летальностью инфекции. Таковая от коронавируса человечеству неизвестна. Поэтому вы не найдёте утверждений ВОЗ о том, что высокая смертность с перевесом компенсирует скорость распространения и это делает Covid-19 кратно опаснее гриппа.
Мир давно научился определять летальность гриппа. Поэтому я долго не мог найти данные по общей смертности для него. Но всё же мне удалось повстречать публикацию ВОЗ 2012 года по influenza-associated mortality в Китае в период с 2003 по 2008 год.
Посмотрите внимательно на график. На севере Китая общая смертность при гриппе варьировалась от 1.5% до 3%. Хочу обратить ваше внимание, что перед вами данные на промежутке в 5 лет по десяткам миллионов записей. Более того, мы отчётливо видим сезонность. Теперь задумайтесь о репрезентативности данных по Covid-19.
Имея опыт в публичных коммуникациях, я знаю, что здравого смысла для аргументации бывает мало и порой необходимо поблатовать авторитетами. Поэтому привожу вам фрагмент беседы Washington Post с Мелиссой Нолан, вирусологом Университета Южной Каролины:
Which virus is more deadly? That's a difficult question to answer for many reasons. First, health officials are not comparing analogous data sets between the viruses. They have years of influenza data but just months of covid-19 numbers - which are evolving by the day.
И, конечно же, я не могу не упрекнуть попытку спроецировать вспышку гриппа в 1918 году на сегодняшнюю пандемию из статьи «Коронавирус: почему надо действовать прямо сейчас». Наверное, сравнительный анализ был бы полезен для понимания ситуации, но не сравнительный анализ Томаса Пуэйо, проведённый столь топорным методом.
Мировое население за последний век выросло почти в 3 раза, количество людей старше 65 лет увеличилось в 10 раз и в 30 раз увеличилось количество тех, кому за 85. Учитывает ли эти факторы господин Пуэйо? — Нет. Ему достаточно было одного графика по Филадельфии с Сент-Луисом, чтобы произвести аппроксимацию.
Однако для решения такой задачи нужно определить индексный вес всего многообразия параметров, посчитать погрешности и вычислить корреляции, не допустив асимметрии. С этим смогут справиться только матёрые аналитики и никак не господин Томас, чей призыв к панике тиражируется миллионами просмотров.
Пандемия страха
При сложившихся обстоятельствах наиболее распространены два типа поведения людей: безразличие и паника. Однако правильное отношение к коронавирусу находится где-то посередине : в соответствии с рекомендациями ВОЗ.
Дискредитируя пандемию страха, я ни разу не умалял реальную опасность коронавируса. Во всемирной организации здравоохранения заседают неглупые люди, и я советую всем прислушаться к их рекомендациям: мыть руки, избегать массовых мероприятий, отказаться от наличных денег и прочее.
Парадокс заключается в том, что когда эти же люди из ВОЗ или Роспотребнадзора предупреждают нас о вспышке сезонного гриппа или клещевого энцефалита, мы не особо реагируем на данные сообщения. По крайней мере в сравнении с текущей ситуацией.
Объяснение этого парадокса давно известно: люди иррациональны по своей природе. К тому же, далеко не все знают историю коронавирусов, которые были открыты аж в 1965 году. Заметьте, их много. Можно предположить, что кто-то из вас уже перенес легкую форму ОРВИ вызванную одним из представителей семейства коронавирусов.
То, что безответственная пресса заложила в массовое сознание как коронавирус — есть SARS-CoV-2, который способствует возникновению заболевания Covid-19. Последние два громких коронавируса были причинами распространения атипичной пневмонии (SARS) и ближневосточного респираторного синдрома (MERS).
Почему обеспокоенность в информационном поле от Covid-19 заметно больше таковой от других коронавирусов? Сложный вопрос, правильный ответ на который, наверное, смогут дать только эпидемиологи. Со своей же стороны я хочу упомянуть две потенциальных причины этого явления.
Во-первых: это многократный рост внешнего туризма в Поднебесной. Во-вторых: рост интернет аудитории и появление социальных сетей, где всяк позволяет себе думать, что, не имея компетенций и не углубляясь в методологию исследований, он знает правду про пандемию и в праве раздавать советы о том, как должно действовать власти.
Какие-нибудь призывы следовать итальянскому сценарию вообще должны презираться. Это дело правительства каждой страны в частности. США, Англия и ряд других государств, например, действуют иначе. А вот, что по этому поводу пишет эпидемиолог Джон Иоаннидис:
A population-wide case fatality rate of 0.05% is lower than seasonal influenza. If that is the true rate, locking down the world with potentially tremendous social and financial consequences may be totally irrational. It's like an elephant being attacked by a house cat. Frustrated and trying to avoid the cat, the elephant accidentally jumps off a cliff and dies.
Многие даже не представляют, как может отразиться одна неделя частичной заморозки экономики на показателе ВВП. Ущерб будет измеряться не только в денежном эквиваленте, но и в человеческих жизнях. Поэтому прошу всех Фэйсбуковых и прочих экспертов засунуть своё мнение в небытие.
Апофеоз
Эмоциональный контент наиболее популярен, при этом гнев — самая распространённая эмоция в социальных сетях. Вероятность пропагации ложной информации на 70% выше, а более половины читателей делятся новостью, не читая её дальше заголовка.
К сожалению, cтрах виральнее правды. Не просто так Facebook, Google, LinkedIn, Microsoft, Reddit, Twitter и YouTube объединились, чтобы бороться с фейками о Сovid-19. Однако доказательство ошибочности чаще всего менее популярно, чем изначальное утверждение. Хочется, чтобы этот текст был исключением.
Если вы прочитали сею писанину целиком и согласны с моими доводами, то не поленитесь поделиться данной статьёй со своими знакомыми. Большое спасибо всем за внимание.