Наши популярные онлайн курсы
Смотрю я на белорусскую ковидную статистику и не знаю, смеяться или плакать: каждый день стабильно одно и то же количество и новых случаев, и новых смертей. Мало кто сомневается, что все эти цифры спускаются сверху, но я задумался: а можно ли это доказать? Мало ли, вдруг я чего-то не понимаю, а там реально такие цифры?
И в помощь нам приходит чудесная наука теория вероятностей. Она говорит о том, что если события случайны, независимы и равновероятны, то они подчиняются распределению Пуассона. Если мы рассмотрим, например, количество смертей от коронавируса в сутки, то заметим, что если не идеально, то по крайней мере очень близко этот показатель подходит по таким критериям. Не идеально — это значит, что, например, если мы возьмём временной интервал, на котором смертность растёт или падает, то события будут не равновероятны, и это уже не Пуассон.
И тем не менее мы здесь кое-что можем узнать. У случайной величины можно посчитать некоторые параметры. Например, математическое ожидание — это, по-простому, средняя величина. А ещё дисперсию, то есть среднее отклонение от средней величины. (Тонкости вроде квадратичности я опускаю, будем ловить суть.) И вот что замечательно: если процесс пуассоновский, то есть по-настоящему случайный, то дисперсия в точности равна матожиданию! Красивая наука, согласитесь?
Процесс, в принципе, может быть случайным, но не пуассоновским — например, если вероятность меняется. И тогда дисперсия окажется больше, чем матожидание. Но что интересно, она может быть только больше и никак не меньше! Если она оказывается меньше, то это значит, что процесс уже не случайный, а подвержен некоторому управлению извне. Например, если мне каждый день падает ровно один кирпич на голову, то дисперсия будет нулевая, и кирпичами однозначно кто-то управляет.
А теперь давайте применим это наше ценное знание к статистике по ковиду, благо она есть в свободном доступе и при этом совершенно официальная почти от всех стран. Например, здесь: https://index.minfin.com.ua/reference/coronavirus/geography/ . Воспользуемся всемогущим Экселем, посчитаем по разным странам матожидание с дисперсией, да и сравним. Я взял период в 22 дня с 4 по 25 июня, посчитал матожидание М и дисперсию D, а также отношение D/M, чтобы оценить, что из них больше и насколько. Поскольку меня интересовало сравнение с Беларусью, я брал те страны, где в это время смертность была примерно такая же (у нас, если кто не знает, в это время было около пяти смертей в сутки). То есть я не брал страны с большой смертностью больше тридцати в день и с совсем маленькой меньше двух.
Для начала я взял страны, данным от которых, как мне кажется, можно доверять. (Нидерланды, кстати, по смертности к нам ближе всех.) Вот что я получил:
Нидерланды: M=5,59 D=19,59 D/M=6,53
Португалия: M=4,64 D=7,48 D/M=1,25
Ирландия: M=3,09 D=7,51 D/M=2,43
Польша: M=13,50 D=46,83 D/M=3,47
Германия: M=14,64 D=161,96 D/M=11,07
Франция: M=28,68 D=363,75 D/M=12,68
Швеция: M=31,27 D=832,30 D/M=26,61
Как видим, ни у одной страны D/M не опускается ниже единицы, и это значит, что мы не можем упрекнуть их в том, что они каким-то образом влияют на статистику. Это не значит, что они не влияют — может, и влияют, но уличить их в этом мы не можем. Кстати, высокий показатель D/M говорит о том, что манипуляций скорее всего нет, ибо нет никакого смысла в том, чтобы устраивать принудительный разброс значений в разные стороны. Такой высокий показатель может означать, что это были последствия вспышек заболевания (Германия, Швеция), либо заболеваемость шла на спад (Нидерланды).
Затем я взял страны, к которым у меня меньше доверия. Может быть, и напрасно я некоторых подозреваю, но смотрим, однако:
Украина: M=15,09 D=36,37 D/M=2,41
Молдова: M=8,73 D=8,40 D/M=0,96
Армения: M=10,32 D=14,61 D/M=1,42
Турция M=19,86 D=11,55 D/M=0,58
Саудовская Аравия: M=38,59 D=17,87 D/M=0,46
Арабские Эмираты: M=1,73 D=0,97 D/M=0,56
Кувейт M=4,95 D=5,66 D/M=1,14
Тут надо сказать, что у Кувейта в первые четыре дня смертность была сильно повышена, за счёт этого и показатель вырос. Если взять не три недели, а только последние две (считать можно и так, это диапазон, а не целевая выборка), то получим:
Кувейт M=4,27 D=2,92 D/M=0,69
Во-первых, видим, что у Молдовы рыльце в пушку. Не сильно, то есть это не разнарядка по всей стране — я думаю, это из-за Приднестровья, по которому не смогли собрать статистику и нарисовали недостающее наугад.
Дальше Турция с её 0,58, это совсем не удивляет. Ну, и богатенькие буратины тоже были вполне ожидаемы — смертность у них явно под жёстким контролем, больные там умирают только по распоряжению короля или эмира. Про Украину с Арменией ничего сказать не могу, не пойманы. Очень может быть, что и честно собирают статистику.
Ну и, наконец, наша родная Беларусь: M=5,51 D=0,92 D/M=0,17
Мы, конечно, с нашими 0,17 вне конкуренции. Я поздравляю Министерство здравоохранения! Здесь мы видим, что без его высочайшего позволения больные не могут ни вздохнуть, ни… умереть даже спокойно. Никакой случайностью здесь и не пахнет. На самом деле, конечно, всё грустно, а статистика эта форменная липа. Такие данные можно смело игнорировать — это то же самое, что их нет вообще. Собственно, что и требовалось доказать.
Можно ещё добавить, что если бы смертность снижали не спусканием цифр сверху, а какими-то другими способами — ну, хотя бы даже проверенным методом исключения из умерших от ковида больных с сопутствующими заболеваниями, — то распределение всё равно осталось бы пуассоновским, то есть по-настоящему случайным. Но, глядя на эти 0,17, я прям представляю себе министра, который звонит своим замам и говорит: «Так, вчера было четыре, сегодня уже можно шесть!»