27 мая 2021
Snob.ru: «65% алкоголиков — безработные»

Я всегда настороженно относился к статистике, хоть и сам ее часто использую. Недаром говорят: «Есть три вида лжи: ложь, наглая ложь и статистика». 

Статистические хитрости

Как часто в современном мире происходит манипулирование статистическими данными! И дело вовсе не в том, что правильно подобрать валидную выборку — сложная задача. Кстати, есть хорошая шутка по этому поводу: «По результатам опроса, проведенного в интернете, 100% населения подключены к интернету». И даже не в том, что мало кто знает, чем отличаются среднее арифметическое, медиана, квантиль и мода в статистике. И даже не в том, что иногда погрешность исследований просто зашкаливает — не буду вспоминать известные всем «146%» нашего ЦИК во время выборов. А дело в том, что современные СМИ (ровным счетом так же, как и реклама) часто прибегают к нескольким хитростям.

Из книги Н.Непряхина

Например, любопытно, как иногда показываются средние цифры по зарплатам. Простая иллюстрация: допустим, есть некая компания, в которой работают генеральный директор с окладом 5 млн рублей, три топ-менеджера с заработком 700 000 рублей и 100 работников с зарплатой 55 000 рублей. Средняя зарплата получается следующей:

(5000000 × 1 + 7000000 × ×3+55000×100)/(1+3+100)= 121 150 рублей

То есть в среднем каждый сотрудник получает больше 120 000 рублей. Серьезная сумма. Но, тем не менее, мы же понимаем, что самая распространенная зарплата в компании — 55 000. А это чуть ли не в три раза меньше.

Чуть ли…

Кстати, фраза «чуть ли не в три раза меньше» — тоже часть манипуляции. Потому что разница не в три, а в 2,2 раза. Такое легкое округление, небольшое преувеличение. Но ведь не обманули, сказали же «чуть ли…».

Это типичный подход для отражения, например, средних зарплат бюджетников по стране. Предположим, вам говорят, что зарплаты учителей увеличились на 23%. Фактически это может быть и правдой. Только сравнение делается некорректное: в первом случае учитываются стандартные ставки, а в повышенной версии — уже со всеми переработками, надбавками и льготами. Известен случай, когда для демонстрации экономического роста в одном из регионов использовались данные о зарплатах населения, включая серые зарплаты (интересно, как их можно точно посчитать?), доходы индивидуальных предпринимателей и граждан, выживающих за счет личных подсобных хозяйств.

Или интересен пример с официальными данными по безработице. Когда нам говорят о борьбе с безработицей, забывают упомянуть о неформальной занятости (хотя все данные есть в открытом виде на официальном сайте Росстата). Безработные — это только те, кто оформлен в центре занятости. А неформальная занятость — это фактическая безработица, то есть те, кто официально не работает, не платит налогов и не числится в пенсионном фонде.

Сложные причинно-следственные связи

Кроме того, в корыстных целях пропагандисты любят использовать сложные причинно-следственные связи. Например, мы можем взять определенную узкую выборку людей, умерших в возрасте 90 лет. При этом 25% из них курили, а 75% — нет. Означает ли это, что курение уменьшает смертность? Конечно, нет. Потому что еще есть миллион факторов, которые нужно учитывать и смотреть на ситуацию комплексно.

Другой пример. Вам приводят данные о том, что 65% алкоголиков — безработные. Означает ли это, что отсутствие работы приводит к алкоголизму? А может быть, именно увлечение крепкими напитками приводит к потере работы? Что здесь причина, а что следствие? Корреляция есть, а вот над причинно-следственными связями стоит подумать.

Визуализация статистических данных

Существует масса приемов, как графически «правильно» преподнести информацию нужным образом. Вы никогда не замечали, что трехмерная подача информации несколько искажает ее восприятие? График становится трудночитаемым. Кроме того, любую диаграмму можно повернуть таким образом, чтобы визуально увеличить ее площадь. Просто сравните: данные на графиках абсолютно одинаковые, но как по-разному они воспринимаются:

Из книги Н.Непряхина

Или вот замечательный пример манипулирования статистикой. Посмотрите на рисунок ниже и скажите, какая из экономик упала сильнее?

Из книги Н.Непряхина

«Конечно, это верхний график», — скажет большинство людей, бегло посмотрев на статистику. А теперь давайте расположим цифры на вертикальной оси в реальном масштабе и соединим все три показателя. И вот что у нас получится:

Из книги Н.Непряхина

Теперь абсолютно другая картина, правда?

Это лишь малая толика тех манипулятивных приемов, которые можно осуществлять со статистическими данными. Надеюсь, теперь вы будете относиться к этим данным более настороженно и обдуманно.

Источник: Snob.ru