Юлия Баяндина Грандмастер

Голая статистика, или Как выиграть миллион?

Как определить беременность по списку покупок и как ученые выясняют причины рака? Как выиграть миллион и как часто женатые пары занимаются сексом? Как неверные выводы заставляют умных людей совершать глупости? И почему это полезно лично вам? Статистика знает!

pixabay.com

Статистика сродни профессии детектива. Проводит расследования — с уликами и подозреваемыми. Книга Чарльза Уилана — первая книга по статистике, которую интересно читать. Пристегните ремни, мы отправляемся в мир статистики!

Зачем вам статистика?

Сознаюсь, что однажды в отчаянии я изорвал одну книгу по статистике. Поэтому, когда писал эту книгу, сделал все, чтобы у вас такого желания не возникло. Зачем вообще нужна статистика? Наш мир все быстрее и быстрее генерирует большие объемы данных. Узнать о ком-то, загуглив его имя? Легко. Выбрать школу ребенку по открытым рейтингам успеваемости? А тут уже много подводных камней.

Любые данные — лишь исходный материал знаний, и, чтобы сделать правильный вывод, надо знать, как с ними обращаться. Без инструментов статистики мы с этими данными — как человек без компаса в незнакомом лесу.

И это еще не все. Хол Вариан, главный экономист компании Google, в интервью The New York Times сказал, что в следующем десятилетии работа со статистическими данными станет «модной профессией», а точнее «сексуальной» (дословное выражение: the sexy job). Пора с ней познакомиться.

Статистика помогает увидеть истину там, где она может быть спрятана от глаз.

Главное — правильно подать!

Марк Твен говорил: «Существует ложь, наглая ложь и статистика». Если люди неправильно понимают статистические данные, их выводы становятся опасными. Рассмотрим гипотетическую новость: «Люди, которые делают короткие перерывы в работе в течение дня, чаще умирают от рака».

Согласно результатам обследования 36 000 работников, у тех, кто выходил из офиса на регулярные 10-минутные перерывы, вероятность заболеть раком в следующие пять лет оказалась на 41% выше, чем у тех, кто офисы не покидал.

Понятно, что узнав такую новость, мы обязаны как-то на нее реагировать: отказаться от коротких перерывов? А может, задуматься над тем, чем именно обычно занимаются работники во время таких десятиминуток? Не мне вам рассказывать, что многие курят. Вот и причина раковых заболеваний.

Это утрированный пример, но таких случаев в жизни полно. Статистикой вертят, как хотят. И важно научиться это замечать.

Как выиграть миллион?

Делма Кинни, житель Атланты, выиграл в лотерею $ 1 млн, спустя три года — еще столько же. Вероятность такой ситуации 1 к 25 триллионам! Это в 40 миллионов раз меньше, чем возможность попадания молнии в человека. Но что вообще говорит статистика о лотереях?

Возьмем однодолларовый билет мгновенной лотереи. На его оборотной стороне напечатаны шансы выиграть призы: 1 шанс из 10 (бесплатный лотерейный билет) и так далее, вплоть до 1 шанса из 40 000 — выиграть 1000 долларов.

Ожидаемый доход для этого билета можно высчитать. Оказывается, он равен примерно 56 центам. Выходит, если вы потратите на покупку лотерейных билетов один миллион долларов, выигрыш составит около 560 000 долларов.

А чтобы «выиграть» миллион — надо потратить куда больше. Таким образом, покупка лотерейного билета — абсолютно бездарный способ потратить деньги.

Теория вероятностей в действии

Наши страхи не всегда адекватны тому, что говорят нам числа о реальной опасности. Проще говоря, мы не того боимся. Представляете, плавательный бассейн во дворе дома опаснее, чем заряженный револьвер, хранящийся в шкафу? Ученые подсчитали: вероятность того, что ребенок в возрасте до 10 лет утонет в бассейне, в 100 раз выше того, что он случайно застрелится, играя с револьвером.

Вероятность не говорит нам о том, что случится наверняка; она лишь предупреждает, что может произойти с высокой степенью вероятности или с менее высокой. А также о том, что уж точно не надо экстраполировать (переносить на будущее) свои выводы — они не всегда верны.

Вы можете использовать теорию вероятностей на работе и в повседневной жизни. Как? Да легко. Представьте, ваш ребенок принес «двойку» за контрольную. Оправдывается тем, что плохие оценки получили все. Но вы можете подловить хитрюгу. Теория вероятностей гласит: все не могут ответить одинаково неправильно — вероятность такого сценария мала. Вывод? Все списали неправильный ответ у кого-то из одноклассников. Элементарно, Ватсон!

Сосед ест мясо, вы — капусту, а в среднем вы едите голубцы

Статистические «отщепенцы» — это значения, резко отклоняющиеся от средних. Их обязательно следует учитывать, потому что они сильно искажают любые подсчеты. Вообразите 10 человек, сидящих у стойки бара какого-нибудь заведения. Каждый из них зарабатывает по $ 35 тысяч в год. Стало быть, средний годовой доход этой группы составляет $ 35 000.

Внезапно в заведение входит Билл Гейтс и усаживается на одиннадцатый стул за стойкой бара. При этом средний годовой доход людей в баре резко повышается до $ 91 млн долларов. Если написать, что средний доход посетителей заведения составляет $ 91 000 000, то данный вывод был бы статистически правильным. Однако не имел бы ничего общего с реальным положением вещей.

Поэтому информация по ТВ о повышении доходов на душу населения не всегда состыковывается с действительностью.

«Опираясь на статистику, легко лгать, но без статистики очень трудно выяснить истину». Эту мысль высказал шведский математик Андрейс Дункельсон. «Голая статистика» доказывает, что она справедлива.

Статистика подобна мощному оружию, полезному в случае его правильного применения и потенциально разрушительному в неумелых руках. Если понимать статистику, можно глубже и пристальнее смотреть на жизнь, видеть связь между многими явлениями и применять эти знания в своих интересах.

По материалам книги «Голая статистика» Чарльза Уилана.

Обновлено 30.03.2016
Статья размещена на сайте 18.03.2016

Комментарии (3):

Чтобы оставить комментарий зарегистрируйтесь или войдите на сайт

Войти через социальные сети:

  • Если написать, что средний доход посетителей заведения составляет $91 000 000, то данный вывод был бы статистически правильным. Однако не имел бы ничего общего с реальным положением вещей.
    Это и есть абсолютно реальное положение вещей, если брать за результат именно среднюю величину, вместо необходимой для таких случаев.

    • Mike Mike, Для этого в статистике и используется метод отсечения значений не укладывающихся в закон "распределения вероятностей". Проще говоря, выбрасываются заведомо слишком маленькие и/или большие значения. К сожалению этого не знают наши политика/экономисты, поэтому у нас "средняя температура по больнице 37 градусов".