Это сайт — моя персональная записная книжка. Интересна мне, по большей части, история, своя жизнь и немного программирование.

50 на 50

Представьте. Подходит к вам друг, спрашивает «какой высоты ёлка?», кто-нибудь из вас ответит «15 метров»? Чаще всего ответ будет «что за ёлка» и «откуда мне знать». Почему же с вероятностью не так?

Почему на некоторые вопросы люди отвечают как та блондинка из анекдота? «Либо встречу, либо нет — 50 на 50». Почему «50 на 50»-то? В ёлке 15 метров? Откуда мне знать? Тогда почему вероятность 50 на 50?

Может за пять лет учёбы на математическом факультете вероятность так вдолбилась в мои мозги, что я понимаю, что с ней нельзя так:  

50/50 (71.24КиБ)

Вероятности рассчитываются, причём чаще всего (если речь идёт о физических объектах, а не о моделях) — с некоторой точностью. Возможно это смущает людей. Раз точность не абсолютная, значит, там всё примерно, поэтому можно не париться.

Но точно так же как длину ёлки мы измеряем с определённой точностью! Она 15 метров, но при это там ещё пять сантиметров, два миллиметра, сто пять микрометров и так далее — мы её длину с точностью до всех знаков не померяем, более того — её длина меняется! Молекулы улетучиваются, из-за температуры ёлка становится то ниже, то выше! Будем считать, что все ёлки высотой 15 метров?

Давайте подсчитаем вероятности чего-нибудь.

Я понимаю, вузовские формулы почти никто не помнит, но мозги-то есть у всех. Какова будет вероятность, что выпадут два орла на двух подкинутых монетах? ¹⁄₂ что ли? Или выпадут или нет? Очевидный бред же, нет?

Правильный ответ — ¹⁄₄ (не умерший ещё во мне математик добавляет — если монеты идеальные), у нас четыре возможных ситуации — орёл-орёл, решка-решка, решка-орёл, орёл-решка. Небольшое затрудние или даже внутренний протест обычно возникает при попытке считать ситуации «решка-орёл» и «орёл-решка» разными, но они обычно разрешаются переименованием: считаем, что у второй монеты «орёл» называется реверсом, а решка — аверсом, тогда ситуации «решка-реверс» и «орёл-аверс» уже не кажутся одинаковыми. Со временем к этому просто привыкаешь.

Чему мы научились в этом примере? Даже в том случае, когда события равновероятны, важно определить количество исходов. Посмотрим с этой точки зрения на вероятность встретить динозавра. Предположим, один динозавр гарантированно существует и внезапно встречает человека в российском лесу. Ну, какова вероятность, что вы его встретите?

Кажется, что ситуаций возможных две (встретите или нет), пусть так, но они не равновероятные на этот раз. Сейчас я вам это покажу.

Посмотрим на ситуацию глазами динозавра. Если бы он гулял по лесу, какова у него была бы вероятность встретить именно вас? Если принять, что все россияне гуляют в лесу примерно с одинаковой частотой и сделать кучу других допущений, то шанс, примерно, один к 143 миллионам. Потому что равновероятных ситуаций с этой точки зрения примерно 143 миллиона, у нас столько людей в России: «динозавр встречает Степанищева Евгения Владимировича из Казани», «динозавр встречает Константина Геннадьевича Коломейца из Москвы»… и так далее.

Рассчитать вероятность встретить динозавра, если не считать, что он гарантированно существует я не могу, нехватает данных, разумеется. Так же как вы не сможете сообщить мне его вес, возраст или размеры.

37 комментариев
Michael Danilov (danilov.me) 2013

Другой старый анекдот про монетки:

Просыпаются утром пять студентов в одной комнате.
Первокурсник: — Блин, опаздываем — давайте бвстрее на пары!
Второкурсник: — Какие пары, давай лучше поспим!
Третьекурсник: — Ну, раз уже проснулись давай по пиву!
Четырехкурсник: — Какое пиво — давай водочки!
Пятикурсник: — Короче, бросаем монету, если орел — пьем водку, если решка — пиво, если станет на ребро — спим дальше, ну а если зависнет в воздухе — идем на пары!

Вообще теория вероятности занятная вещь, только по неё специально надо мозг натаскать, чтобы он думал не согласно просто логике «встречу-нет», а предусматривал все возможные исходы. А если чуть дальше углубиться в комбинаторику и в случайные события, то меняется смысл жизни :)

Roman Ryaboy (roman.yankovsky.me) 2013

На эту тему есть хорошая книжка «Как измерить все, что угодно. Оценка стоимости нематериального в бизнесе». Очень доходчиво показывает применение статистики и теории вероятности на практике.

Roman Ryaboy (roman.yankovsky.me) 2013

Еще добавлю. Измерение автор рекомендует понимать как снижение неопределенности. Ответ «скорее всего высота елки между 12 и 18 метрам» намного лучше, чем «не знаю». И вполне возможно, что спрашивающего такая точность вполне устроит.

Евгений Степанищев (bolknote.ru) 2013

Комментарий для roman.yankovsky.me:

Ответ «скорее всего высота елки между 12 и 18 метрам» намного лучше, чем «не знаю». И вполне возможно, что спрашивающего такая точность вполне устроит.

Я хотел эту тему затронуть, но подумал, что уже «многабукф» :)

Павел 2013

Меня лично примеры с монеткой раздражают. Я без проблем кидаю монетку любой стороной нужное количество раз. Любой кто действительно кидал монетку так умеет. Кто не умеет — может научиться за 10-15 минут.

Кубики тоже не годятся ) Кубики я кидать так не умею, но есть достаточно людей которые умеют. Это профи-игроки в нарды. Я как-то даже книгу по нардам видел — там прямо заявлялась философия этой «игры», цитирую по памяти: «настоящий мастер всегда бросит кубики как ему нужно».

Евгений Степанищев (bolknote.ru) 2013

Комментарий для Павел:

Я без проблем кидаю монетку любой стороной нужное количество раз.

Значит вы делаете это как-то неправильно. Общепринятый способ такой: кладёте монетку на боковую сторону указательно и большим пальцем выщёлкиваете вверх. Монета должна подлететь, крутясь с большой скоростью, потом вы её ловите при падении.

Кубики я кидать так не умею, но есть достаточно людей которые умеют. Это профи-игроки в нарды. Я как-то даже книгу по нардам видел — там прямо заявлялась философия этой игры, цитирую по памяти: «настоящий мастер всегда бросит кубики как ему нужно».

Да уж конечно. Что-то я не видел очень богатых игроков в нарды, хотя стоило бы ему зайти в казино и стать миллиардером.

Кубик, который можно бросить как угодно изготавливается очень просто: в одной из точек, нанесённых на кубик краской, сверлится отверстие, туда вставляется металлический штырёк на клею, потом это место закрашивается. Со стороны ничего не заметно. Теперь регулируя скорость и силу броска можно с большой долей вероятности выкидывать те значения, которые нужны.

Меня так друг семьи в детстве в нарды обыгрывал. Когда он рассказал в чём дело, запомнил это на всю жизнь.

Eyeless 2013

В нардах вроде как обычно стаканчик для бросков используется — как раз для борьбы с такими «профи».

Alexander 2013

А помните эту классическую задачу? =) «Молодой человек после работы мог поехать либо к своей девушке, либо к родителям. Они жили в разных концах линии метро, он работал в центре. Он не мог решится куда лучше ездить и придумал садится на первый подошедший поезд. И хотя поезда ходили в обе стороны с одинаковым интервалом в пять минут, однако честно выполняя своё решение он за полгода съездил к девушке в три раза чаще, чем к родителям. Как такое могло быть? »

Евгений Степанищев (bolknote.ru) 2013

Комментарий для Alexander:

Не задумываясь есть ли какие-то условия, чтобы у этих двух исходов были разные вероятности, я могу предположить сходу:
1) он забивал на своё правило
2) равные вероятности не гарантируют равенства числа исходов

Vlad528 2013

alexander
родительский поезд приезжал на 5/3 мин позже

Павел 2013

Комментарий для Павел:

Общепринятый способ такой: кладёте монетку на боковую сторону указательно и большим пальцем выщёлкиваете вверх. Монета должна подлететь, крутясь с большой скоростью, потом вы её ловите при падении.

Именно так и бросаю. Не надо меня убеждать, возьми монетку и научись сам. Весь «секрет» в одинаковом усилии при броске и точном времени ловли. Навык развивается за 10-15 минут. Большая скорость — это около 10 об/сек. Что дает 0,1сек на оборот. Более чем достаточно для среднего человека.

Что-то я не видел очень богатых игроков в нарды, хотя стоило бы ему зайти в казино и стать миллиардером.

Что-то я не вижу никакой связи этого факта с умением бросать кости.

Павел 2013

Комментарий для Евгения Степанищева:

И еще — тренироваться лучше на монетах среднего размера. Мелкие крутятся быстрее и ловить их тяжелее. А большие монеты тяжелее и быстрее устает большой палец.

Евгений Степанищев (bolknote.ru) 2013

Комментарий для Павел:

Что-то я не вижу никакой связи этого факта с умением бросать кости.

На навыке бросания костей просто заработать в казино.

Именно так и бросаю. Не надо меня убеждать, возьми монетку и научись сам.

Пока не увижу, не поверю. Можно видео?

Vlad528 2013

связь прямая, человек умеющий бросать кости даже не с точность, а с повышенной вероятностью мгновенно озолотится играя в казино

вы некорректно бросаете монету получаете некорректные результаты

Vlad528 2013

Комментарий для Евгения Степанищева:

http://www.youtube.com/watch?feature=player_embedded%26v=X1uJD1O3L08 вот вам пруф что можно выбрасывать так монетки.

ps правда есть загвоздка — видео снимали несколько часов

Iskander Rashitov (isk.livejournal.com) 2013

болк сидит на Пикабу!!!11

Евгений Степанищев (bolknote.ru) 2013

Комментарий для isk.livejournal.com:

Болк в Гугле сидит :) Это нагуглилось.

hshhhhh (hshhhhh.name) 2013

Комментарий для Vlad528:

Пруф, мягкоговоря, слабоват: правая сторона картинки более чем легко поддаётся монтажу )

Vlad528 2013

пруф подлинный, но он подтверждает тер вер.
чтобы 10 раз выбросить орла н кидал много часов, а потом удачный дубль оставил

warmland.ru 2013

Я боюсь, что люди, которые не понимали, что такое вероятность до прочтения поста, вряд ли поняли, в чем была их ошибка.

Про ёлку — имелась в виду статистика высоты елей, видимо, но в посте сразу переход к вероятности. Я долго вкуривал этот переход. :)

А про вероятность встретить динозавра — ваш пример тоже некорректен же, там с условием, что динозавр всё-таки есть, а вычисляется вероятность того, что он встретит определённого субъекта. :)

Евгений Степанищев (bolknote.ru) 2013

Комментарий для warmland.ru:

Я боюсь, что люди, которые не понимали, что такое вероятность до прочтения поста, вряд ли поняли, в чем была их ошибка.

Разве я это пытался объяснить? Я недоумеваю почему люди воспринимают вероятность именно таким образом.

А про вероятность встретить динозавра — ваш пример тоже некорректен же, там с условием, что динозавр всё-таки есть, а вычисляется вероятность того, что он встретит определённого субъекта. :)

Не понял в чём некорректность.

Евгений Степанищев (bolknote.ru) 2013

Комментарий для warmland.ru:

Про ёлку — имелась в виду статистика высоты елей, видимо, но в посте сразу переход к вероятности. Я долго вкуривал этот переход. :)

Нет, не статистика. Я имею ввиду высоту ели. Почему-то, чтобы её узнать, надо измерить ель, а вероятности никто не стесняется считать прямо из головы.

Alexander 2013

<blockquote>2) равные вероятности не гарантируют равенства числа исходов</blockquote>
Кстати да, могло случиться и просто маловероятное событие. )))

Классический же ответ таков: поезда в обе стороны ходят с равными интервалами, однако куда важнее в какой интервал между поездами с разных направлений попадает молодой человек. Если он попадает в интервал «поезд к родителям ушёл — поезд к девушке ещё будет» значит он поедет к девушке, а если «поезд к девушке ушёл — поезд к родителям ещё будет» — наоборот, к родителям. Значит в этом метро первый интервал был в три раза длиннее чем второй. Или прямо в числах: в момент 0 приезжает поезд к родителям, в момент 3,75 минуты — поезд к девушке, в 5 минут — поезд к родителям, ещё через 8,75 минут — снова к девушке и так далее, циклично до конца дня. (Vlad528 почти правильно сказал =) )

greli (greli.livejournal.com) 2013

Комментарий для Alexander:

А я было подумал, что он приходил в одно и то же время, а оно выпадало как раз на поезд к девушке по расписанию. Но расписание может сбиваться.

Донт Паник (vkv.livejournal.com) 2013
Vlad528 2013

1% женщин в возрасте 40 лет, участвовавших в регулярных обследованиях, имеют рак груди. 80% женщин с раком груди имеют положительный результат маммографии. 9.6% здоровых женщин также получают положительный результат (маммография, как любые измерения, не дает 100% результатов). Женщина-пациент из этой возрастной группы получила положительный результат на регулярном обследовании. Какова вероятность того, что она фактически больна раком груди?

раз пошла такая пьянка

Alexander 2013

Хм, попробуем так. Проведём численный эксперимент: в городе 1000 подходящих женщин из них 1% болен, значит у нас 990 здоровых и 10 больных. После обследования мы получаем: из 990 здоровых 990*0,096 = 95,04 получили положительный результат, а остальные 894,96 — отрицательный. Из 10 больных 8 получили положительный результат, а 2 — отрицательный. Значит что — она либо из 95,04 здоровых либо из 8 больных. Вероятность попасть в 8 больных в таком раскладе 8 / (8 + 95,04) ~ 7,76%

Поскольку числа могут быть произвольными, а отношения сохранятся, значит действительно 7,76%. А какая мораль? Большое количество ложноположительных срабатываний делает любой тест практически бессмысленным в случае редкости заболевания.

Если бы болела каждая вторая, то мы бы сравнивали 400 больных и 48 здоровых и вероятность что она фактически больна была бы 89%. =)

␖-␆ (memoryfull.livejournal.com) 2013

По теореме Байеса, Pr(динозавр|улица)∝Pr(улица|динозавр)*Pr(динозавр). Мы знаем, что априорная вероятность Pr(динозавр)=0 => Pr(динозавр|улица)=0.

Евгений Степанищев (bolknote.ru) 2013

Комментарий для memoryfull.livejournal.com:

априорная вероятность Pr(динозавр)=0

Нет, не знаем. Откуда мы это знаем?

Тима Люмин 2013

Евгений, Илья Бирман написал целую эпопею про деепричастный оборот :) Наверняка вы читали: http://ilyabirman.ru/meanwhile/2009/07/31/2/
Вот это предложение построено неправильно: «Гуляя в лесу, какова у него вероятность встретить именно вас?»

Евгений Степанищев (bolknote.ru) 2013

Комментарий для Тима Люмин:

Что не так, простите? Динозавр гуляет в лесу, какая вероятность, что он вас повстречает? Что не так, не могли бы вы пояснить?

Тима Люмин 2013

Подлежащее в предложении «Какова у него вероятность встретить именно вас?» — вероятность. Деепричастный оборот всегда относится к подлежащему, которое используется в основном предложении.

Было бы правильно сказать, например, «Гуляя в лесу, динозавр ест крапиву» или «Когда динозавр гуляет в лесу, какова у него вероятность встретить именно вас?»

Цитирую Илью:
«Деепричастный оборот относится к подлежащему просто потому, что в нём невозможно указать на другой субъект (извините, что я в одном предложении использую синонимы „подлежащее“ и „субъект“ так, будто это разные вещи). Однако его можно где-нибудь просто упомянуть, что и делает Чехов руками Ярмонкина при помощи слов „у меня“. Поскольку „я“ упомянут, то вроде как можно относить деепричастный оборот ко „мне“. Мы тоже можем воспользоваться этим „приёмом“:

    Проснувшись поутру, у меня одеяло оказалось на полу.

Упомянуть „себя“ можно даже через одно местоимение:

    Проснувшись поутру, моё одеяло оказалось на полу.»

Тима Люмин 2013

Конец цитаты:
«Но упомянуть — не значит сделать подлежащим. В русском языке есть синтаксис. Нельзя где попало назвать что-то в любой форме и утверждать, что оно относится к деепричастному обороту. Такое упоминание „себя“ просто маскирует ошибку, но не исправляет её. Всё равно проснулся в этом предложении не „я“, а „моё одеяло“ или „одеяло у меня“.»

Евгений Степанищев (bolknote.ru) 2013

Комментарий для Тима Люмин:

Да, пожалуй. Тут какой-то интересный случай моей слепоты, спасибо!

Fulcrum (fulc.ru) 2013

А откуда взято допущение, что динозавр встретит только одного случайного человека из всего населения России? И какое отношение имеет событие «динозавр встретил тебя» к событию «динозавр встретил меня»?

То есть ты по сути правильно пишешь, но либо объяснение неправильное, либо я не выспался =)

Евгений Степанищев (bolknote.ru) 2013

Комментарий для fulc.ru:

Да тут всё на допущениях, потому что задача с динозавром решения не имеет, данных мало очень, это вообще анекдот :). Я просто хочу проиллюстрировать, что подход «два исхода, значит 50/50» неверен принципиально.

Fulcrum (fulc.ru) 2013

Вероятность мне встерить динозавра — 50%, вероятность динозавру встретить каждого человека — 50%. Противоречий нет: динозавр встретит примерно половину населения :)

«Два исхода, значит 50/50» неверен принципиально, потому что можно разбить один из исходов на два (произвольным образом), тогда по той же логике оставшийся исход должен поменять вероятность с 1/2 на 1/3.

Вообще не понятно, о чем думают люди, которые говорят про 50% не в какой-то жизненной ситуации, где сложно понять настоящую вероятность, а именно в контексте встречи динозавра.