50 на 50
Представьте. Подходит к вам друг, спрашивает «какой высоты ёлка?», кто-нибудь из вас ответит «15 метров»? Чаще всего ответ будет «что за ёлка» и «откуда мне знать». Почему же с вероятностью не так?
Почему на некоторые вопросы люди отвечают как та блондинка из анекдота? «Либо встречу, либо нет — 50 на 50». Почему «50 на 50»-то? В ёлке 15 метров? Откуда мне знать? Тогда почему вероятность 50 на 50?
Может за пять лет учёбы на математическом факультете вероятность так вдолбилась в мои мозги, что я понимаю, что с ней нельзя так:
Вероятности рассчитываются, причём чаще всего (если речь идёт о физических объектах, а не о моделях) — с некоторой точностью. Возможно это смущает людей. Раз точность не абсолютная, значит, там всё примерно, поэтому можно не париться.
Но точно так же как длину ёлки мы измеряем с определённой точностью! Она 15 метров, но при это там ещё пять сантиметров, два миллиметра, сто пять микрометров и так далее — мы её длину с точностью до всех знаков не померяем, более того — её длина меняется! Молекулы улетучиваются, из-за температуры ёлка становится то ниже, то выше! Будем считать, что все ёлки высотой 15 метров?
Давайте подсчитаем вероятности чего-нибудь.
Я понимаю, вузовские формулы почти никто не помнит, но мозги-то есть у всех. Какова будет вероятность, что выпадут два орла на двух подкинутых монетах? ¹⁄₂ что ли? Или выпадут или нет? Очевидный бред же, нет?
Правильный ответ — ¹⁄₄ (не умерший ещё во мне математик добавляет — если монеты идеальные), у нас четыре возможных ситуации — орёл-орёл, решка-решка, решка-орёл, орёл-решка. Небольшое затрудние или даже внутренний протест обычно возникает при попытке считать ситуации «решка-орёл» и «орёл-решка» разными, но они обычно разрешаются переименованием: считаем, что у второй монеты «орёл» называется реверсом, а решка — аверсом, тогда ситуации «решка-реверс» и «орёл-аверс» уже не кажутся одинаковыми. Со временем к этому просто привыкаешь.
Чему мы научились в этом примере? Даже в том случае, когда события равновероятны, важно определить количество исходов. Посмотрим с этой точки зрения на вероятность встретить динозавра. Предположим, один динозавр гарантированно существует и внезапно встречает человека в российском лесу. Ну, какова вероятность, что вы его встретите?
Кажется, что ситуаций возможных две (встретите или нет), пусть так, но они не равновероятные на этот раз. Сейчас я вам это покажу.
Посмотрим на ситуацию глазами динозавра. Если бы он гулял по лесу, какова у него была бы вероятность встретить именно вас? Если принять, что все россияне гуляют в лесу примерно с одинаковой частотой и сделать кучу других допущений, то шанс, примерно, один к 143 миллионам. Потому что равновероятных ситуаций с этой точки зрения примерно 143 миллиона, у нас столько людей в России: «динозавр встречает Степанищева Евгения Владимировича из Казани», «динозавр встречает Константина Геннадьевича Коломейца из Москвы»… и так далее.
Рассчитать вероятность встретить динозавра, если не считать, что он гарантированно существует я не могу, нехватает данных, разумеется. Так же как вы не сможете сообщить мне его вес, возраст или размеры.
Другой старый анекдот про монетки:
Вообще теория вероятности занятная вещь, только по неё специально надо мозг натаскать, чтобы он думал не согласно просто логике «встречу-нет», а предусматривал все возможные исходы. А если чуть дальше углубиться в комбинаторику и в случайные события, то меняется смысл жизни :)
На эту тему есть хорошая книжка «Как измерить все, что угодно. Оценка стоимости нематериального в бизнесе». Очень доходчиво показывает применение статистики и теории вероятности на практике.
Еще добавлю. Измерение автор рекомендует понимать как снижение неопределенности. Ответ «скорее всего высота елки между 12 и 18 метрам» намного лучше, чем «не знаю». И вполне возможно, что спрашивающего такая точность вполне устроит.
Комментарий для roman.yankovsky.me:
Я хотел эту тему затронуть, но подумал, что уже «многабукф» :)
Меня лично примеры с монеткой раздражают. Я без проблем кидаю монетку любой стороной нужное количество раз. Любой кто действительно кидал монетку так умеет. Кто не умеет — может научиться за 10-15 минут.
Кубики тоже не годятся ) Кубики я кидать так не умею, но есть достаточно людей которые умеют. Это профи-игроки в нарды. Я как-то даже книгу по нардам видел — там прямо заявлялась философия этой «игры», цитирую по памяти: «настоящий мастер всегда бросит кубики как ему нужно».
Комментарий для Павел:
Значит вы делаете это как-то неправильно. Общепринятый способ такой: кладёте монетку на боковую сторону указательно и большим пальцем выщёлкиваете вверх. Монета должна подлететь, крутясь с большой скоростью, потом вы её ловите при падении.
Да уж конечно. Что-то я не видел очень богатых игроков в нарды, хотя стоило бы ему зайти в казино и стать миллиардером.
Кубик, который можно бросить как угодно изготавливается очень просто: в одной из точек, нанесённых на кубик краской, сверлится отверстие, туда вставляется металлический штырёк на клею, потом это место закрашивается. Со стороны ничего не заметно. Теперь регулируя скорость и силу броска можно с большой долей вероятности выкидывать те значения, которые нужны.
Меня так друг семьи в детстве в нарды обыгрывал. Когда он рассказал в чём дело, запомнил это на всю жизнь.
В нардах вроде как обычно стаканчик для бросков используется — как раз для борьбы с такими «профи».
А помните эту классическую задачу? =) «Молодой человек после работы мог поехать либо к своей девушке, либо к родителям. Они жили в разных концах линии метро, он работал в центре. Он не мог решится куда лучше ездить и придумал садится на первый подошедший поезд. И хотя поезда ходили в обе стороны с одинаковым интервалом в пять минут, однако честно выполняя своё решение он за полгода съездил к девушке в три раза чаще, чем к родителям. Как такое могло быть? »
Комментарий для Alexander:
Не задумываясь есть ли какие-то условия, чтобы у этих двух исходов были разные вероятности, я могу предположить сходу:
1) он забивал на своё правило
2) равные вероятности не гарантируют равенства числа исходов
alexander
родительский поезд приезжал на 5/3 мин позже
Комментарий для Павел:
Именно так и бросаю. Не надо меня убеждать, возьми монетку и научись сам. Весь «секрет» в одинаковом усилии при броске и точном времени ловли. Навык развивается за 10-15 минут. Большая скорость — это около 10 об/сек. Что дает 0,1сек на оборот. Более чем достаточно для среднего человека.
Что-то я не вижу никакой связи этого факта с умением бросать кости.
Комментарий для Евгения Степанищева:
И еще — тренироваться лучше на монетах среднего размера. Мелкие крутятся быстрее и ловить их тяжелее. А большие монеты тяжелее и быстрее устает большой палец.
Комментарий для Павел:
На навыке бросания костей просто заработать в казино.
Пока не увижу, не поверю. Можно видео?
связь прямая, человек умеющий бросать кости даже не с точность, а с повышенной вероятностью мгновенно озолотится играя в казино
вы некорректно бросаете монету получаете некорректные результаты
Комментарий для Евгения Степанищева:
http://www.youtube.com/watch?feature=player_embedded%26v=X1uJD1O3L08 вот вам пруф что можно выбрасывать так монетки.
ps правда есть загвоздка — видео снимали несколько часов
болк сидит на Пикабу!!!11
Комментарий для isk.livejournal.com:
Болк в Гугле сидит :) Это нагуглилось.
Комментарий для Vlad528:
Пруф, мягкоговоря, слабоват: правая сторона картинки более чем легко поддаётся монтажу )
пруф подлинный, но он подтверждает тер вер.
чтобы 10 раз выбросить орла н кидал много часов, а потом удачный дубль оставил
Я боюсь, что люди, которые не понимали, что такое вероятность до прочтения поста, вряд ли поняли, в чем была их ошибка.
Про ёлку — имелась в виду статистика высоты елей, видимо, но в посте сразу переход к вероятности. Я долго вкуривал этот переход. :)
А про вероятность встретить динозавра — ваш пример тоже некорректен же, там с условием, что динозавр всё-таки есть, а вычисляется вероятность того, что он встретит определённого субъекта. :)
Комментарий для warmland.ru:
Разве я это пытался объяснить? Я недоумеваю почему люди воспринимают вероятность именно таким образом.
Не понял в чём некорректность.
Комментарий для warmland.ru:
Нет, не статистика. Я имею ввиду высоту ели. Почему-то, чтобы её узнать, надо измерить ель, а вероятности никто не стесняется считать прямо из головы.
<blockquote>2) равные вероятности не гарантируют равенства числа исходов</blockquote>
Кстати да, могло случиться и просто маловероятное событие. )))
Классический же ответ таков: поезда в обе стороны ходят с равными интервалами, однако куда важнее в какой интервал между поездами с разных направлений попадает молодой человек. Если он попадает в интервал «поезд к родителям ушёл — поезд к девушке ещё будет» значит он поедет к девушке, а если «поезд к девушке ушёл — поезд к родителям ещё будет» — наоборот, к родителям. Значит в этом метро первый интервал был в три раза длиннее чем второй. Или прямо в числах: в момент 0 приезжает поезд к родителям, в момент 3,75 минуты — поезд к девушке, в 5 минут — поезд к родителям, ещё через 8,75 минут — снова к девушке и так далее, циклично до конца дня. (Vlad528 почти правильно сказал =) )
Комментарий для Alexander:
А я было подумал, что он приходил в одно и то же время, а оно выпадало как раз на поезд к девушке по расписанию. Но расписание может сбиваться.
http://schegl2g.bget.ru/bayes/YudkowskyBayes.html
раз пошла такая пьянка
Хм, попробуем так. Проведём численный эксперимент: в городе 1000 подходящих женщин из них 1% болен, значит у нас 990 здоровых и 10 больных. После обследования мы получаем: из 990 здоровых 990*0,096 = 95,04 получили положительный результат, а остальные 894,96 — отрицательный. Из 10 больных 8 получили положительный результат, а 2 — отрицательный. Значит что — она либо из 95,04 здоровых либо из 8 больных. Вероятность попасть в 8 больных в таком раскладе 8 / (8 + 95,04) ~ 7,76%
Поскольку числа могут быть произвольными, а отношения сохранятся, значит действительно 7,76%. А какая мораль? Большое количество ложноположительных срабатываний делает любой тест практически бессмысленным в случае редкости заболевания.
Если бы болела каждая вторая, то мы бы сравнивали 400 больных и 48 здоровых и вероятность что она фактически больна была бы 89%. =)
По теореме Байеса, Pr(динозавр|улица)∝Pr(улица|динозавр)*Pr(динозавр). Мы знаем, что априорная вероятность Pr(динозавр)=0 => Pr(динозавр|улица)=0.
Комментарий для memoryfull.livejournal.com:
Нет, не знаем. Откуда мы это знаем?
Евгений, Илья Бирман написал целую эпопею про деепричастный оборот :) Наверняка вы читали: http://ilyabirman.ru/meanwhile/2009/07/31/2/
Вот это предложение построено неправильно: «Гуляя в лесу, какова у него вероятность встретить именно вас?»
Комментарий для Тима Люмин:
Что не так, простите? Динозавр гуляет в лесу, какая вероятность, что он вас повстречает? Что не так, не могли бы вы пояснить?
Подлежащее в предложении «Какова у него вероятность встретить именно вас?» — вероятность. Деепричастный оборот всегда относится к подлежащему, которое используется в основном предложении.
Было бы правильно сказать, например, «Гуляя в лесу, динозавр ест крапиву» или «Когда динозавр гуляет в лесу, какова у него вероятность встретить именно вас?»
Цитирую Илью:
«Деепричастный оборот относится к подлежащему просто потому, что в нём невозможно указать на другой субъект (извините, что я в одном предложении использую синонимы „подлежащее“ и „субъект“ так, будто это разные вещи). Однако его можно где-нибудь просто упомянуть, что и делает Чехов руками Ярмонкина при помощи слов „у меня“. Поскольку „я“ упомянут, то вроде как можно относить деепричастный оборот ко „мне“. Мы тоже можем воспользоваться этим „приёмом“:
Проснувшись поутру, у меня одеяло оказалось на полу.
Упомянуть „себя“ можно даже через одно местоимение:
Проснувшись поутру, моё одеяло оказалось на полу.»
Конец цитаты:
«Но упомянуть — не значит сделать подлежащим. В русском языке есть синтаксис. Нельзя где попало назвать что-то в любой форме и утверждать, что оно относится к деепричастному обороту. Такое упоминание „себя“ просто маскирует ошибку, но не исправляет её. Всё равно проснулся в этом предложении не „я“, а „моё одеяло“ или „одеяло у меня“.»
Комментарий для Тима Люмин:
Да, пожалуй. Тут какой-то интересный случай моей слепоты, спасибо!
А откуда взято допущение, что динозавр встретит только одного случайного человека из всего населения России? И какое отношение имеет событие «динозавр встретил тебя» к событию «динозавр встретил меня»?
То есть ты по сути правильно пишешь, но либо объяснение неправильное, либо я не выспался =)
Комментарий для fulc.ru:
Да тут всё на допущениях, потому что задача с динозавром решения не имеет, данных мало очень, это вообще анекдот :). Я просто хочу проиллюстрировать, что подход «два исхода, значит 50/50» неверен принципиально.
Вероятность мне встерить динозавра — 50%, вероятность динозавру встретить каждого человека — 50%. Противоречий нет: динозавр встретит примерно половину населения :)
«Два исхода, значит 50/50» неверен принципиально, потому что можно разбить один из исходов на два (произвольным образом), тогда по той же логике оставшийся исход должен поменять вероятность с 1/2 на 1/3.
Вообще не понятно, о чем думают люди, которые говорят про 50% не в какой-то жизненной ситуации, где сложно понять настоящую вероятность, а именно в контексте встречи динозавра.