Решение парадокса двух конвертов

Аватар пользователя kv1

Тут недавно в одной из статей вспомнили «парадокс двух конвертов». Сам долго бился над этим парадоксом, и вот наконец понял, в чем собака порылась. На всякий случай напомню его.

Есть два конверта, в каждом из которых деньги, причем сумма в одном конверте вдвое больше, чем в другом. Игрок выбирает конверт, открывает его, после чего может либо оставить эти деньги себе, либо попросить поменять конверт (тогда он получит сумму из другого конверта). Для простоты конверт с большей суммой  назовем «большим», а с меньшей суммой – «малым» (понятно, что внешне они одинаковы). Вероятность, что после обмена сумма увеличится – 0,5. Ровно такая же вероятность, что сумма уменьшится. Допустим, у игрока на руках (в первом конверте) 100 рублей и он принял решение поменять конверт. В случае успеха сумма удвоится, то есть он получит 200 рублей (на 100 рублей больше, чем сейчас). В случае неудачи сумма уполовинится, то есть он получит 50 рублей (на 50 рублей меньше, чем сейчас). Таким образом, возможная прибыль вдвое больше возможного убытка, при этом их вероятности одинаковы. Получается, что менять конверт будет выгодно в любом случае, однако житейская логика подсказывает, что так быть не должно. В этом и заключается парадокс.

Чтобы было понятнее, рассмотрим похожую игру. Изначально есть только один конверт с деньгами, его и дают игроку. После этого он решает, оставить ли эту сумму себе или сыграть на нее.   Если он выбрал второй вариант, то подкидывается монетка: если орел – сумма уполовинится, если решка – удвоится. Какая оптимальная тактика?

Вот в этом случае действительно всегда выгодно играть, и никакого парадокса нет. Так в чем же отличие от исходной задачи?

А отличие в том, что в исходной задаче все деньги уже размещены по конвертам, и других денег нет. Казалось бы, мелочь? Но нет, она важна. При расчете вероятностей мы должны учитывать реальные деньги в конвертах, а не виртуальные суммы в мриях мужичка с топором (помните мульт «Падал прошлогодний снег»?).

Для простоты рассмотрим пример. Допустим, мы взяли 5 больших конвертов и положили туда деньги от 200 до 1000 рублей с шагом 200 рублей. Потом взяли 5 малых конвертов и положили туда деньги от 100 до 500 рублей с шагом 100 рублей.  Таким образом, у нас получилось 5 пар конвертов, для которых выполняется условие, что сумма в большом конверте вдвое больше, чем в малом. Перед игрой произвольно выбираем пару конвертов (большой+малый), после чего игрок уже выбирает один из них. Ну а потом может поменяться, если захочет.

Допустим, игрок открыл конверт и там 600 рублей. Какова вероятность выигрыша в случае обмена? Очевидно, что нулевая – ну нет конверта с 1200 рублями, савсэм нэт. То же справедливо для конвертов с 800 и 1000 рублей – шансов на выигрыш нет. Конечно, игрок этого не знает, но мы-то знаем! То есть вероятность выигрыша или проигрыша напрямую зависит от суммы в руках игрока и вовсе не равна 0,5, как мы предполагали изначально.

Теперь рассчитаем средние суммы в больших и малых конвертах (именно они потом будут использоваться для расчета потенциального выигрыша или проигрыша). Очевидно, что и общая, и средняя сумма в больших конвертах всегда будет ровно вдвое больше, чем в малых (причем независимо от кого, как мы исходно комплектовали конверты – набор сумм в больших конвертах может быть совершенно произвольным, все равно в малых конвертах будет сумма ровно вдвое меньше). Для нашего примера средняя сумма в больших конвертах будет 600 рублей, в малых – 300 рублей. 

Теперь снова вернемся к вероятностям. Вероятность вытянуть большой конверт равна 0,5. Ожидаемая (средняя) сумма в этом конверте 600 рублей. При обмене игрок потеряет половину этой суммы, то есть его потенциальный проигрыш 300 рублей. 

Вероятность вытянуть малый конверт тоже 0,5. Ожидаемая (средняя) сумма в этом конверте 300 рублей. При обмене игрок удвоит эту сумму, то есть его потенциальный выигрыш – те же 300 рублей. Бинго! Выигрыш равен проигрышу, и обмен конвертов ничего не даст! Вот и решение парадокса.

Итак, то же самое, но короче:

1. Для выигрыша нужно сначала вытянуть малый конверт и потом поменять его на большой.

2. Для проигрыша нужно сначала вытянуть большой конверт и потом поменять его на малый

3. Относительный выигрыш в процентах вдвое больше, но он умножается на сумму в малом конверте, которая вдвое меньше. Поэтому это произведение (абсолютная сумма выигрыша) будет равно абсолютной сумме проигрыша - там вдвое меньший процент умножается на вдвое большую сумму в большом конверте.

Авторство: 
Авторская работа / переводика

Комментарии

Аватар пользователя Лаперуз
Лаперуз(3 года 7 месяцев)

Получается, что менять конверт будет выгодно в любом случае,

а почему?

почему одинаково выгодно лишиться 50 рублей или приобрести 200?

Аватар пользователя Зима
Зима(7 лет 3 недели)

Ну это как будто оба события произойдут одновременно, то прибыль 150 руб., но произойдёт только какое-то одно событие и будет или убыток, или прибыль. Поскольку прибыль рисуется в 4 раза больше возможного убытка (без учёта вероятностей), то на игрока нападает маркетинговая жадность и он может продолжить играть. 

Аватар пользователя Лукич
Лукич(7 лет 10 месяцев)

почему одинаково выгодно лишиться 50 рублей или приобрести 200?

не так. У вас изначально есть 100 рублей. Варианты тут:

1. Получить в итоге не 100 рублей, а лишь 50.

2.. Получить 200 рублей в итоге.

3. Остаться со 100 рублями.

Здесь нужно рассматривать выгоду между вариантом три и исходом случайного выбора между вариантами 1 и 2.

Где случайность принесет вам 50+200/2 = 125. Это лучше третьего варианта

Аватар пользователя Виктор Филимонов

В оригинальной формулировке оба конверта одновременно получают разные люди, и после вскрытия своих конвертов, принимают решение обменяться конвертами. Каждый считает как вы описали, и каждый считает обмен выгодным. В этом и парадокс - обмен явно выгоден только одному игроку, так аак второй автоматически проигрывает, , при том, что с точки зрения каждого игрока отдельно - он выгоден каждому игроку. 

Аватар пользователя Боболя
Боболя(5 лет 7 месяцев)

Не, не так. Изначально вам дают 100 халявных. И у вас изначально два варианта: взять или не взять.  При решении "взять" к вам приходит аппетит, "коготок увяз" и муки дальнейшего выбора с нарастающей вероятностью "принудительно выйти в тираж" (если вам не удалось купить своё казино, конечно).

Аватар пользователя calvados1967
calvados1967(10 лет 1 неделя)

В этой связи я всегда вспоминаю фразу из главы про сэра Базиля Захарова в мемуарах академика А.Н. Крылова:

"Затем он купил казино в Монако и мог играть в рулетку без проигрыша."

Аватар пользователя ZIL.ok.130
ZIL.ok.130(7 лет 4 месяца)

Мммм -- тут подошли почти вплотную чтобы хотя бы почитать Теорию Игр.

Це пiхвально.

Гут.

smile1.gif

Аватар пользователя talvolta
talvolta(1 год 11 месяцев)

Применять теорию вероятностей к единичным случаям это, как считать кинетическую энергию движения одного атома - температурой.

 Некорректно. 

Аватар пользователя ИЮЛь Майский
ИЮЛь Майский(8 лет 9 месяцев)

Применять теорию вероятностей к единичным случаям это, как считать кинетическую энергию движения одного атома - температурой.

 Некорректно. 

Это не единичный случай, а единичная попытка (пусть она даже состоит из нескольких "подпопыток"). Усадим 100500 "игроков", каждого -перед своей парой конвертов -вот вам и статистика. 

Аватар пользователя talvolta
talvolta(1 год 11 месяцев)

Все эти 100500 игроков это 100500 игроков и статистика получится по игрокам и будет отличаться от статистики одного игрока с 100500 попытками. 

Аватар пользователя Oranien
Oranien(1 год 7 месяцев)

Не хочу придираться, но не вижу здесь парадокса (с т.з. играющего), в любом случае деньги будут - даже и при смене конверта (пусть и большого на малый) - то есть, игра не с нулевой суммой, и с т.з. играющего - смена конверта является обоснованной с т.з. именно игры. 

Аватар пользователя Ник
Ник(11 лет 4 месяца)

Я тоже искал парадокс.

Тщетно.

Аватар пользователя uran66
uran66(3 года 7 месяцев)

искал парадокс

Это называется когнитивные искажения.

Аватар пользователя Put in
Put in(1 год 2 недели)

Получается, что менять конверт будет выгодно

получается, что дебилы узнали о существовании теории вероятностей, но освоить ее не смогли

Аватар пользователя НИГ
НИГ(8 лет 11 месяцев)

Чет перемудрил ты с теорией. Замена конверта эт чистая психология.

Аватар пользователя Тигр Шрёдингера

Казино блин!

Аватар пользователя ИЮЛь Майский
ИЮЛь Майский(8 лет 9 месяцев)

Получается, что менять конверт будет выгодно в любом случае, однако житейская логика подсказывает, что так быть не должно. В этом и заключается парадокс.

Если правильно определить понятие выгоды, то никакого парадокса не будет. Ибо "игрок" в любом случае получит халявные деньги. 

Аватар пользователя stop
stop(3 года 4 месяца)

В парадоске двух конвертов - неверная математическая интерпретация.

Методом уравнения вероятности расчитывтся не прогноз получения, а ожидания.

Типичный "развод лоха".

(с подобным критическим мышлением держитесь подальше от казино, банков и цыган)

Аватар пользователя Ник
Ник(11 лет 4 месяца)

Вывод - хватай оба конверта и беги.

Аватар пользователя stop
stop(3 года 4 месяца)

Если точнее, хватай пельмень - и сразу жевать. Оба. Даже если один без мяса.

Аватар пользователя ucomrade
ucomrade(2 года 8 месяцев)

Если у меня было 0, то любой конверт даёт мне плюс. Главное, утюгом не перегреть попавшуюся купюру. А то будет как в Ералаше)

Аватар пользователя stop
stop(3 года 4 месяца)

Греть утюгом нужно устроителя этого эксперимента над людьми.

Он наверняка знает правильный конверт.

Аватар пользователя Igoris
Igoris(10 лет 11 месяцев)

Забрать конверт с деньгами и не париться.

Аватар пользователя m1ha1l
m1ha1l(4 года 11 месяцев)

Интересно практическое применение)) вот например дали окраине малый конверт "таможенный союз", и они строго по теории решили поменять на большой "безвиз-ес-нато"... Но проиграли вопреки. Парадокс? Лучше бы воспользовались народной мудростью "лучше синица в руках, чем журавль в небе ", здоровее бы были

Аватар пользователя Сергей Чернышев

Ага, жирную синицу поменяли на издыхающего тощего журавля.

Аватар пользователя Andy117
Andy117(8 лет 2 месяца)

у игрока на руках (в первом конверте) 100 рублей и он принял решение поменять конверт

Правильное решение. Что такое 100 рублей? На них даже яйца не купишь.
Ну даже если в поменянном конверте будет 50 рублей, то ничего не теряешь. Так и так без яиц!
А если 200, то будет праздник. С яйцами.
Лучше быть с яйцами, чем без.

Аватар пользователя AlGai
AlGai(2 года 10 месяцев)

Даниэль Канеман, нобелевский лауреат, объяснил бы данный "парадокс" неприятием (или избежанием) потерь.

Боль от потерь человек воспринимает ярче, чем удовольствие от выигрыша.

Аватар пользователя DioDao
DioDao(10 лет 8 месяцев)

Т.е. если в конвертах отрицательные числа (игрок должен), то менять не надо? Или надо?

А если число в конверте может быть любым ±?

Аватар пользователя Zivert
Zivert(4 года 2 месяца)

В смысле там не деньги, а уведомления о выплате долга? smile3.gif

Аватар пользователя stop
stop(3 года 4 месяца)

Ну, вот в лотерее, чтоб ожидать выигрыш, нужно приобрести(за деньги) неизвестный конверт.

Тоесть по умолчанию, предлагается конверт с отрицательной суммой.

Аватар пользователя Zivert
Zivert(4 года 2 месяца)

Это натягивание совы на глобус. В задаче оба конверта выигрышны и не требуют затрат. А покупка лотерейного билета - дело добровольное и может рассматриваться как высокорисковая инвестиция - если уж животных и птиц натягивать на глобус. 

Аватар пользователя Zivert
Zivert(4 года 2 месяца)

Это не только парадокс двух конвертов, а еще и очень старый может даже советский анекдот…

Купается мужик. Вдруг хватает его кто-то за яйца и голос спрашивает: 
- Плюс два или минус два? 
Мужик говорит: 
- Плюс два. 
Вылезает на берег, а у него четыре яйца. Думает мужик: сейчас вернусь, 
скажу "Минус два" и все опять будет хорошо. Полез он обратно в воду, доплыл 
до того места, там его опять хватают за яйца и спрашивают: 
- Плюс четыре или минус четыре?

Аватар пользователя Bumba
Bumba(5 лет 2 месяца)

Отлично! smile3.gif

Аватар пользователя Pencroff
Pencroff(2 года 9 месяцев)

Таким образом, возможная прибыль вдвое больше возможного убытка, при этом их вероятности одинаковы. Получается, что менять конверт будет выгодно в любом случае, однако житейская логика подсказывает, что так быть не должно. В этом и заключается парадокс.

По мне, так никакого парадокса нет.

Если предлагается неизвестная сумма халявных, а не заработанных, денег, то тогда, да, играй, если склонен. Всё равно что-то приобретёшь. Потерь/убытков нет - халява же в любом случае.

Однако если деньги (сумму тоже не показывают) заработаны, то лично я играть ни за что не стану. Что САМ вытянул, тем и довольствуйся. И на душе порядок будет. А он дороже любых денег. 

Аватар пользователя Zivert
Zivert(4 года 2 месяца)

Всё очень сильно зависит от суммы. Я про процесс принятия решения испытуемым организмом. 
Нельзя просто оперировать в таких вещах "любой абстрактной суммой".
Психологически всё может быть сильно по-разному. 
Вариантов на самом деле несколько (например ниже некоторые):

1. Суммы слишком мелкие, так что можно и рискнуть и не сильно париться в случае проигрыша. Ибо там только на бокал пива и хватит. 
2. Суммы очень большие, так что даже половины хватит на красивую жизнь себе и внукам. 
3. Сумма большая и её хватит на красивую жизнь себе и внукам, но вот половины её уже не особо. 
4. Сумма такова, что удвоенной хватит на какую-то свою серьезную хотелку (автомобиль), а разница между имеющейся сейчас и ценой хотелки такова, что проще рискнуть, чем 10 лет еще копить оставшуюся половину
5. Сумма такова, что её сейчас хватает на серьезную хотелку (автомобиль) и возникает вопрос синицы в руках. 

Аватар пользователя stop
stop(3 года 4 месяца)

Чем сложнее схема развода, тем больше логика отстаёт от эмоции стяжательства.

Банки давно это знают.

Аватар пользователя stop
stop(3 года 4 месяца)

Интересно, а если вместо суммы, игра на раздевание?

Аватар пользователя Zivert
Zivert(4 года 2 месяца)

Опять же - смотря с кем )

Аватар пользователя Mr.Wolf
Mr.Wolf(5 лет 6 месяцев)

Таким образом, возможная прибыль вдвое больше возможного убытка, при этом их вероятности одинаковы. Получается, что менять конверт будет выгодно в любом случае, однако житейская логика подсказывает, что так быть не должно.

"Прибыль" - странный термин в данном случае. С вероятностями - всё нормально, мат.ожидание - 1,5 от минимальной суммы. 

То, что вы называете "парадоксом" - на самом деле просто отсутствие у вас информации о значении минимальной суммы. Отсюда и фактор жадности: "можно ведь ещё больше получить!" 

Задача, по факту - те же две шкатулки у Якубовича на поле чудес: "я вам даю 100 рублей - и не открываем шкатулку"... 

В действительности решение следует принимать исходя из предлагаемой суммы (в нашем случае - исходя из содержимого первого конверта): если сумма представляется значительной - забирать, иначе - можно играть дальше: а вдруг?  

Аватар пользователя Планктон
Планктон(4 года 8 месяцев)

Все неправильно.

За прибыль стратегии "не менять конверты" надо брать не минимальный выигрыш (100руб) а средний - 150 руб - потому-что игрок так будет в среднем выигрывать 150 рублей за игру.

Тогда вероятный результат при обмене конвертов:

В случае выигрыша: 200 руб, в случае проигрыша 100руб , в среднем: 150 рублей - ничего не поменялось - смысла нет.

То же самое относится и к игре с удвоением выигрыша при угадывании монетки - если правильно посчитать, то играть в нее нет смысла - выиграть и проиграть можно с одинаковой вероятностью.

Аватар пользователя kv1
kv1(8 лет 7 месяцев)

Ну так игрок не знает среднего, он рассчитывает от той суммы, которую он видит в первом конверте. И по его расчетам получается, что выгодно играть, поскольку потенциальный выигрыш больше потенциального проигрыша.

В случае с монеткой эта логика срабатывает, играть всегда выгодно. В случае с конвертами - не срабатывает.

Аватар пользователя Планктон
Планктон(4 года 8 месяцев)

Почему не знает среднего?

Ему все цифры известны.

И вообще это неправильное применение теории вероятности.

Случайное событие здесь это не выплата некой фиксированной суммы, а удвоение/деление той суммы что есть на руках.

Т.е. здесь вероятность 50% относится не к абсолютной какой-то величине (100 рублей выигрыша или 50 рублей проигрыша) , а к относительной: 50% удвоится и 50% ополовенится.

И усреднять надо логарифмы множителей: log2(2) = 1; log2(0.5) = -1 , среднее 0 (это логарифм единицы) - т.е. выигрыш не растет.

Вот если бы условие звучало так:

В случае выигрыша платим 100 рублей, в случае проигрыша забираем 50 рублей - то вот это событие относится к конкретной сумме а не к увеличению/уменьшению суммы.

Аватар пользователя kv1
kv1(8 лет 7 месяцев)

Если бы он знал среднее - тогда сразу определил бы, меньшая сумма у него на руках или большая. Игра теряет смысл. 

Аватар пользователя IgnisSanat
IgnisSanat(8 лет 8 месяцев)

автор, вы бы хоть ознакомились с поньятийным аппаратом Теории Игр, что ли. Средние будут если игра с одной и той же платежной матрицей повторяется много-много раз. Тогда будут и вероятности, будет и ожидаемый выгрыш. И даже доминантный собственный вектор.

Если играет много игроков, то можно предположить, что просто подтвердится то, что большинство людей избегают риск. Как давно сформулировало одно радио на вопрос "Что лучше - демократия или мастурбация?": "Лучше *** в руке, чем ***** на горизонте".

И как расписал уважаемый Зиверт (Сиверт) - зависит от сумму. Люди рискнут охотнее малым выгрышем, чем большим в их понимании. Да, интересно экспериментально получить кривую распределения, но никто не проведет эксперимент, стоящий многие миллиарды.

Решением некоей задачей ТИ игр в чистых стратегий называется доказательство, что данная чистая стратегия является оптимальной. Или доказательство, что некая смешанная стратегия гарантирует максимальный ожидаемый выгрыш.

Начертите дерево решений, оно простое. Расставьте вероятностей, получите довольно тривиальные результаты. Игра "Монти" посложнее будет. Удачи.

Аватар пользователя kv1
kv1(8 лет 7 месяцев)

Вы вообще не туда полезли. Это не теория игр, это чистая теория вероятностей.

Скрытый комментарий Повелитель Ботов (без обсуждения)
Аватар пользователя Повелитель Ботов
Повелитель Ботов(54 года 11 месяцев)

Перспективный чат детектед! Сим повелеваю - внести запись в реестр самых обсуждаемых за последние 4 часа.

Аватар пользователя ВладимирХ
ВладимирХ(11 лет 10 месяцев)

Спасибо, интересный парадокс. Надо подумать. Начал думать, как это смоделировать на питоне и понял, что не понимаю, какое брать распределение.
Сделал так

from random import randint
def pair(x):
    return [x, 2 * x] if randint(0, 1) else [2 * x, x]
ls = [pair(randint(1,1000)) for _ in range(0,100)]
s1, s2 = 0, 0
for p in ls:
    s1 += p[0]
    s2 += p[1]
print(s1, s2)

Результат:

79199 77914

Вероятно, суть в том, что на бОльших числах выше вероятность проигрыша в "лотерее", а на малых выше вероятность выигрыша.

Но задачка поучительная.

Аватар пользователя ВладимирХ
ВладимирХ(11 лет 10 месяцев)

Вероятно, суть в том, что на бОльших числах выше вероятность проигрыша в "лотерее", а на малых выше вероятность выигрыша.

Поясню подробнее: чем больше число ты увидел, открыв конверт, тем меньше вероятность выиграть в среднем в "лотерее обмена".

Если ты знаешь диапазон (нижняя-верхняя граница) малых числе в паре, то если число оказалось больше верхней границы, то менять не надо, гарантированно проиграешь.

Аватар пользователя monk
monk(12 лет 9 месяцев)

В теории игр много таких парадоксов. Мне больше всего нравится парадокс повторяющейся дилеммы заключённого на ограниченном числе шагов.

Для бесконечного числа шагов оптимален алгоритм Аксельрода. Но если известно, что игра продлится, например 20 шагов, то на последнем шаге становится выгоднее отказывать, потому что ответить будет некому. А значит и на предпоследнем, а значит и вообще на всех шагах.

Причём этот парадокс может реализоваться и в реальности. Например, если люди живут на острове, уплыть не могут, и им становить достоверно известно, что через две недели будет извержение вулкана и все на этом острове погибнут. Поведение жителей резко меняется и практически исчезает кооперация.

Аватар пользователя ВладимирХ
ВладимирХ(11 лет 10 месяцев)

Теория игр тут ни при чем. Это чистый теорвер. И суть в том, что матожидание выигрыша не 0,25 от суммы в открытом конверте, а зависит от суммы и может быть в том числе, отрицательным.

Страницы