Paradoks Monty Halla – problem z mylącą intuicją

Czasem lepiej zmienić podjętą wcześniej decyzję – symulacja Monte Carlo

Wstęp

W tej części zostanie rozważony problem oszacowania prawdopodobieństwa wygranej dla gry w wybór jednej z trzech bramek, gdzie tylko jedna bramka kryje nagrodę, przy czym prowadzący grę wie, gdzie znajduje się nagroda. Na początku gry gracz jest proszony o wskazanie jednej z bramek. Następnie prowadzący odkrywa losowo jedną z pozostałych, przy czym nigdy nie odkrywa bramki skrywającej nagrodę, i pyta gracza, czy chce zmienić swoją pierwotną decyzję. Okazuje się, że większość ludzi pozostaje przy swoim wyborze uważając, że w danym momencie pozostają dwie zakryte bramki i prawdopodobieństwo rozkłada się równomiernie, czyli po 50%, gdy tymczasem tak nie jest. Prawdopodobieństwo wygranej dla wariantu kiedy zmieniamy decyzję jest równe \(\frac{2}{3}\) i jest dwa razy większe, niż kiedy pozostajemy przy swoim pierwszym wyborze \(\frac{1}{3}\). Intuicja w tym przypadku podpowiada nam błędne rozwiązanie. To zjawisko nieracjonalnego zachowania ludzi w zaprezentowanej grze nazywane jest paradoksem Monty Halla.

Kod programu rozgrywki dla gracza A, który nie zmienia raz powziętej decyzji

Poniższy kod realizuje symulację przebiegu rozgrywki dla gracza, który nie zmienia raz powziętej decyzji. Kod ten ma za zadanie zilustroawnie następujących elementów rozgrywki:

  • losowy wybór bramki, za którą kryje się nagroda główna – nowy samochód,
  • losowe (pierwsze) wskazanie gracza,
  • losowe (o ile gospodarz programu ma wybór!) otwarcie jednej z bramek przegrywających
  • wynik końcowy rozgrywki przy założeniu, że gracz w dugim etapie pozostaje przy swoim pierwszym wyborze.

Żeby móc śledzić każdy z etapów rozgrywki użyto funkcji print do wypisania rezultatów poszczegolnych faz.

Klikając np. piętnastokrotnie przycisk Wykonaj pod powyższym kodem można symulacyjnie przekonać się jak często wygrywa osoba nie zmieniająca w drugim etapie gry pierwotnej decyzji (w sposób zautomatyzowany taką symulację przeprowadzimy w ostatniej części tego opracowania).

Kod programu rozgrywki dla gracza B, który w drugim etapie zawsze zmienia swój pierwotny wybór

Niewiele zmieniając w powyższym kodzie, stworzymy modyfikację symulacji rozgrywki dla gracza, który zawsze w drugim etapie korzysta z opcji zmiany pierwotnej decyzji (wystarczy zmienić linijkę, gdzie definiujemy wartość zmiennej drugie_wskazanie_graczaB):

Symulacja dla dużej liczby rozgrywek uwzględniająca oba typy graczy

W tej części rezygnujemy z wypisywania rezultatów poszczególnych faz pojedynczej rozgrywki na rzecz symulacji uwzględniającej wiele rozgrywek (np. 10 000). Będziemy przede wszystkim zliczać ile razy gracz odjeżdża nowym autem, jeśli w drugim etapie gry pozostaje przy pierwszej decyzji, a ile razy odjeżdża nowym autem jeśli w drugim etapie zmienia swój pierwotny wybór.

Jedno z możliwych wyjaśnień paradoksu Monty Halla

Kluczem do wyjaśnienia dlaczego zmiana swojej pierwotnej decyzji zwiększa dwukrotnie prawdopodobieństwo wygranej z \(\frac{1}{3}\) do \(\frac{2}{3}\) jest informacja, że gospodarz programu wie, która bramka skrywa samochód. Każdy przyzna, że na początku gry wybieramy jedną z trzech bramek i z prawdopodobieństwem \(\frac{1}{3}\) wskazujemy tę wygrywającą (samochód) a z prawdopodobieństwem \(\frac{2}{3}\) wybieramy kozę. Rozważmy więc takie dwie sytuacje:

  1. Jeśli w pierwszym naszym wyborze wskażemy bramkę, za którą jest samochód (a dzieje się tak tylko raz na trzy), to Monty Hall otworzy losowo jedną z pozostałych dwóch skrywających kozę a zmiana decyzji w drugim etapie gry skutkuje przegraną.
  2. Zauważmy jednak co się dzieje w przypadku, kiedy w pierwszym wskazaniu wybierzemy którąkolwiek z bramek, za którą znajduje się koza (a dzieje się tak dwa razy na trzy przypadki). W tej sytuacji jedna z niewybranych bramek skrywa samochód, a druga – kozę. Monty Hall nie może odkryć bramki z samochodem, więc nie ma wyboru i musi odkryć bramkę skrywającą kozę. Oznacza to, że nieotwarta i niewybrana w pierwszym etapie bramka kryje samochód i wtedy zmiana decyzji prowadzi nas do wygranej i odjeżdżamy nowym samochodem.

Tak jak to podkreślono, pierwsza z sytuacji zdarza się tylko raz na trzy a druga – dwa razy na trzy, zatem strategia zmiany decyzji prowadzi do wygranej z prawdopodobieństwem \(\frac{2}{3}\).

Uwagi końcowe

Wiele osób, włączając piszącego te słowa, w pierwszym odruchu uważa, że nie warto zmieniać pierwotnej decyzji, bo przecież i tak w drugim etapie szanse na wygraną rozkładają się po równo (po 50%) na dwie nieotwarte bramki. Pocieszeniem dla tych osób może być to, że problem jest zecydowanie sprzeczny z intuicją i wprowadza w błąd zdecydowaną większość ludzi. Eksperymenty psychologiczne symulujące rozgrywkę pokazały, że zaledwie 13% badanych osób decydowało się na zmianę decyzji w drugim etapie (a z tych 13% nie wszyscy czynili to ze świadomościa, że to zwiększa szanse wygranej). Dodatkowym pocieszeniem jest to, że nawet ,,tęgie umysły”, laureaci nagrody Nobla z fizyki, podawali błędne rozwiązanie tego problemu a nawet publicznie ubliżali w pisemnej formie osobom broniącym poprawnego rozwiązania.

Można podać również jako ciekawostkę, że wiele osób nawet po przedstawieniu któregokolwiek z wyjaśnień rozwiązania problemu Monty Halla, ,,nie wierzy” w jego poprawność i dopiero samodzielne przeprowadzenie symulacji (np. bawiąc się w domu trzema kubeczkami, z których tylko jeden skrywa jakiś cenny drobiazg) ich przekonuje. Wspomniana Marilyn vos Savant na łamach swojej kolumny zachęciła szkoły amerykańskie do przeprowadzenia tego typu symulacji na lekcjach w szkole, by zweryfikować empirycznie podane rozwiązanie. Przeprowadzono tysiące takich symulacji i niemalże w 100% wyniki potwierdziły, że opłaca się zmienić pierwotną decyzję (nietrudno się domyślić, że spośród kilku tysięcy, owych kilka ekperymentów, które nie potwierdziły rozwiązania, zostały po prostu przeprowadzone bez zachowania dyscypliny metodologicznej ekperymentu). Marilyn vos Savant otrzymała tysiące listów od nauczycieli dziękujących za inicjatywę wspaniałej i mądrej zabawy, która niezwykle zaangażowała i zintegrowała klasy i stanowiła świetny materiał do wyjaśnienia zasad ekperymentu naukowego.

Wiele osob podjęło również próby zweryfikowania poprawności rozwiązania przez symulację komputerową a nasza symulacja wpisuje się dokładnie w to podejście.

Podsumowując, jeśli ktoś Wam cytuje ,,złotą radę”, że ,,pierwsza myśl jest zawsze najlepsza”, to przykład paradoksu Monty Halla pokazuje, że to nieprawda, bo intuicja może być bardzo myląca, więc trzeba z nią uważać!