Minimax - Mi ez, definíció és fogalom

Tartalomjegyzék:

Minimax - Mi ez, definíció és fogalom
Minimax - Mi ez, definíció és fogalom
Anonim

A minimx a játékelméletben olyan módszer, amelynek célja a várható veszteség minimalizálása. Ehhez a játékos feltételezi, hogy ellenfele döntése kedvezőtlen lesz. Vagyis a legrosszabb forgatókönyv várható az ellenfél mozgása előtt.

Másképp fogalmazva, a minimumx módszer abból áll, hogy miként lehet a legjobb döntést hozni, feltételezve, hogy a másik játékos a legrosszabb esetet választja az Ön számára.

Figyelembe kell vennünk, hogy ez a módszer alkalmazható egy kétszemélyes játékban (két játékos), és hogy ez nem kooperatív, hanem nulla összegű játék. Ez azt jelenti, hogy amit az egyik játékos nyer, azt elveszíti a másik és fordítva. Következésképpen minden ügynök érdeke a saját hasznosságának maximalizálása, még akkor is, ha ez árt a másiknak.

Ezen a ponton arra is emlékeznünk kell, hogy a játékelmélet a matematika és a közgazdaságtan olyan ága, amely a választást tanulmányozza, amely optimalizálja az egyén helyzetét, amikor a költségeket és az előnyöket előre nem rögzítik, hanem mások döntéseitől függenek.

Minimax algoritmus a döntési fában

Láthatjuk, hogyan alkalmazzák a minimumx módszert egy több csomópontot tartalmazó döntési fában. A játék alul kezdődik, és a legfelső szinten eredménnyel zárul.

A fa tövében az ellenfél megteszi az első lépést, így a legrosszabb eredmény várható. Ezután a második szinten x játékos feladata, hogy maximalizálja a profitját, figyelembe véve az ellenfél által korábban meghozott döntést.

A harmadik szinten ismét az ellenfél sora és így tovább. Az alábbiakban bemutatunk egy példát.

Példa a Minimax algoritmusra

A következő döntési fában megmutatjuk az x játékos által elért eredményeket a játék minden pillanatában. A bázison, az első szinten az ellenfél dönt. Ezért megadják azokat a forgatókönyveket, amelyekben a játékos -10-et veszíthet vagy 5-öt nyerhet.

A második szinten x játékoson múlik, így maximalizálja a profitját. 10-es veszteség vagy 1-es nyerés között 1-et nyer. Hasonlóképpen, az 5-ös vagy 7-es nyeremény között 7-et is nyer.

Ezután ismét az ellenfélen a sor, így megadjuk azokat a forgatókönyveket, amelyekben az x játékosnak van a legrosszabb eredménye, az esettől függően -3 és 4. Végül 3-as veszteség vagy 4-es győzelem között az x játékos meghozza azt a döntést, amely lehetővé teszi ez utóbbit.

Figyelembe kell vennünk, hogy az egyes csomópontok értéke függ egy segédfunkciótól.

Tegyük fel, hogy a fa jobb megértése érdekében a döntés a termék eloszlásáról szól. A versenyző (az ellenfél) kiszervezheti az elosztást (lásd a fa bal oldalát). Ebben az esetben választania kell például az A és a B kereskedő között. Így az előbbit választja, aminek következtében az x játékos 10-et veszít (ha a B-t választja, az x-es 12-et nyer).

Az ellenfél azonban valószínűleg inkább maga terjeszti áruit, motoros járműveket bérelhet vagy teherautót vásárolhat. Mindkét forgatókönyv közül válassza az elsőt, amely kevésbé hízelgő az x játékos számára, mert 5-öt nyer, és nem 10-et.