A minimx a játékelméletben olyan módszer, amelynek célja a várható veszteség minimalizálása. Ehhez a játékos feltételezi, hogy ellenfele döntése kedvezőtlen lesz. Vagyis a legrosszabb forgatókönyv várható az ellenfél mozgása előtt.
Másképp fogalmazva, a minimumx módszer abból áll, hogy miként lehet a legjobb döntést hozni, feltételezve, hogy a másik játékos a legrosszabb esetet választja az Ön számára.
Figyelembe kell vennünk, hogy ez a módszer alkalmazható egy kétszemélyes játékban (két játékos), és hogy ez nem kooperatív, hanem nulla összegű játék. Ez azt jelenti, hogy amit az egyik játékos nyer, azt elveszíti a másik és fordítva. Következésképpen minden ügynök érdeke a saját hasznosságának maximalizálása, még akkor is, ha ez árt a másiknak.
Ezen a ponton arra is emlékeznünk kell, hogy a játékelmélet a matematika és a közgazdaságtan olyan ága, amely a választást tanulmányozza, amely optimalizálja az egyén helyzetét, amikor a költségeket és az előnyöket előre nem rögzítik, hanem mások döntéseitől függenek.
Minimax algoritmus a döntési fában
Láthatjuk, hogyan alkalmazzák a minimumx módszert egy több csomópontot tartalmazó döntési fában. A játék alul kezdődik, és a legfelső szinten eredménnyel zárul.
A fa tövében az ellenfél megteszi az első lépést, így a legrosszabb eredmény várható. Ezután a második szinten x játékos feladata, hogy maximalizálja a profitját, figyelembe véve az ellenfél által korábban meghozott döntést.
A harmadik szinten ismét az ellenfél sora és így tovább. Az alábbiakban bemutatunk egy példát.
Példa a Minimax algoritmusra
A következő döntési fában megmutatjuk az x játékos által elért eredményeket a játék minden pillanatában. A bázison, az első szinten az ellenfél dönt. Ezért megadják azokat a forgatókönyveket, amelyekben a játékos -10-et veszíthet vagy 5-öt nyerhet.
A második szinten x játékoson múlik, így maximalizálja a profitját. 10-es veszteség vagy 1-es nyerés között 1-et nyer. Hasonlóképpen, az 5-ös vagy 7-es nyeremény között 7-et is nyer.
Ezután ismét az ellenfélen a sor, így megadjuk azokat a forgatókönyveket, amelyekben az x játékosnak van a legrosszabb eredménye, az esettől függően -3 és 4. Végül 3-as veszteség vagy 4-es győzelem között az x játékos meghozza azt a döntést, amely lehetővé teszi ez utóbbit.
Figyelembe kell vennünk, hogy az egyes csomópontok értéke függ egy segédfunkciótól.
Tegyük fel, hogy a fa jobb megértése érdekében a döntés a termék eloszlásáról szól. A versenyző (az ellenfél) kiszervezheti az elosztást (lásd a fa bal oldalát). Ebben az esetben választania kell például az A és a B kereskedő között. Így az előbbit választja, aminek következtében az x játékos 10-et veszít (ha a B-t választja, az x-es 12-et nyer).
Az ellenfél azonban valószínűleg inkább maga terjeszti áruit, motoros járműveket bérelhet vagy teherautót vásárolhat. Mindkét forgatókönyv közül válassza az elsőt, amely kevésbé hízelgő az x játékos számára, mert 5-öt nyer, és nem 10-et.