Minimax - Mi ez, definíció és fogalom

A minimx a játékelméletben olyan módszer, amelynek célja a várható veszteség minimalizálása. Ehhez a játékos feltételezi, hogy ellenfele döntése kedvezőtlen lesz. Vagyis a legrosszabb forgatókönyv várható az ellenfél mozgása előtt.

Másképp fogalmazva, a minimumx módszer abból áll, hogy miként lehet a legjobb döntést hozni, feltételezve, hogy a másik játékos a legrosszabb esetet választja az Ön számára.

Figyelembe kell vennünk, hogy ez a módszer alkalmazható egy kétszemélyes játékban (két játékos), és hogy ez nem kooperatív, hanem nulla összegű játék. Ez azt jelenti, hogy amit az egyik játékos nyer, azt elveszíti a másik és fordítva. Következésképpen minden ügynök érdeke a saját hasznosságának maximalizálása, még akkor is, ha ez árt a másiknak.

Ezen a ponton arra is emlékeznünk kell, hogy a játékelmélet a matematika és a közgazdaságtan olyan ága, amely a választást tanulmányozza, amely optimalizálja az egyén helyzetét, amikor a költségeket és az előnyöket előre nem rögzítik, hanem mások döntéseitől függenek.

Minimax algoritmus a döntési fában

Láthatjuk, hogyan alkalmazzák a minimumx módszert egy több csomópontot tartalmazó döntési fában. A játék alul kezdődik, és a legfelső szinten eredménnyel zárul.

A fa tövében az ellenfél megteszi az első lépést, így a legrosszabb eredmény várható. Ezután a második szinten x játékos feladata, hogy maximalizálja a profitját, figyelembe véve az ellenfél által korábban meghozott döntést.

A harmadik szinten ismét az ellenfél sora és így tovább. Az alábbiakban bemutatunk egy példát.

Példa a Minimax algoritmusra

A következő döntési fában megmutatjuk az x játékos által elért eredményeket a játék minden pillanatában. A bázison, az első szinten az ellenfél dönt. Ezért megadják azokat a forgatókönyveket, amelyekben a játékos -10-et veszíthet vagy 5-öt nyerhet.

A második szinten x játékoson múlik, így maximalizálja a profitját. 10-es veszteség vagy 1-es nyerés között 1-et nyer. Hasonlóképpen, az 5-ös vagy 7-es nyeremény között 7-et is nyer.

Ezután ismét az ellenfélen a sor, így megadjuk azokat a forgatókönyveket, amelyekben az x játékosnak van a legrosszabb eredménye, az esettől függően -3 és 4. Végül 3-as veszteség vagy 4-es győzelem között az x játékos meghozza azt a döntést, amely lehetővé teszi ez utóbbit.

Figyelembe kell vennünk, hogy az egyes csomópontok értéke függ egy segédfunkciótól.

Tegyük fel, hogy a fa jobb megértése érdekében a döntés a termék eloszlásáról szól. A versenyző (az ellenfél) kiszervezheti az elosztást (lásd a fa bal oldalát). Ebben az esetben választania kell például az A és a B kereskedő között. Így az előbbit választja, aminek következtében az x játékos 10-et veszít (ha a B-t választja, az x-es 12-et nyer).

Az ellenfél azonban valószínűleg inkább maga terjeszti áruit, motoros járműveket bérelhet vagy teherautót vásárolhat. Mindkét forgatókönyv közül válassza az elsőt, amely kevésbé hízelgő az x játékos számára, mert 5-öt nyer, és nem 10-et.

Népszerű Bejegyzések

Németország GDP-je 0,1% -kal csökken

A német gazdaság ismét a hurrikán szemében van, és bruttó hazai terméke (GDP) 0,1% -kal esik le. Németország ismét szenved. Az első negyedév után, amelyben 0,4% -kal nőtt, a német gazdaság ismét visszaesett. A német mozdony, amely egészen a legutóbbi időkig a rugalmasság példája volt…

Thomas Cook 178 évvel később csődbe megy

Úgy tűnik, 600 000 ügyfél a parton és a fizetések felfüggesztése egy olyan nagy turisztikai vállalat szomorú vége, mint Thomas Cook. Egy 178 éves hagyománnyal rendelkező cég bukása azonban megjósolt tragédia volt. Számos olyan tünet volt, amely Thomas Cook bukását feltételezte: óriási adósság…

A Nasdaq eléri az 5000-et, ugyanolyan túlértékelt, mint 2000-ben?

A Nasdaq tegnap elérte az 5000 pontot, ezt a szintet szintén 15 évvel ezelőtt, a dot-com buborék magaslatán érte el 2000 márciusában. Olyan túlértékelt ez az index, mint akkor? A piacok ma túlértékeltek, mint más bullish időszakokban, köszönhetően a pénz beáramlásának…