Минимак - шта је то, дефиниција и концепт

Преглед садржаја:

Минимак - шта је то, дефиниција и концепт
Минимак - шта је то, дефиниција и концепт
Anonim

Минимакс је, у теорији игара, метода која има за циљ да смањи очекивани губитак. Да би то урадио, играч претпоставља да ће одлука коју је донео његов противник бити неповољна. Односно, најгори сценарио очекује се пре покрета противника.

Другим речима, метода минимак састоји се од тога како донети најбољу одлуку претпостављајући да ће други играч изабрати најгори сценарио за вас.

Морамо узети у обзир да је овај метод применљив у игри за две особе (два играча) и да није кооперативна, већ игра са нултим збиром. То значи да оно што један играч победи други губи и обрнуто. Сходно томе, сваки агент ће бити заинтересован за максимизирање сопствене корисности, чак и ако то другог штети.

У овом тренутку морамо такође запамтити да је теорија игара грана математике и економије која проучава избор који оптимизује ситуацију појединца када трошкови и користи нису унапред фиксни, већ зависе од одлука других.

Минимак алгоритам у стаблу одлука

Можемо видети како се метода минимак примењује у стаблу одлука са неколико чворова. Игра почиње од дна и завршава се резултатом на највишем нивоу.

У основи дрвета, противник прави први потез, па се очекује најгори резултат. Затим, на другом нивоу, на играчу к је који ће покушати да максимизира свој профит, узимајући у обзир одлуку коју је противник претходно донео.

На трећем нивоу је опет ред на противника и тако даље. У наставку ћемо показати пример.

Пример алгоритма Минимак

У следећем стаблу одлука приказујемо резултате које је играч к постигао у сваком тренутку игре. У основи, на првом нивоу, противник доноси одлуку. Из тог разлога су дати сценарији у којима играч може изгубити -10 или победити 5.

На другом нивоу, то је до играча к, тако да ће максимизирати свој профит. Између губитка 10 или победе 1, победит ћете 1. Исто тако, између побједе 5 или 7, добит ћете 7.

Затим, опет је ред на противника, па ће бити дати сценарији у којима играч к има најлошији резултат, -3 и 4, у зависности од случаја. Коначно, између губитка 3 или победе 4, играч к ће донети одлуку која ће омогућити ово друго.

Морамо узети у обзир да ће вредности сваког чвора зависити од функције корисности.

Да бисмо боље разумели стабло, претпоставимо да је у основи одлука о дистрибуцији производа. Такмичар (противник) може да повери дистрибуцију (видети леву страну дрвета). У том случају мора да изабере, на пример, између дилера А и Б. Дакле, он бира првог, због чега ће играч к изгубити 10 (ако је изабрао Б, играч к ће победити 12).

Међутим, можда противник радије сам дистрибуира своју робу, будући да може унајмити моторна возила или купити камион. Од оба сценарија одаберите први који је мање ласкав за играча к јер је победио 5, а не 10.