Детская энциклопедия




Меню сайта




Реклама











Примеры конечных игр. Принцип минимакса

Приведем несколько примеров конечных игр. Каждую из них мы запишем в нормаль­ной форме.

Пример 1. Рассматривается игра, ко­торую назовем «Поиск». В ней участвуют две стороны: К и С. К хочет найти С; С, наоборот, хочет спрятаться от К.

У С есть два места — убежища I и II, где он может прятаться. Выбирает он себе любое убежище. Игрок К по правилам игры тоже может искать С, где ему вздумается. Если он нашел С, С проиграл одно очко, если не нашел, т. е. пошел не в то убежище, где спрятался Г, то, наоборот, К проиграл одно очко. Тре­буется записать игру в нормальной форме.

Решение. У К две стратегии:

К1— искать в убежище I,

К2— искать в убежище II.

У С — тоже две стратегии:

С1 — прятаться в убежище I,

С2 — прятаться в убежище II. Игра конечная — 2x2, матрица игры будет:

 

 

 

К этой игре мы еще вернемся в дальнейшем и найдем ее решение. А пока что просто порас­суждаем за игрока К. Представим себе, что мы игрок К и что нам предлагается выбрать себе стратегию. Что ж, попробуем! Выберем, на­пример, K1, т. е. будем искать всегда в убе­жище I. Но тогда разумный противник через несколько партий догадается о нашей страте­гии и будет прятаться там, где мы его не ищем,

т. е. в убежище II. Плохо! Выберем стратегию К2. Ничуть не лучше: противник снова дога­дается и будет прятаться в убежище I. Что же нам делать? Попробуем применять стратегии К1 и K2 попеременно, через одну партию игры. Но ведь противник и об этом может догадать­ся и будет прятаться каждый раз не там, где мы его ищем. Как ни кинь — все клин! Что же, значит, наше положение безвыходно? При лю­бом выборе стратегии нам придется проигры­вать? Выходит, что так.

Давайте теперь встанем на точку зрения противника. С удивлением мы обнаружим, что его положение — ничуть не лучше нашего! Какую бы стратегию он ни выбрал — все ему невыгодно.

Позже мы с вами решим эту игру, т. е. найдем пару оптимальных стратегий К и С. Впрочем, о них можно по секрету сообщить заранее: каждому игроку надо будет чере­довать свои стратегии, но не регулярно (че­рез одну), а случайным образом (например, подбросить монету и, если она упа­дет гербом, искать в убежище I, а если цифрой — в убежище II). Аналогично должен будет дей­ствовать и С. При этом в среднем на одну пар­тию будет приходиться нулевой выигрыш (цена этой игры будет равна нулю): К не будет ни выигрывать, ни проигрывать. Не очень при­ятно, но все-таки много лучше, чем всегда быть в проигрыше!

Здесь мы впервые столкнулись с одним из важных понятий теории игр — с понятием смешанной стратегии, т. е. чере­дования нескольких «чистых» стратегий по слу­чайному закону в определенных пропорциях, или, как говорят, с определенными часто­там и. В данном примере каждая из страте­гий применяется с частотой 1/2.

Рассмотрим теперь другую игру, решение которой уже не будет столь очевидным.

Пример 2. Игра «Три пальца».

Два игрока К и С одновременно и не сгова­риваясь показывают друг другу один, два или три пальца. Если всего показанных пальцев (первым и вторым вместе) будет четное число, то выигрывает К: он получает столько очков, сколько всего было пальцев, если нечетное — выигрывает С, на тех же условиях. Требуется записать игру в нормальной форме.

Решение. Перенумеруем стратегии по числу показанных пальцев. Игра 3x3. Матрица игры будет:

 

 

Поразмыслим немного над стратегиями каж­дой стороны. Станем сначала на сторону К. Предположим, что мы выбрали стратегию К1. Что будет делать противник? Он разумен и хо­чет отдать поменьше. Ясно, он выберет страте­гию C2; наш выигрыш при этом будет равен -3, т. е. мы потеряем 3 очка. Плоховато! За­пишем число -3 против первой строки в доба­вочном столбце (см. матрицу (3).

Попробуем другую стратегию — К2. На нее разумный противник ответит С3. Мы тогда потеряем 5 очков. Еще хуже! Третья страте­гия — К3 — дает точно тот же результат: вы­игрыш (-5).

Что же делать? Пожалуй, лучше других будет все-таки стратегия К1 — при ней мы по крайней мере не проиграем больше 3 очков! Ведь против этой стратегии стоит максималь­ное число дополнительного столбца — мы его отметили звездочкой.

Выбрав стратегию К1, мы гарантируем себе, что, как бы ни вел себя противник, мы никак не проиграем больше 3 очков (т. е. не выиграем мень­ше (-3) очков). Величина (-3) есть макси­мальный гарантированный выигрыш, который мы («красные») можем себе обеспечить, приме­няя только одну-единственную стратегию. Та­кой стратегией должна быть К1.

Как мы получили (-3)? Нашли минимум каждой строки и из этих минимумов взяли мак­симальный. Эта величина называется максимином или нижней ценой игры. Будем обозначать ее a.

Подумаем теперь за противника. Он тоже хочет отдать поменьше, а получить побольше. Но, какую бы он стратегию ни выбрал, мы («красные») поведем себя таким образом, чтобы получить с него побольше. Значит, противник («синие») должен в каждом столбце выписать не минимальное, а максимальное число (см. ниж­нюю добавочную строку в матрице (3).

Из этих максимумов он должен найти ми­нимальный, так называемый минимакс или верхняя цена игры, которую мы обозначим β. Эта величина в нашем случае равна 4 и отмечена звездочкой. Чтобы не проиграть больше 4, «синие» должны придерживаться любой из своих двух стратегий С1, С2.

Значит, если каждому участнику предлагается выбрать одну-единственную стратегию, то эти стратегии должны быть: К1 для «крас­ных» и С1 или C2 для «синих».Как мы выбрали эти стратегии? Руководствуясь принципом осторожности, который говорит: в игре веди себя так, чтобы получить наибольшую выгоду при наихудших для тебя действиях противника. Этот принцип называется принципом минимакса и является в теории игр основным.

Применяя этот принцип, мы пока что реко­мендовали игроку К показывать один па­лец, игроку С — показывать один или два пальца.

Но нашли ли мы решение игры, т. е. та­кую пару стратегий, которая является равновесным положением? Легко убедиться, что нет. Найденные нами стратегии обладают досадным свойством: они неустойчивы. Действительно, пусть оба игрока дер­жатся рекомендованных чистых стратегий: К1 и, скажем, С1. Пока оба держатся этих стратегий, выигрыш будет равен 2, т. е. на каж­дую партию игры С проигрывает К два очка. К, может быть, и доволен, но С досадно. Он не хочет проигрывать. Допустим, он откуда-то узнал, что мы придерживаемся стратегии К1. Что он будет делать? Разумеется, немедленно перейдет к стратегии С2 и будет получать по 3 очка, т. е. сведет наш выигрыш к -3. А если мы теперь узнаем о поведении С? Перейдем на стратегию К2. В ответ на это С переидет на С3 и т. д.

Мы убедились, что пара стратегий, выте­кающих из принципа минимакса, неустой­чива: стоит одному игроку узнать, что делает другой, как равновесие нарушается...

Всегда ли это будет так? Оказывается, не всегда.





 
 
----------------------------------------------------
Календарь
«  Сентябрь 2017  »
ПнВтСрЧтПтСбВс
    123
45678910
11121314151617
18192021222324
252627282930

Реклама
  • Цена отделки балкона в челябинске idealbalkon.ru.

  • Новые статьи
    Каталог статей
    Как подготовить ребенка к школе
    Освоение навыков чтения
    Природные материалы на уроках труда

    Статистика






     
    Адрес почты Вопросы по рекомендациям, размещению рекламы и обратных ссылок обращайтесь pochta@enciklopediya1.ru
    2013 © 2017