Материал предоставлен https://it.rfei.ru

Смешанное расширение игры

Допустим, игроки мысленно разыгрывают игру %%n%% раз и решают ориентироваться на те стратегии, которые приносят наилучшие средние выигрыши. Более точно, предположим, что за %%n%% партий первый игрок выбрал стратегии %%i = 1%%, %%i = 2%% соответственно %%m_1%% и %%m_2%% раз, и второй игрок стратегии %%j = 1%%, %%j = 2%% — соответственно %%n_1%% и %%n_2%% раз. По предположению

$$m_1 + m_2 = n, ~~ n_1 + n_2 = n.~~~~~~~~~~(5.4)$$

Подсчитаем средний выигрыш первого игрока за %%n%% партий. Если первый игрок во всех партиях использует стратегию %%i = 1%%, то его общий выигрыш составит %%a_{11}n_1 + a_{12}n_2%%. При этом средний выигрыш за одну партию равен $$ \frac{(a_{11}n_1 + a_{12}n_2)}{n} $$ и за %%m_1%% партий $$ \frac{m_1(a_{11}n_1 + a_{12}n_2)}{n}.~~~~~~~~~~~~~ (5.5) $$

Точно так же выигрыш первого игрока за %%m_2%% партий составит $$ \frac{m_2(a_{21}n_1 + a_{22}n_2)}{n}.~~~~~~~~~~~~~(5.6) $$

Суммируя выигрыши (5.5), (5.6), получим общий выигрыш $$ \frac{m_1(a_{11}n_1 + a_{12}n_2)}{n} + \frac{m_2(a_{21}n_1 + a_{22}n_2)}{n} $$ и искомый средний выигрыш $$ H = \frac{m_1(a_{11}n_1 + a_{12}n_2)}{n_2} + \frac{m_2(a_{21}n_1 + a_{22}n_2)}{n_2} ~~~~~~~~(5.7) $$ первого игрока за %%n%% партий.

Обозначим через $$ x_1 = \frac{m_1}{n}, x_2 = \frac{m_2}{ n}, y_1 = \frac{n_1}{ n}, y_2 = \frac{n_2}{ n} ,~~~~~~~~~~(5.8) $$ частоты выбора «чистых» стратегий %%i = 1%%, %%i = 2%%, %%j = 1%%, %%j = 2%% соответственно. Тогда формула (5.7) запишется в виде $$ H(x_1, x_2, y_1, y_2) = a_{11}x_1y_1 + a_{12}x_1y_2 + a_{21}x_2y_1 + a_{22}x_2y_2.~~~~(5.9)$$

Непосредственно из равенств (5.4) и определения (5.8) следует $$ \begin{array}{ll} x_1 + x_2 = 1, x_1 \geq 0, x_2 \geq 0, &~~~~~~ (5.10)\\ y_1 + y_2 = 1, y_1 \geq 0, y_2 \geq 0. &~~~~~~ (5.11) \end{array} $$

Точки %%x = (x_1, x_2)%% и %%y = (y_1, y_2)%%, отвечающие условиями (5.10) и (5.11), назовем смешанными стратегиями первого и второго игрока. Множества смешанных стратегий обозначим %%X%% и %%Y%%.

Игру %%Г%%, заданную тройкой %%X, Y, H%%, называют смешанным расширением матричной игры. Легко видеть, что, смешанное расширение однозначно строится по матрице выигрышей %%A%%.

Координатами (5.8) смешанных стратегий являются рациональные числа. Чтобы обеспечить разрешимость игры %%Г%%, определим эти координаты на более широком множестве всех действительных чисел, удовлетворяющих условиям (5.10), (5.11). Тогда множествами смешанных стратегий %%X, Y%% станут отрезки прямых на координатных плоскостях переменных %%x_1, x_2%% и %%y_1, y_2,%% и функция $$ H(x, y) \equiv H(x_1, x_2, y_1, y_2) $$ естественным образом продолжится все действительные точки отрезков. Смешанные стратегии и значения функции %%H(x, y)%% по-прежнему будем трактовать как «частоты» выбора чистых стратегий и как «средние» выигрыши.

Смешанные стратегии %%x^*, y^*%% назовем оптимальными в игре %%Г%%, если для любых стратегий %%x%%, %%y%% выполнены неравенства $$ H (x, y^*) \leq H (x^*, x^*) \leq Н (x^*, y). ~~~~~~~(5.12) $$

Левое неравенство (5.12) показывает, что стратегия %%x = x^*%% в ситуациях %%(x, y^*)%% обеспечивает первому игроку наибольший «средний» выигрыш %%H(x^*, y^*)%%. Правое неравенство означает, что в ситуациях %%(x^*, y)%% стратегия %%y = y^*%% гарантирует второму игроку минимальный проигрыш %%H(x^*, y^*)%%. В этом смысле стратегии %%x^*, y^*%% являются для игроков наилучшими.

Оптимальные стратегииРешение игры в смешанных стратегиях