Loading [MathJax]/jax/output/HTML-CSS/jax.js

Материал предоставлен https://it.rfei.ru

Смешанное расширение игры

Допустим, игроки мысленно разыгрывают игру n раз и решают ориентироваться на те стратегии, которые приносят наилучшие средние выигрыши. Более точно, предположим, что за n партий первый игрок выбрал стратегии i=1, i=2 соответственно m1 и m2 раз, и второй игрок стратегии j=1, j=2 — соответственно n1 и n2 раз. По предположению

m1+m2=n,  n1+n2=n.          (5.4)

Подсчитаем средний выигрыш первого игрока за n партий. Если первый игрок во всех партиях использует стратегию i=1, то его общий выигрыш составит a11n1+a12n2. При этом средний выигрыш за одну партию равен (a11n1+a12n2)n и за m1 партий m1(a11n1+a12n2)n.             (5.5)

Точно так же выигрыш первого игрока за m2 партий составит m2(a21n1+a22n2)n.             (5.6)

Суммируя выигрыши (5.5), (5.6), получим общий выигрыш m1(a11n1+a12n2)n+m2(a21n1+a22n2)n и искомый средний выигрыш H=m1(a11n1+a12n2)n2+m2(a21n1+a22n2)n2        (5.7) первого игрока за n партий.

Обозначим через x1=m1n,x2=m2n,y1=n1n,y2=n2n,          (5.8) частоты выбора «чистых» стратегий i=1, i=2, j=1, j=2 соответственно. Тогда формула (5.7) запишется в виде H(x1,x2,y1,y2)=a11x1y1+a12x1y2+a21x2y1+a22x2y2.    (5.9)

Непосредственно из равенств (5.4) и определения (5.8) следует x1+x2=1,x10,x20,      (5.10)y1+y2=1,y10,y20.      (5.11)

Точки x=(x1,x2) и y=(y1,y2), отвечающие условиями (5.10) и (5.11), назовем смешанными стратегиями первого и второго игрока. Множества смешанных стратегий обозначим X и Y.

Игру Г, заданную тройкой X,Y,H, называют смешанным расширением матричной игры. Легко видеть, что, смешанное расширение однозначно строится по матрице выигрышей A.

Координатами (5.8) смешанных стратегий являются рациональные числа. Чтобы обеспечить разрешимость игры Г, определим эти координаты на более широком множестве всех действительных чисел, удовлетворяющих условиям (5.10), (5.11). Тогда множествами смешанных стратегий X,Y станут отрезки прямых на координатных плоскостях переменных x1,x2 и y1,y2, и функция H(x,y)H(x1,x2,y1,y2) естественным образом продолжится все действительные точки отрезков. Смешанные стратегии и значения функции H(x,y) по-прежнему будем трактовать как «частоты» выбора чистых стратегий и как «средние» выигрыши.

Смешанные стратегии x,y назовем оптимальными в игре Г, если для любых стратегий x, y выполнены неравенства H(x,y)H(x,x)Н(x,y).       (5.12)

Левое неравенство (5.12) показывает, что стратегия x=x в ситуациях (x,y) обеспечивает первому игроку наибольший «средний» выигрыш H(x,y). Правое неравенство означает, что в ситуациях (x,y) стратегия y=y гарантирует второму игроку минимальный проигрыш H(x,y). В этом смысле стратегии x,y являются для игроков наилучшими.

Оптимальные стратегииРешение игры в смешанных стратегиях