ИГР ТЕО́РИЯ
-
Рубрика: Математика
-
Скопировать библиографическую ссылку:
ИГР ТЕО́РИЯ, раздел математики, изучающий математич. модели принятия решений в конфликтных ситуациях. Под конфликтной ситуацией, или просто конфликтом, понимается ситуация, в которой участвуют разл. стороны (называемые игроками), имеющие несовпадающие интересы. Мн. явления экономич., социального, правового, воен. характера содержат конфликтные ситуации разл. сложности, поэтому их математич. модели, изучаемые в И. т., весьма разнообразны.
Классы игр, основные понятия и результаты
Описание конфликтной ситуации в виде игры состоит в указании, кто и как участвует в конфликте, каковы возможные исходы конфликта, а также в какой степени участвующие в конфликте стороны заинтересованы в его исходах. Каждая игра характеризуется множеством игроков $I = \left\{ 1, ..., N \right\}$, семейством множеств $\left\{ X_i\right\}_{i∈I}$, называемых стратегиями, и семейством функций выигрыша игроков$\left\{ H_i\right\}_{i∈I}$, заданных на прямом произведении $X = X_1 × ... × X_N$ и принимающих действительные значения. Игра состоит в выборе каждым из игроков $i ∈ I$ своей стратегии $x_i ∈ X_i$, в результате игры игрок $i ∈ I$ получает выигрыш $H_i(x_1, ..., x_N)$. Предполагается, что, выбирая стратегию, каждый из игроков стремится получить максимально возможный выигрыш. Предполагается также, что выбор стратегии каждым из игроков неизвестен остальным игрокам, поэтому И. т. можно рассматривать как теорию принятия решений в условиях неопределённости.
В простейшем случае, когда $N = 2$ и $H_1 = –H_2$, игра называется антагонистич. игрой двух лиц; при этом, если множества стратегий $X_1$ и $X_2$ конечны, $X_1 = \left\{1, ..., m\right\}, \;X_2 = \left\{1, ..., n\right\}$, то игра называется матричной игрой, поскольку функцию $H_1$, называемую функцией выигрыша первого игрока, можно задать $m × n$ матрицей$$ H=\begin{bmatrix} h_{11} & ... & h_{1m} \\ & ... & \\ h_{m1} & ... & h_{mn} \end{bmatrix},$$где $h_{ij} = H_1(i, j),\; i = 1,\: ...,\: m, \: j = 1, ..., n$. Первый игрок может гарантировать себе выигрыш, равный$$v_1=\underset {i} {max}\: \underset {j} {min} \:h_{ij}$$выбирая стратегию $i_0$, при которой функция $\text{min}_jh_{ij}$ принимает макс. значение. Аналогично, выбирая стратегию $j_0$, при которой $\text{max}_ih_{ij}$ достигает минимума, второй игрок гарантирует, что его проигрыш не будет превышать$$v_2=\underset {j} {min}\: \underset {i} {max} \:h_{ij}.$$
Для любой матричной игры $v_1 ⩽ v_2$.
Если $v_1 = v_2$, то пара $(i_0,\: j_0)$ представляет собой седловую точку матрицы $H$, то есть для неё выполняются неравенства $$h_{ij_0} ⩽ h_{i_{0}j_{0}} ⩽ h_{i_{0}j}$ при всех $i = 1,\; ...,\; m,\; j = 1,\; ...,\; n$. В этом случае число называется значением (иногда ценой) игры, стратегии $i_0$ и $j_0$ называются оптимальными чистыми стратегиями соответственно первого и второго игроков, пара оптимальных стратегий называется решением игры. Оптимальные чистые стратегии существуют не для всех матричных игр. Если таких стратегий нет, то возможности игроков расширяют и оптимальные стратегии ищут в классе т. н. смешанных стратегий, т. е. в множестве стратегий, являющихся распределениями вероятностей на множествах чистых стратегий; иначе говоря, стратегиями являются распределения $p = (p_1,\: ...,\: p_m),\; p_i ⩾ 0,\; i=1,\: ...,\: m,\; p_1 +\: ...\: + p_m = 1$, для первого игрока и распределения $q = (q_1,\: ...,\: q_n),\; q_j ⩾ 0,\; j = 1,\: ...,\: n,\; q_1 +\: ...\: + q_n = 1$, для второго игрока. В качестве выигрыша первого игрока в этом расширении матричной игры рассматривается математич. ожидание выигрыша исходной игры при выборе игроками смешанных стратегий $p$ и $q$
Осн. теорема теории матричных игр, известная как теорема Неймана о минимаксе, утверждает, что в любой матричной игре существуют оптимальные смешанные стратегии $p^*$ и $q^*$ такие, что$$H(p, q^*) ⩽ H(p^*, q^*) ⩽ H(p^*, q)$$для любых $p$ и $q$, т. е. пара $(p^*,\: q^*)$ представляет собой седловую точку функции $H(p, q)$. Величина $v = H(p^*, q^*)$ называется значением (или ценой) игры (в смешанных стратегиях). Справедливы равенства$$v_2=\underset {p} {max}\: \underset {q} {min} \:H(p, q)=\underset {q} {min}\: \underset {p} {max} \:H(p, q).$$
Последнее равенство составляет содержание теоремы о минимаксе, являющейся одной из осн. теорем теории игр.
Смысл оптимальных смешанных стратегий состоит в следующем. Пусть игра повторяется $t$ раз и пусть первый игрок выбирает оптимальную смешанную стратегию , т. е. в каждой игре он выбирает чистую стратегию $i$ с вероятностью , $i = 1,\: ..., \:m$. Выигрыш первого игрока в каждой игре – случайная величина, математич. ожидание которой конечно. Среднее значение выигрыша $v_t$ за $t$ игр при росте $t$ в силу больших чисел закона и теоремы о минимаксе в пределе будет не меньше цены игры, какую бы смешанную стратегию ни выбрал второй игрок. Это среднее значение будет стремиться к $v$ по вероятности, если второй игрок выберет свою оптимальную смешанную стратегию $q^*$.
Осн. методы нахождения решения матричных игр опираются на использование методов линейного программирования.
Другим большим классом антагонистич. игр являются антагонистич. игры, называемые играми на единичном квадрате, в которых множества чистых стратегий первого и второго игроков представляют собой сегмент $[0, 1]$. К игре на единичном квадрате может быть сведена любая антагонистич. игра с множествами стратегий обоих игроков, имеющими мощность континуума. Эти игры задаются функцией выигрыша $K(х, у)$, определённой на единичном квадрате. Смешанными стратегиями игроков являются функции распределения $F(x)$ и $G(y),\; x ∈ [0,1],\; y ∈ [0,1]$. При достаточно широких условиях на функцию $K(х, у)$ выигрыш первого игрока при условии, что первый и второй игроки применяют соответственно смешанные стратегии $F$ и $G$, полагается равным$$K(F,G)=\int_{0}^{1}\int_{0}^{1}K(x,y)dF(x)dG(y)$$
и справедлива теорема о минимаксе$$\underset {F} {max}\: \underset {G} {min} \:K(F, G)=\underset {G} {min}\: \underset {F} {max} \:K(F, G),$$
т. е. существуют значение игры $v$ и оптимальные смешанные стратегии обоих игроков. Существуют игры на единичном квадрате, для которых теорема о минимаксе несправедлива.
Класс игр, в которых игроки применяют свои стратегии однократно и независимо от выбора противника, включает в себя и игры, осуществляемые путём последовательного выполнения ходов участниками. В таких играх выбор стратегии игрока состоит в указании выбора поочерёдно выполняемых ходов на основании сведений, быть может неполных, о предыдущих ходах обоих игроков, т. е. на основании сведений о текущей позиции игры, в которой принимается решение. Такие игры называются позиционными. Если при принятии решения об очередном ходе игроку известны все предыдущие ходы обоих игроков, то такая игра называется игрой с полной информацией.
В качестве примера позиционной игры с полной информацией можно привести шахматы. Т. к. правила выбора хода в любой позиции игры известны, в принципе можно выписать все стратегии обоих игроков в игре и указать результат каждой партии, сведя т. о. эту игру к матричной форме. Теорема Цермело – Неймана утверждает, что все позиционные игры с полной информацией имеют решение в чистых стратегиях. Для шахмат это означает, что если приписать победе первого игрока выигрыш, равный 1, ничьей – выигрыш, равный 0, и поражению – выигрыш, равный –1, то такая игра имеет значение в чистых стратегиях, равное 1, 0 или –1, но истинная величина этого значения неизвестна.
Потребности нахождения оптимального управления в конфликтных ситуациях привели к развитию теории позиционных игр с непрерывным временем, называемых дифференциальными играми. В дифференциальной игре предполагается, что движение управляемой системы описывается уравнением $$\frac {dx}{dt}=f(t,x,u,v)$$,
где $t$ – время, $x$ – фазовый вектор, $f(t, x, u, v)$ – некоторая функция, $u = u(t, x(t))$ и $v = v(t, x(t))$ – управляющие стратегии первого и второго игроков. В момент времени $t$ игроки располагают информацией о текущей позиции $(t, x(t))$. Выигрыш (плата) в дифференциальной игре задаётся некоторым функционалом $c(x(t),\; u(t),\; v(t))$, первый игрок стремится добиться минимально возможного, а второй – максимально возможного значения функционала. Специфика дифференциальных игр не позволяет ограничить класс допустимых стратегий $u(t,\: x(t)),\: v(t, x(t))$ гладкими функциями и использовать для нахождения траектории $x(t)$ известные методы теории обыкновенных дифференциальных уравнений. При некоторых условиях на функции, входящие в определение дифференциальной игры, игра имеет значение и оптимальные стратегии. Во 2-й пол. 20 в. глубокие связи дифференциальных игр с теорией оптимального управления были установлены Л. С. Понтрягиным, подход к дифференциальным играм как к позиционным играм с непрерывным временем разрабатывался рос. математиком Н. Н. Красовским. Для нахождения решений дифференциальных игр может быть использовано динамическое программирование.
В случае неантагонистич. игр принцип оптимальности трансформируется в требование приемлемости ситуаций. Ситуация (набор стратегий) $x = (x_1,\: ...,\: x_N)$ в неантагонистич. игре называется приемлемой для коалиции (группы игроков) $K ⊂ I$ или, иначе, $K$-оптимальной, если отклонение игроков из $K$ от своих стратегий не улучшает ситуацию с точки зрения коалиции $K$. При этом неулучшение может пониматься по-разному: как неувеличение выигрыша для всех игроков, входящих в $K$; неувеличение суммарного выигрыша всех игроков из $K$; возможность увеличения выигрыша одних игроков из $K$ лишь за счёт уменьшения выигрыша др. игроков из $K$. Для коалиции $K$ ситуация, обладающая последним из перечисленных свойств, называется оптимальной по Парето. Ситуация, приемлемая для каждой коалиции из некоторого набора коалиций $𝓚 = {K_1,\: ...,\: K_m}$, называется $𝓚$-устойчивой. Если $𝓚$ состоит из всех отд. игроков множества $I$, то $𝓚$-устойчивая ситуация называется равновесной по Нэшу. Эти понятия находят широкое применение при анализе математич. моделей конфликтных ситуаций в экономике.
Исторический очерк
Отд. соображения по поводу математич. описания конфликтных ситуаций высказывались начиная с 17 в. мн. учёными. В конкретных играх смешанные стратегии появились в нач. 18 в. Ряд по существу теоретико-игровых утверждений в эквивалентной форме был получен в разл. разделах математики, напр. П. Л. Чебышевым в теории приближения функций. В 1911 Э. Цермело описал теоретико-игровой подход к шахматной игре. В 1921 Э. Борель ввёл понятие чистых и смешанных стратегий в матричных играх, однако в полном объёме теорему о минимаксе он не доказал. Эта теорема теории матричных игр была доказана Дж. фон Нейманом в 1928. Он опубликовал ст. «К теории стратегических игр» (1928), содержащую осн. идеи совр. И. т., однако до 1944 эти идеи не получили широкого распространения. Их детальной разработке посвящена книга Дж. фон Неймана и О. Моргенштерна «Теория игр и экономическое поведение». После выхода этой книги И. т. вошла в число разделов современной математики и стала развиваться как из потребностей её экономических, социальных, правовых, военных и др. применений, так и в силу своих внутр. потребностей. В СССР И. т. развивалась в осн. ленинградской школой теории игр, созданной рос. математиком Н. Н. Воробьёвым.