ИГР ТЕО́РИЯ
-
Рубрика: Математика
-
-
Скопировать библиографическую ссылку:
Книжная версия:
Электронная версия:
ИГР ТЕО́РИЯ, раздел математики, изучающий математич. модели принятия решений в конфликтных ситуациях. Под конфликтной ситуацией, или просто конфликтом, понимается ситуация, в которой участвуют разл. стороны (называемые игроками), имеющие несовпадающие интересы. Мн. явления экономич., социального, правового, воен. характера содержат конфликтные ситуации разл. сложности, поэтому их математич. модели, изучаемые в И. т., весьма разнообразны.
Классы игр, основные понятия и результаты
Описание конфликтной ситуации в виде игры состоит в указании, кто и как участвует в конфликте, каковы возможные исходы конфликта, а также в какой степени участвующие в конфликте стороны заинтересованы в его исходах. Каждая игра характеризуется множеством игроков I={1,...,N}, семейством множеств {Xi}i∈I, называемых стратегиями, и семейством функций выигрыша игроков{Hi}i∈I, заданных на прямом произведении X=X1×...×XN и принимающих действительные значения. Игра состоит в выборе каждым из игроков i∈I своей стратегии xi∈Xi, в результате игры игрок i∈I получает выигрыш Hi(x1,...,xN). Предполагается, что, выбирая стратегию, каждый из игроков стремится получить максимально возможный выигрыш. Предполагается также, что выбор стратегии каждым из игроков неизвестен остальным игрокам, поэтому И. т. можно рассматривать как теорию принятия решений в условиях неопределённости.
В простейшем случае, когда N=2 и H_1 = –H_2, игра называется антагонистич. игрой двух лиц; при этом, если множества стратегий X_1 и X_2 конечны, X_1 = \left\{1, ..., m\right\}, \;X_2 = \left\{1, ..., n\right\}, то игра называется матричной игрой, поскольку функцию H_1, называемую функцией выигрыша первого игрока, можно задать m × n матрицей H=\begin{bmatrix} h_{11} & ... & h_{1m} \\ & ... & \\ h_{m1} & ... & h_{mn} \end{bmatrix},где h_{ij} = H_1(i, j),\; i = 1,\: ...,\: m, \: j = 1, ..., n. Первый игрок может гарантировать себе выигрыш, равныйv_1=\underset {i} {max}\: \underset {j} {min} \:h_{ij}выбирая стратегию i_0, при которой функция \text{min}_jh_{ij} принимает макс. значение. Аналогично, выбирая стратегию j_0, при которой \text{max}_ih_{ij} достигает минимума, второй игрок гарантирует, что его проигрыш не будет превышатьv_2=\underset {j} {min}\: \underset {i} {max} \:h_{ij}.
Для любой матричной игры v_1 ⩽ v_2.
Если v_1 = v_2, то пара (i_0,\: j_0) представляет собой седловую точку матрицы H, то есть для неё выполняются неравенства $h_{ij_0} ⩽ h_{i_{0}j_{0}} ⩽ h_{i_{0}j} при всех i = 1,\; ...,\; m,\; j = 1,\; ...,\; n. В этом случае число называется значением (иногда ценой) игры, стратегии i_0 и j_0 называются оптимальными чистыми стратегиями соответственно первого и второго игроков, пара оптимальных стратегий называется решением игры. Оптимальные чистые стратегии существуют не для всех матричных игр. Если таких стратегий нет, то возможности игроков расширяют и оптимальные стратегии ищут в классе т. н. смешанных стратегий, т. е. в множестве стратегий, являющихся распределениями вероятностей на множествах чистых стратегий; иначе говоря, стратегиями являются распределения p = (p_1,\: ...,\: p_m),\; p_i ⩾ 0,\; i=1,\: ...,\: m,\; p_1 +\: ...\: + p_m = 1, для первого игрока и распределения q = (q_1,\: ...,\: q_n),\; q_j ⩾ 0,\; j = 1,\: ...,\: n,\; q_1 +\: ...\: + q_n = 1, для второго игрока. В качестве выигрыша первого игрока в этом расширении матричной игры рассматривается математич. ожидание выигрыша исходной игры при выборе игроками смешанных стратегий p и q
Осн. теорема теории матричных игр, известная как теорема Неймана о минимаксе, утверждает, что в любой матричной игре существуют оптимальные смешанные стратегии p^* и q^* такие, чтоH(p, q^*) ⩽ H(p^*, q^*) ⩽ H(p^*, q)для любых p и q, т. е. пара (p^*,\: q^*) представляет собой седловую точку функции H(p, q). Величина v = H(p^*, q^*) называется значением (или ценой) игры (в смешанных стратегиях). Справедливы равенстваv_2=\underset {p} {max}\: \underset {q} {min} \:H(p, q)=\underset {q} {min}\: \underset {p} {max} \:H(p, q).
Последнее равенство составляет содержание теоремы о минимаксе, являющейся одной из осн. теорем теории игр.
Смысл оптимальных смешанных стратегий состоит в следующем. Пусть игра повторяется t раз и пусть первый игрок выбирает оптимальную смешанную стратегию , т. е. в каждой игре он выбирает чистую стратегию i с вероятностью , i = 1,\: ..., \:m. Выигрыш первого игрока в каждой игре – случайная величина, математич. ожидание которой конечно. Среднее значение выигрыша v_t за t игр при росте t в силу больших чисел закона и теоремы о минимаксе в пределе будет не меньше цены игры, какую бы смешанную стратегию ни выбрал второй игрок. Это среднее значение будет стремиться к v по вероятности, если второй игрок выберет свою оптимальную смешанную стратегию q^*.
Осн. методы нахождения решения матричных игр опираются на использование методов линейного программирования.
Другим большим классом антагонистич. игр являются антагонистич. игры, называемые играми на единичном квадрате, в которых множества чистых стратегий первого и второго игроков представляют собой сегмент [0, 1]. К игре на единичном квадрате может быть сведена любая антагонистич. игра с множествами стратегий обоих игроков, имеющими мощность континуума. Эти игры задаются функцией выигрыша K(х, у), определённой на единичном квадрате. Смешанными стратегиями игроков являются функции распределения F(x) и G(y),\; x ∈ [0,1],\; y ∈ [0,1]. При достаточно широких условиях на функцию K(х, у) выигрыш первого игрока при условии, что первый и второй игроки применяют соответственно смешанные стратегии F и G, полагается равнымK(F,G)=\int_{0}^{1}\int_{0}^{1}K(x,y)dF(x)dG(y)
и справедлива теорема о минимаксе\underset {F} {max}\: \underset {G} {min} \:K(F, G)=\underset {G} {min}\: \underset {F} {max} \:K(F, G),
т. е. существуют значение игры v и оптимальные смешанные стратегии обоих игроков. Существуют игры на единичном квадрате, для которых теорема о минимаксе несправедлива.
Класс игр, в которых игроки применяют свои стратегии однократно и независимо от выбора противника, включает в себя и игры, осуществляемые путём последовательного выполнения ходов участниками. В таких играх выбор стратегии игрока состоит в указании выбора поочерёдно выполняемых ходов на основании сведений, быть может неполных, о предыдущих ходах обоих игроков, т. е. на основании сведений о текущей позиции игры, в которой принимается решение. Такие игры называются позиционными. Если при принятии решения об очередном ходе игроку известны все предыдущие ходы обоих игроков, то такая игра называется игрой с полной информацией.
В качестве примера позиционной игры с полной информацией можно привести шахматы. Т. к. правила выбора хода в любой позиции игры известны, в принципе можно выписать все стратегии обоих игроков в игре и указать результат каждой партии, сведя т. о. эту игру к матричной форме. Теорема Цермело – Неймана утверждает, что все позиционные игры с полной информацией имеют решение в чистых стратегиях. Для шахмат это означает, что если приписать победе первого игрока выигрыш, равный 1, ничьей – выигрыш, равный 0, и поражению – выигрыш, равный –1, то такая игра имеет значение в чистых стратегиях, равное 1, 0 или –1, но истинная величина этого значения неизвестна.
Потребности нахождения оптимального управления в конфликтных ситуациях привели к развитию теории позиционных игр с непрерывным временем, называемых дифференциальными играми. В дифференциальной игре предполагается, что движение управляемой системы описывается уравнением \frac {dx}{dt}=f(t,x,u,v),
где t – время, x – фазовый вектор, f(t, x, u, v) – некоторая функция, u = u(t, x(t)) и v = v(t, x(t)) – управляющие стратегии первого и второго игроков. В момент времени t игроки располагают информацией о текущей позиции (t, x(t)). Выигрыш (плата) в дифференциальной игре задаётся некоторым функционалом c(x(t),\; u(t),\; v(t)), первый игрок стремится добиться минимально возможного, а второй – максимально возможного значения функционала. Специфика дифференциальных игр не позволяет ограничить класс допустимых стратегий u(t,\: x(t)),\: v(t, x(t)) гладкими функциями и использовать для нахождения траектории x(t) известные методы теории обыкновенных дифференциальных уравнений. При некоторых условиях на функции, входящие в определение дифференциальной игры, игра имеет значение и оптимальные стратегии. Во 2-й пол. 20 в. глубокие связи дифференциальных игр с теорией оптимального управления были установлены Л. С. Понтрягиным, подход к дифференциальным играм как к позиционным играм с непрерывным временем разрабатывался рос. математиком Н. Н. Красовским. Для нахождения решений дифференциальных игр может быть использовано динамическое программирование.
В случае неантагонистич. игр принцип оптимальности трансформируется в требование приемлемости ситуаций. Ситуация (набор стратегий) x = (x_1,\: ...,\: x_N) в неантагонистич. игре называется приемлемой для коалиции (группы игроков) K ⊂ I или, иначе, K-оптимальной, если отклонение игроков из K от своих стратегий не улучшает ситуацию с точки зрения коалиции K. При этом неулучшение может пониматься по-разному: как неувеличение выигрыша для всех игроков, входящих в K; неувеличение суммарного выигрыша всех игроков из K; возможность увеличения выигрыша одних игроков из K лишь за счёт уменьшения выигрыша др. игроков из K. Для коалиции K ситуация, обладающая последним из перечисленных свойств, называется оптимальной по Парето. Ситуация, приемлемая для каждой коалиции из некоторого набора коалиций 𝓚 = {K_1,\: ...,\: K_m}, называется 𝓚-устойчивой. Если 𝓚 состоит из всех отд. игроков множества I, то 𝓚-устойчивая ситуация называется равновесной по Нэшу. Эти понятия находят широкое применение при анализе математич. моделей конфликтных ситуаций в экономике.
Исторический очерк
Отд. соображения по поводу математич. описания конфликтных ситуаций высказывались начиная с 17 в. мн. учёными. В конкретных играх смешанные стратегии появились в нач. 18 в. Ряд по существу теоретико-игровых утверждений в эквивалентной форме был получен в разл. разделах математики, напр. П. Л. Чебышевым в теории приближения функций. В 1911 Э. Цермело описал теоретико-игровой подход к шахматной игре. В 1921 Э. Борель ввёл понятие чистых и смешанных стратегий в матричных играх, однако в полном объёме теорему о минимаксе он не доказал. Эта теорема теории матричных игр была доказана Дж. фон Нейманом в 1928. Он опубликовал ст. «К теории стратегических игр» (1928), содержащую осн. идеи совр. И. т., однако до 1944 эти идеи не получили широкого распространения. Их детальной разработке посвящена книга Дж. фон Неймана и О. Моргенштерна «Теория игр и экономическое поведение». После выхода этой книги И. т. вошла в число разделов современной математики и стала развиваться как из потребностей её экономических, социальных, правовых, военных и др. применений, так и в силу своих внутр. потребностей. В СССР И. т. развивалась в осн. ленинградской школой теории игр, созданной рос. математиком Н. Н. Воробьёвым.