ДИНАМИ́ЧЕСКАЯ ИГРА́
-
Рубрика: Математика
-
-
Скопировать библиографическую ссылку:
ДИНАМИ́ЧЕСКАЯ ИГРА́, бескоалиционная игра, в которой игроки совместно управляют движением точки в некотором множестве $X$, называемом пространством состояний игры. Д. и. может рассматриваться как разновидность позиционных игр, характеризуемая специфич. формой как законов перехода от состояния к состоянию, так и выигрышей игроков. См. Игр теория.
Процесс Д. и. заключается в последовательном переходе от одного состояния к другому в соответствии с выбором всеми игроками управляющих воздействий; выигрыши игроков определяются всей последовательностью состояний и управлений. Типичными примерами могут служить игры на выживание (разорение), в которых игроки, обладая некоторыми начальными капиталами, последовательно разыгрывают одну и ту же бескоалиционную игру до момента разорения одного из них. Для каждого игрока $i,i=1,...,n$ ($n$ – число игроков) и каждой точки $x ∈ X$ определено множество $S_i^{(x)}$ т. н. элементарных стратегий игрока $i$ в этой точке и таким образом определено множество $S^{(x)} =S_1^{(x)}\times...×S_n^{(x)}$ элементарных ситуаций в точке $x$. На $X$ заданы известные каждому из игроков вероятностные распределения $$F(x_k∣x_1,S^{(x_1)} , ..., x_{k-1},S^{(x_{k-1}}),\\ х_j∈Х,\quad s^{(x_j)}∈S^{(x_j)},\quad j=1,...,k,\\ k=1, 2, ...,$$ определяющие закон движения управляемой точки. Партия $$P=(x_1,S^{(x_1)} , ..., x_k,S^{(x_k)} , ...)$$ в Д. и. определяется индуктивно по следующей схеме. В начальном состоянии $x_1$ каждый игрок выбирает элементарную стратегию $s_i^{(x_1)}∈S_i^{(x_1)}, i=1,...,n,$ в результате чего возникает элементарная ситуация $s^{(x_1)}$ и игра случайным образом переходит в состояние $x_2$, согласно распределению $F(x_2∣x_1,s^{(x_1)} )$. Если определён отрезок партии $(x_1,s^{(x_1)} ,...,x_{k-1})$ и образуется элементарная ситуация $s^{x_{k-1}}$, то аналогично игра переходит в состояние $x_k$, в соответствии с распределением $F(x_k∣x_1,s^{(x_1)} , ..., x_{k-1},S^{(x_{k-1})} )$. Для каждой партии $P$ определён выигрыш $h_i(P)$ игрока $i$. Функции $h_i(P)$, вообще говоря, произвольны, но чаще рассматриваются Д. и. либо с терминальным выигрышем (игра заканчивается, как только $x_k$ оказывается в т. н. терминальном множестве $X^T⊂X$ и $h_i(P)=h_i(x_k)$, где $x_k$ – последнее состояние в игре), либо с интегральным выигрышем $\left( h_i(P)=\sum_{k=1}^{\infty}h_i(x_k,s^{(x_k)}) \right)$. Обычно считается, что к очередному моменту выбора элементарной стратегии игроки знают предшествующий отрезок партии. В этом случае чистая стратегия $s_i$ игрока $i$ есть набор функций $$s_i^x(x_1,s^{(x_1)} , ..., x_{k-1},s^{(x_{k-1})} , x),$$ ставящих в соответствие отрезку партии, заканчивающемуся в $x$, элементарную стратегию $s^{(x)}_i∈S^{(x)}_i$.