2. Игровые модели

2.8 Учет динамики в информированности оперирующей стороны

Исследователь операции является одним из игроков и имеет ограниченную информацию о противнике, так что не может утверждать во многих случаях, что есть седловая точка, что противник применит смешанные стратегии и преследует противоположные цели.

Вообще каждая итерация не математически определенная игра, а совокупность возможных игр в зависимости от той или иной информированности оперирующей стороны о противнике и его целях, среди которых, как правило, будет относительно мало игр с седловой точкой. Очевидно, что единственный разумный общий принцип в этих условиях для исследователя операции - принцип гарантированного результата и оптимальность в смысле максимина. Можно показать, что всякий максимин может формально трактоваться и как общее значение максимина и минимакса при некотором выборе случая информированности и множества стратегий противника.

Информация об Y появляется обычно не сразу, а по мере разви­тия операции во времени. Рассмотрим общий случай предполагаемой динамики в информированности оперирующей стороны.

Информация об Y в момент i считается состоящей в указании того, к какой из частей Ni(ai) множества N принадлежит Y. Должно быть для любого i. Далее, поскольку информация с течением времени может только увеличиваться, то каждое из Ni(ai) долж­но представлять собой сумму некоторых из Ni+1(ai+1). Стратегии X(Y) в этом случае могут быть записаны в виде

Наилучший гарантированный результат в момент принятия решения

.

Соответственно наилучшей гарантирующей стратегией будет стратегия, для которой

.

Перейдем к выбору Xk-1. Теперь платежом является функция Fk; ak - неопределенный параметр, ограниченный тем, что известно ak-1 и что ak принадлежит .

Тогда наилучший гарантированный результат на (k-1) шаге, оче­видно

.

Соответственно определяется и .

Рекурренция заканчивается определением F1(a1) и X1(a1) и окончательной гарантирующей оценкой .

Стратегия - оптимальная гарантирующая. Задача исследователя операции разбивается как бы на две зада­чи на каждом k-м шаге процесса:

  1. Исследователь должен определить критерий эффективности (на s-м шаге от начала процесса), которым является функция

    .

    Это означает, что цель операции (критерий эффективности) меняется со временем (номером шага) и исследователь операции должен выяс­нить эту динамику.

  2. На каждом s-м шаге исследователь операции должен дать алгоритм решения задачи поиска оптимального гарантирующего вектора Xs, при любых фиксированных X1,...,Xs-1 и известных {as+1} и as.

Если к моменту принятия решения о Xi будут точно известны век­торы Yj при j < i, где вектор Y составлен из Yj , то наилучший гарантированный результат в этом случае приобретает вид

(7)

В случае аналогичной информированности и противника, имеет место игра с полной информацией. В теории игр доказана известная теорема Цермело: всякая игра с полной информацией имеет седловую точку. Цена игры может быть записана в виде (7).