2. Игровые модели

2.8 Учет динамики в информированности оперирующей стороны

Исследователь операции является одним из игроков и имеет ограниченную информацию о противнике, так что не может утверждать во многих случаях, что есть седловая точка, что противник применит смешанные стратегии и преследует противоположные цели.

Вообще каждая итерация не математически определенная игра, а совокупность возможных игр в зависимости от той или иной информированности оперирующей стороны о противнике и его целях, среди которых, как правило, будет относительно мало игр с седловой точкой. Очевидно, что единственный разумный общий принцип в этих условиях для исследователя операции - принцип гарантированного результата и оптимальность в смысле максимина. Можно показать, что всякий максимин может формально трактоваться и как общее значение максимина и минимакса при некотором выборе случая информированности и множества стратегий противника.

Информация об Y появляется обычно не сразу, а по мере развития операции во времени. Рассмотрим общий случай предполагаемой динамики в информированности оперирующей стороны.

Информация об Y в момент i считается состоящей в указании того, к какой из частей N_i(a_i) множества N принадлежит Y. Должно быть для любого i. Далее, поскольку информация с течением времени может только увеличиваться, то каждое из N_i(a_i) должно представлять собой сумму некоторых из N_i+1(a_i+1). Стратегии X(Y) в этом случае могут быть записаны в виде

Наилучший гарантированный результат в момент принятия решения

Соответственно наилучшей гарантирующей стратегией будет стратегия, для которой

Перейдем к выбору X_k-1. Теперь платежом является функция F_k; a_k - неопределенный параметр, ограниченный тем, что известно a_k-1 и что a_k принадлежит .

Тогда наилучший гарантированный результат на (k-1) шаге, очевидно

Соответственно определяется и .

Рекурренция заканчивается определением F₁(a₁) и X₁(a₁) и окончательной гарантирующей оценкой .

Стратегия - оптимальная гарантирующая. Задача исследователя операции разбивается как бы на две задачи на каждом k-м шаге процесса:

Исследователь должен определить критерий эффективности (на s-м шаге от начала процесса), которым является функция
.
Это означает, что цель операции (критерий эффективности) меняется со временем (номером шага) и исследователь операции должен выяснить эту динамику.
На каждом s-м шаге исследователь операции должен дать алгоритм решения задачи поиска оптимального гарантирующего вектора X_s, при любых фиксированных X₁,...,X_s-1 и известных {a_s+1} и a_s.

Если к моменту принятия решения о X_i будут точно известны векторы Y_j при j < i, где вектор Y составлен из Y_j , то наилучший гарантированный результат в этом случае приобретает вид

(7)

В случае аналогичной информированности и противника, имеет место игра с полной информацией. В теории игр доказана известная теорема Цермело: всякая игра с полной информацией имеет седловую точку. Цена игры может быть записана в виде (7).