Исследователь операции является одним из игроков и имеет ограниченную информацию о противнике, так что не может утверждать во многих случаях, что есть седловая точка, что противник применит смешанные стратегии и преследует противоположные цели.
Вообще каждая итерация не математически определенная игра, а совокупность возможных игр в зависимости от той или иной информированности оперирующей стороны о противнике и его целях, среди которых, как правило, будет относительно мало игр с седловой точкой. Очевидно, что единственный разумный общий принцип в этих условиях для исследователя операции - принцип гарантированного результата и оптимальность в смысле максимина. Можно показать, что всякий максимин может формально трактоваться и как общее значение максимина и минимакса при некотором выборе случая информированности и множества стратегий противника.
Информация об Y появляется обычно не сразу, а по мере развития операции во времени. Рассмотрим общий случай предполагаемой динамики в информированности оперирующей стороны.
Информация об Y в момент i считается состоящей в указании того, к какой из частей Ni(ai) множества N принадлежит Y. Должно быть для любого i. Далее, поскольку информация с течением времени может только увеличиваться, то каждое из Ni(ai) должно представлять собой сумму некоторых из Ni+1(ai+1). Стратегии X(Y) в этом случае могут быть записаны в виде
Наилучший гарантированный результат в момент принятия решения
.
Соответственно наилучшей гарантирующей стратегией будет стратегия, для которой
.
Перейдем к выбору Xk-1. Теперь платежом является функция Fk; ak - неопределенный параметр, ограниченный тем, что известно ak-1 и что ak принадлежит .
Тогда наилучший гарантированный результат на (k-1) шаге, очевидно
.
Соответственно определяется и .
Рекурренция заканчивается определением F1(a1) и X1(a1) и окончательной гарантирующей оценкой .
Стратегия - оптимальная гарантирующая. Задача исследователя операции разбивается как бы на две задачи на каждом k-м шаге процесса:
Исследователь должен определить критерий эффективности (на s-м шаге от начала процесса), которым является функция
.
Это означает, что цель операции (критерий эффективности) меняется со временем (номером шага) и исследователь операции должен выяснить эту динамику.
Если к моменту принятия решения о Xi будут точно известны векторы Yj при j < i, где вектор Y составлен из Yj , то наилучший гарантированный результат в этом случае приобретает вид
(7) |
В случае аналогичной информированности и противника, имеет место игра с полной информацией. В теории игр доказана известная теорема Цермело: всякая игра с полной информацией имеет седловую точку. Цена игры может быть записана в виде (7).