Нормальная форма игры

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

В теории игр, игра в нормальной или стратегической форме (англ. normal form) состоит из трех элементов: множества игроков, множества чистых стратегий каждого игрока, множества платежных функций каждого игрока. Таким образом, игру в нормальной форме можно представить в виде n-мерной матрицы (таблицы), элементы которой это n-мерные платежные вектора. Эта таблица называется платёжной матрицей (англ. payoff matrix).

Формальное определение

[править | править код]

Игрой в нормальной форме называется тройка , где

— множество игроков
— множество множеств чистых стратегий каждого игрока,
— множество функций платежей для каждого игрока.

У каждого игрока имеется конечный набор чистых стратегий и функция полезности (функция платежа) .

Исход игры — это комбинация чистых стратегий каждого игрока:

где .

Два игрока/две стратегии

[править | править код]
Игрок 2
L
Игрок 2
R
Игрок 1
U
4, 3 –1, –1
Игрок 1
D
0, 0 3, 4
Нормальная форма для игры с 2 игроками, у каждого из которых по 2 стратегии.

Случай двух игроков — двух чистых стратегий отображен на таблице. Чистые стратегии первого игрока: U и D. Чистые стратегии второго игрока: L и R. Если первый игрок выбирает U, а второй игрок (единовременно) выбирает L, то соответствующие платежи равны 4 и 3 (первый элемент вектора (4, 3) обозначает платеж первого игрока, а второй — платеж второго игрока в случае, если были выбраны стратегии U и L). То есть чтобы найти распределение платежей, соответствующих каждому набору сыгранных стратегий, необходимо просто найти вектор, находящийся на пересечении соответствующих рядов и колонок таблицы (ряды соответствуют стратегиям первого игрока, а колонки — стратегиям второго игрока). Сыгранная комбинация стратегий называется исходом игры. В данном примере исход игры (U, L). Все возможные исходы для этой игры: {(U, L), (U, R), (D, L), (D, R)}. Очевидно, каждая ячейка таблицы соответствует одному из возможных исходов.

Функция полезности

[править | править код]

В общем случае предполагается, что игрок имеет предпочтения на множестве исходов. То есть для каждого игрока заданы бинарные отношения между элементами этого множества. Это значит, что игрок может сравнить любые два исхода: игрок или отдает предпочтение одному из двух исходов или остаться безразличным между обоими исходами. При определенных дополнительных предположениях относительно предпочтений игрока можно показать, что существует функция полезности Неймана-Монгенштерна представляющая полезность каждого исхода как действительное число u(s), при чём если u(s)≥u(s’) <=> игрок предпочитает (или безразличен) исход s исходу s’. В нашем примере первый игрок предпочитает исход (U, L) исходу (D, R) так как 4>3.

Игры с полной/неполной информацией

[править | править код]

В играх с полной информацией описание игры известно всем игрокам (все игроки знают чистые стратегии и функции полезности всех остальных игроков). В играх с неполной информацией некоторые игроки могут не знать функции полезности других игроков (то есть не знать некоторые конкретные значения для ячеек таблицы из нашего примера).

Любая игра в экстенсивной форме может быть представлена игрой в нормальной форме (не обязательно эквивалентной). Представление игры в нормальной форме может быть использовано для нахождения доминируемых стратегий.

Литература

[править | править код]
  • Васин А. А., Морозов В. В. Теория игр и модели математической экономики. — М.: Макс-пресс, 2005. — 272 с. — ISBN 5-317-01388-7.
  • Данилов В. И. Лекции по теории игр. — М.: РЭШ, 2002. — 140 с. : ил. ISBN 5-8211-0193-X
  • Петросян Л. А., Зенкевич Н.А., Семина Е.А. Теория игр: Учебное пособие для университетов. — М.: Высш. шк., Книжный дом «Университет», 1998. — С. 304. — ISBN 5-06-001005-8, 5-8013-0007-4.