Теория повторяемых игр
и Народная теорема:
Россия 1980–2025

Анализ взаимодействия элиты и населения через призму Folk Theorem —
от номенклатуры СССР до современного институционального пакта

Folk Theorem Повторяемые игры SPNE / Grim Trigger Три эры России Коэффициент δ СВО 2022–2025

0. Расшифровка переменных и параметров модели

Ниже — полный глоссарий всех символов, используемых в анализе. Каждая переменная связана с конкретным историческим явлением в России.

0.1 Игроки и стратегии

E
Элита
Экономически и политически доминирующая группа, контролирующая распределение ренты.
До 1991: номенклатура + КГБ. После 1991: олигархи. После 2000: «силовики» + государственные корпорации.
P
Население
Наёмные работники, средний класс, малый бизнес — получатели зарплат и потребители общественных благ.
~130–145 млн экономически активных граждан. Неоднородны, но в модели агрегируются в одного игрока.
C
Кооперация (стратегия)
Игрок придерживается «договорённости»: умеренное извлечение ренты (элита) и лояльность / уплата налогов (население).
Примеры: нефтяной пакт 2000–2013, гарантированные рабочие места СССР.
D
Отклонение (стратегия)
Игрок нарушает договорённость ради краткосрочной выгоды.
Элита: максимальный захват активов (1992–1995). Население: уход в серую экономику, эмиграция, протест.
ui(st)
Выигрыш игрока i в период t
Нормализованная утилита от политического курса в году t. В модели используются условные единицы (1–7).
Прокси: реальные доходы, Gini, доля Top-10%, оценки стабильности.
st
Профиль стратегий в период t
Пара действий (sE, sP) ∈ {C,D}² в данном раунде игры.
Четыре исхода: CC, CD, DC, DD — каждый соответствует историческому периоду.

0.2 Параметры повторяемой игры

δ
Коэффициент дисконтирования
δ ∈ [0,1]. Насколько игрок ценит будущие выигрыши относительно сегодняшних. δ = 1/(1+r), где r — ставка дисконта.
Высокий δ → длинный горизонт, кооперация выгодна.
Низкий δ → краткосрочное мышление → Nash reversion.
δ*
Критический порог кооперации
Минимальное значение δ, при котором кооперация поддерживается как SPNE:
\(\delta^* = \dfrac{\pi^{dev} - \pi^{coop}}{\pi^{dev} - \pi^{pun}}\)
Ключевое условие Folk Theorem: кооперация устойчива тогда и только тогда, когда δ ≥ δ*.
πcoop
Выигрыш при кооперации
Стабильный поток выигрышей при взаимном CC в каждом периоде.
Эра III (2000–2013): πcoop = 5 (элита), 4 (население) — нефтяная рента распределяется.
πdev
Выигрыш от однократного отклонения
Краткосрочная сверхприбыль в период отклонения (при условии, что партнёр ещё играет C).
1992–1995: πdev = 6 (залоговые аукционы — активы по 5–10% рыночной стоимости).
πpun
Выигрыш при наказании (minmax)
Выигрыш в Nash reversion — наименьший, который противник может навязать. Нижняя граница IR.
СССР: πpun ≈ 0 (тюрьма/психушка для отклонившегося). Ельцин: πpun = 1 (хаос рынка).
Σ δt ui
Дисконтированный поток выигрышей
Суммарный выигрыш в бесконечно повторяемой игре:
\(V_i = \sum_{t=0}^{\infty} \delta^t\, u_i(s_t) = \dfrac{u_i}{1-\delta}\) (при постоянных ui)
Кооперация выгодна, если Vcoop ≥ Vdev, т.е. δ ≥ δ*.

0.3 Концепции равновесия и стратегии

SPNE
Субигросовершенное равновесие Нэша
Равновесие, при котором угрозы наказания достоверны на каждом поддереве. Требование субигровой совершенности отсеивает «пустые угрозы».
Путинский пакт — SPNE: дело ЮКОСа (2003) доказало credible commitment. До этого угрозы были недостоверны.
Grim
Trigger
Стратегия гримовского триггера
Играй C вечно; при первом же D противника — переключись на D навсегда (Nash reversion). Максимальное наказание.
КГБ-триггер в СССР: единственное отклонение → арест → вечное «наказание» для отклонившегося.
TfT
Tit-for-Tat
Начни с C; затем зеркалируй действие противника в предыдущем периоде. Мягче Grim Trigger — допускает возврат к кооперации.
Путинский пакт 2000–2021 ближе к TfT: отдельные олигархи возвращались в «стабильную» зону после публичной демонстрации лояльности.
NE /
minmax
Наказание минмакс
Наименьший выигрыш, который соперник может навязать игроку i вне зависимости от действий i. Нижняя граница индивидуальной рациональности.
Стадийное NE = Nash reversion. Для элиты и населения в Эру II minmax ≈ (1,1).
Folk
Theorem
Народная теорема
Любой допустимый и индивидуально рациональный вектор выигрышей может быть поддержан как SPNE при δ, достаточно близком к 1.
Объясняет, почему «путинский пакт» был реальным равновесием, а не случайностью — при δ ≥ 0.40–0.67 он SPNE-устойчив.
IR
Индивидуальная рациональность
Условие: выигрыш в SPNE ≥ minmax для каждого игрока. Без IR игрок предпочитает «выйти из игры» (эмиграция, протест, выход капитала).
Население нарушает IR когда реальные доходы падают ниже прожиточного минимума → «выход» через эмиграцию или серую экономику.
Замечание о Ωt (связь с OLG-моделью). Суммарный коэффициент геронтократического извлечения Ωt = τ + μ + ρ + ξ из сопряжённой OLG-модели напрямую влияет на δ населения: чем выше Ωt, тем меньше горизонт планирования молодых и тем ниже δ_факт. При Ω ≥ 0.816 (Россия 2025) модель предсказывает δ_факт населения ≈ 0.40–0.45, что ниже δ* ≈ 0.55–0.58 — условие кооперации нарушено.

1. Резюме подхода

Взаимодействие элиты и населения в России — это бесконечно повторяемая игра с изменяющейся структурой стадийной игры и нестационарным δ. Стадийная игра (stage game) — взаимодействие за один период (один год или один политический цикл). Повторяемая игра — бесконечная последовательность таких взаимодействий.

Дисконтированный выигрыш игрока i в повторяемой игре
\[ V_i = \sum_{t=0}^{\infty} \delta^t\, u_i(s_t) \]
Народная теорема (Folk Theorem) — формальная формулировка

Пусть (π₁*, π₂*) — минмакс-выигрыши игроков. Тогда любой вектор выигрышей (v₁, v₂), такой что vi ≥ πi* для каждого i и принадлежащий допустимому (feasible) множеству, может быть реализован как SPNE при достаточно высоком δ.

\[ \forall\, (v_1, v_2) \in \mathcal{F},\quad v_i \geq \pi_i^* \;\Rightarrow\; \exists\, \delta^* < 1 : \forall\, \delta \geq \delta^*\; \text{SPNE реализует } (v_1, v_2) \]
Условие устойчивости кооперации (Grim Trigger)
\[ \delta \;\geq\; \delta^* \;=\; \frac{\pi^{dev} - \pi^{coop}}{\pi^{dev} - \pi^{pun}} \]

Кооперация выгодна, если приведённая стоимость будущих потерь (переход к наказанию) превышает сиюминутный выигрыш от отклонения.

1.1 Ключевой вопрос каждой эры

Для каждого исторического периода мы оцениваем три величины и проверяем условие δ ≥ δ*:

📐
Три числа, определяющих судьбу кооперации
  1. πdev — что можно получить, предав сегодня (зависит от уровня концентрации богатства, силы институтов)
  2. πcoop — стабильный выигрыш при сотрудничестве (зависит от размера «пирога» — нефтяной ренты, ВВП)
  3. πpun — выигрыш при взаимном наказании (зависит от способности элиты карать и населения сопротивляться)
Если «пирог» мал, а «кража» легка → δ* растёт → кооперация рушится.

1.2 Три эры как три стадийные игры

1980–1991
Эра I: СССР — асимметричная кооперация
Номенклатура + КГБ vs население. Grim Trigger = репрессии. δ населения искусственно занижен (нет exit option), δ элиты высокий (партийная карьера ≡ бесконечный горизонт). Кооперация принудительная, но SPNE-устойчивая.
1992–1999
Эра II: Ельцин — Nash Reversion
Шок-терапия обнулила δ у обеих сторон (горизонт ≈ 1 год). Стадийное NE = (DD). Залоговые аукционы 1995–1996 — классическое однократное отклонение. Folk Theorem не применим: δ_факт ≈ 0.30 ≪ δ* ≈ 0.65.
2000–2021
Эра III: Путин — SPNE на нефтяной ренте
Нефтяные доходы восстановили πcoop. Дело ЮКОСа (2003) создало credible commitment. δ_факт ≈ 0.80–0.85 >> δ* ≈ 0.35–0.44. Устойчивый SPNE с асимметричными выигрышами (5,4).
2022–2025
Эра IV: СВО — нестабильность
СВО сократило горизонт планирования у обеих сторон. πdev ↑ (передел активов), πcoop ↓ (санкции, эмиграция капитала) → δ* ↑ до 0.80. δ_факт ≈ 0.40–0.45. Условие SPNE нарушено — игра в зоне нестабильности.

2. Матрицы выигрышей: три стадийные игры

Рис. 1. Матрицы выигрышей по трём эрам
Рис. 1. Матрицы выигрышей (Элита, Население) для трёх стадийных игр. Жёлтым выделено Nash Equilibrium стадийной игры; зелёным — SPNE повторяемой игры.

2.1 Эра I: СССР 1980–1991

Матрица выигрышей (Элита, Население)

Население: C
конформизм
Население: D
сопротивление
Элита: C
умеренное извлечение
(4, 3) (5, 1)
Элита: D
полное извлечение
(5, 1) ← NE (0, 0)
NE стадийной игры: (CD) = (5, 1) Номенклатура всегда предпочитает D (большее извлечение) при любом действии населения. Население при угрозе репрессий предпочитает C. В повторяемой игре КГБ-триггер превращает это в принудительное «CC» с выигрышем (4,3) — элита сама ограничивает извлечение, чтобы не разрушить систему.

δ* = (5−4)/(5−0) = 0.20. δ_факт ≈ 0.85. ✅ Устойчива.

2.2 Эра II: «Дикий рынок» 1992–1999

Матрица выигрышей — Дилемма заключённого

Население: C
легальная экономика
Население: D
серая экономика / криминал
Элита: C
легитимная приватизация
(3, 3) ← Парето-опт. (0, 4)
Элита: D
захват активов
(6, 0) (1, 1) ← NE
💥
NE стадийной игры: (DD) = (1, 1) — Дилемма заключённого D — строго доминирующая стратегия для обоих игроков. Шок-терапия уничтожила механизмы достоверного наказания → Grim Trigger недостоверен → Folk Theorem не работает.

δ* = (6−3)/(6−1) = 0.60. δ_факт ≈ 0.30. ❌ Распад.
Исход: залоговые аукционы 1995, дефолт 1998, криминализация экономики.

2.3 Эра III: Путинский пакт 2000–2025

Матрица выигрышей — Координационная игра

Население: C
лояльность
Население: D
протест / эмиграция
Элита: C
стабильность + рента
(5, 4) ← SPNE* (1, 5)
Элита: D
максимальный захват
(7, 1) (2, 2) ← NE
SPNE повторяемой игры: (CC) = (5, 4) при δ ≥ δ* NE стадийной игры — (DD) = (2,2), но в бесконечно повторяемой игре при высоком δ Folk Theorem позволяет реализовать (CC). Дело ЮКОСа (2003) = credible commitment («Grim Trigger достоверен»). Нефтяная рента = высокое πcoop.

δ* = (7−5)/(7−2) = 0.40. δ_факт ≈ 0.82. ✅ Устойчива.
С 2022 (СВО): δ* → 0.80, δ_факт → 0.45. ❌ Зона нестабильности.

3. Folk Theorem: δ* и допустимое множество выигрышей

Рис. 2. δ* и Feasible Set
Рис. 2. Слева: δ* vs δ_факт по шести подпериодам (✓/✗ — кооперация устойчива/рушится). Справа: допустимое множество выигрышей (Feasible & IR set) для Эры III; стрелка — сдвиг 2022 (СВО).

3.1 Расчёт δ* по эпохам

Эпоха πdev πcoop πpun δ* δ_факт Устойчива? Исторический исход
СССР 1980–91 540 0.200.85 Стабильный авторитаризм, кооп. принудительная
Перестройка 1988–91 530 0.50→0.600.75→0.40 ✗ (к 1990) Распад SPNE → коллапс СССР
Шок-терапия 1992–95 631 0.600.30 Nash reversion (DD): криминализация, олигархи
Восстановление 1996–2000 631 0.60→0.350.30→0.78 ✗→✓ Кризис 1998 = «чистилище»; новый пакт с 2000
Нефтяной рост 2000–13 752 0.400.82 Устойчивый SPNE (5,4); рост реальных доходов
Санкции 2014–21 641.5 0.440.72 ✓ (узко) Хрупкий SPNE; стагнация, но стабильность
СВО 2022–25 732 0.800.45 Нестабильно; движение к DD

3.2 Допустимое множество и ограничения IR

Folk Theorem определяет feasible & individually rational (IR) set — совокупность всех исходов, достижимых как SPNE при δ → 1. Для Эры III этот набор ограничен снизу minmax-выигрышами (minmax = 2 для каждого игрока) и сверху — технологической границей производства.

Зона CC: (5, 4)
Путинский пакт 2000–2021. Оба игрока выше minmax. Реализуется при δ ≥ 0.40.
Зона «Элита диктует»: (7, 1)
Однократное отклонение элиты. Население у минмакс-границы. Не SPNE при δ ≥ 0.40.
Зона NE (DD): (2, 2)
Nash reversion — minmax выигрыши. Стадийное равновесие. Индивидуально рационально, но неэффективно.
СССР CC: (4, 3)
Асимметричная кооперация Эры I. Ниже (5,4), но устойчива при δ ≥ 0.20.
⚠️
Почему СВО разрушило SPNE В терминах Folk Theorem произошло одновременно три изменения: (1) πdev вырос (передел активов эмигрировавших, военные контракты); (2) πcoop упал (санкционное давление, выход иностранного капитала, рост инфляции); (3) δ_факт упал — оба игрока воспринимают горизонт игры как конечный. Суммарно: δ* прыгнул с 0.40 до 0.80, δ_факт упал с 0.82 до 0.45. Условие δ_факт ≥ δ* перестало выполняться.

4. Сводная таблица: Folk Theorem по эпохам

Эра δ_факт δ* δ ≥ δ*? Тип равновесия Триггер-стратегия Исторический исход
СССР 1980–88 0.850.20 ✓ (+0.65) Асимм. SPNE (CC с перекосом) Grim Trigger (КГБ) Стабильный авторитаризм
Перестройка 1988–91 0.400.60 ✗ (−0.20) Распад SPNE Триггер ослаб (гласность) Коллапс СССР
Шок-терапия 1992–95 0.28–0.300.65 ✗ (−0.35) Nash reversion (DD) Нет достоверного триггера Криминализация, олигархи
Восстановление 1996–2000 0.780.35 ✓ (→) переход Формирование нового пакта TfT (избирательный) Кризис 1998 = «чистилище»
Нефтяной рост 2000–13 0.82–0.850.33–0.40 ✓ (+0.45) Устойчивый SPNE (CC) Grim Trigger (ЮКОСa) Рост ВВП, лояльность
Санкции 2014–21 0.70–0.730.38–0.44 ✓ (+0.28, узко) Хрупкий SPNE TfT (ослабленный) Стагнация, но стабильность
СВО 2022–25 0.40–0.450.55–0.80 ✗ (−0.35) Нестабильно, движение к DD Grim Trigger (частичный) Неопределённость

5. Ключевые выводы

1. Folk Theorem как объяснение путинской стабильности
Высокий δ (нефтяные доходы удлиняли горизонт у обеих сторон) + достоверная угроза (дело ЮКОСа) → SPNE с выигрышами (5, 4). Это не «диктатура» в классическом смысле, а кооперативное равновесие с асимметричным распределением ренты, предсказанное Folk Theorem.
2. Проблема конечности горизонта
Если любая из сторон начинает воспринимать игру как конечную (элита: «эпоха заканчивается», население: «терять нечего»), backward induction разрушает кооперацию. СВО стало именно таким сигналом: обе стороны сократили горизонт планирования.
3. Неравенство как эндогенный фактор δ*
Рост концентрации (Top-1% = 56% богатства, Credit Suisse) повышает πdev для элиты и снижает πcoop для населения → δ* растёт. Это встроенный механизм нестабильности: успешная кооперация порождает неравенство, которое разрушает условия для этой самой кооперации.
4. Anti-Folk Theorem для больших групп
При анонимности взаимодействия (140 млн человек) Folk Theorem ослабевает: индивидуальное отклонение незаметно, Grim Trigger теряет достоверность. Именно поэтому элита нуждается в централизованных механизмах мониторинга — они восстанавливают обозримость игры и делают угрозу снова реальной.
5. Кризис как «чистилище» (Nash Reversion как переход)
Nash Reversion — не катастрофа, а механизм перехода. Кризис 1998 разрушил старую структуру выигрышей и создал условия для нового SPNE. Это подтверждает теорему: Nash reversion не «конец игры», а точка пересмотра параметров πdev, πcoop, πpun.
6. СВО 2022–2025: текущее положение
δ_факт ≈ 0.40–0.45 < δ* ≈ 0.55–0.80. Согласно Folk Theorem, кооперативный исход более не является равновесием при текущих параметрах. Игра движется к одному из трёх исходов — см. следующий раздел.

6. Три возможных траектории выхода из нестабильности

При δ_факт < δ* нынешний кооперативный исход не может сохраняться бесконечно долго. Игра движется к одному из трёх исходов. Все три не исключают друг друга — (a) может запустить (b), а (b) создаёт условия для (c).

(a)
Новый δ-шок, переформатирующий стадийную игру
Внешний или внутренний шок радикально меняет матрицу выигрышей — не игроков, а саму структуру πdev, πcoop, πpun. В результате δ* падает ниже δ_факт, и кооперация восстанавливается на новых условиях.
  • Россия 1998–2000 Дефолт и девальвация уничтожили πdev — долларовые активы стало невыгодно удерживать нелегально. Одновременно хаос поднял πpun. Суммарно δ* упал с 0.65 до 0.35 → открылось окно для путинского пакта с новой структурой выигрышей.
  • СССР 1986 Обвал нефтяных цен с $30 до $10/барр. уничтожил πcoop для номенклатуры. Вынужденная Перестройка — попытка найти новый πcoop через легитимацию. Парадокс: сам δ-шок разрушил игру быстрее, чем сложилось новое равновесие.
  • Германия 1948 Денежная реформа (введение дойчмарки) одним административным актом обнулила πdev «чёрных рынков» и создала новую матрицу с иным NE. Первый квартал после реформы — рост промышленного производства на 25%: кооперация восстановилась мгновенно.
  • Нейтральный пример Устойчивое падение цен на углеводороды ниже бюджетного баланса (~$60/барр.) на 3–5 лет автоматически изменит πcoop (бюджетные трансферты сократятся) и πdev (делить станет нечего) → снижение δ* и вынужденный поиск нового пакта с перераспределением ролей между игроками.
(b)
Nash Reversion с неопределённым исходом
Обе стороны одновременно переходят на стратегию D — стадийное NE. Nash Reversion не катастрофа: это «чистилище», после которого возможен либо возврат к кооперации на новых условиях, либо долгосрочное застревание в (DD).
  • Россия 1992–1999 Классический Nash Reversion: элита захватила активы (D), население ушло в бартер и серую экономику (D). Выигрыши (1,1) наблюдались 7 лет. Выход произошёл только через смену состава элит и внешний ценовой шок (нефть 2000+).
  • Аргентина 2001–2003 Дефолт + песификация = Nash Reversion: государство конфисковало банковские депозиты (D), население сменило 5 президентов за 2 недели (D). Стабилизация — новый пакт с иным игроком (Киршнер) лишь спустя ~3 года. δ* упал только после смены правительства.
  • Венесуэла 2013–2023 Nash Reversion без выхода: элита монополизировала нефтяную ренту (D), средний класс эмигрировал в объёме ~7 млн человек (D = exit). В отличие от России 1998, новый равновесный игрок с достаточным δ так и не появился — игра застряла в (DD). Ключевое отличие: отсутствие нового δ-шока, способного изменить матрицу.
  • Теоретически важно При Nash Reversion выигрыши падают до minmax (2,2), что формально остаётся индивидуально рациональным — ни одна сторона не нарушает IR. Именно поэтому Nash Reversion может длиться годами: никто не проигрывает относительно своего minmax-уровня, но потенциал кооперации не реализуется.
(c)
Экзогенная смена игроков, меняющая матрицу
Изменяются не стратегии внутри той же игры, а сами игроки — их состав, идентичность или функция полезности. Это меняет πdev и πpun, то есть саму матрицу, а не только позицию внутри неё.
  • СССР 1982–1985 Смена поколений в элите: Брежнев→Андропов→Черненко→Горбачёв. Каждый новый генсек приносил иной δ и иные π. Горбачёв как игрок имел иную функцию полезности (легитимность > краткосрочная рента) → матрица изменилась изнутри, без внешнего шока.
  • Польша 1989 «Круглый стол»: введение нового игрока (профсоюз «Солидарность») изменило матрицу. У нового игрока πcoop был ненулевым при условии честных выборов; у старого игрока (ПОРП) πpun при продолжении репрессий вырос из-за исчезновения советской «страховки». Итог: CC стало новым SPNE.
  • Корея 1987 Военные (игрок E) имели высокий πdev. После массовых протестов πpun резко вырос (угроза международных санкций и судебного преследования) → δ* для стратегии DD превысил δ_факт военных → добровольный переход к CC с новой конфигурацией игроков (гражданское правительство). Кооперация без δ-шока.
  • Корпоративная аналогия В компании с «токсичной культурой» (Nash Reversion между менеджментом и сотрудниками) смена собственника или совета директоров меняет πdev топ-менеджера (с «высокого» при старом собственнике до «нулевого» при новом) → кооперация восстанавливается автоматически, без изменения δ. Folk Theorem применим: изменился feasible set, а не только δ.
Теоретически важно: Смена игроков — единственный механизм, который может сдвинуть feasible set целиком, а не просто перейти к другой точке внутри него. Именно поэтому Folk Theorem, строго говоря, применим только при фиксированных игроках: когда они меняются, нужен новый анализ с новой матрицей выигрышей.
🔁
Итоговая логика: три траектории взаимосвязаны Все три траектории не являются взаимоисключающими: (a) может запустить (b), а (b) создаёт условия для (c). Именно такую последовательность мы наблюдали в России дважды: 1986→1991 (нефтяной δ-шок → Nash Reversion Перестройки → смена игроков 1991) и 1998→2000 (финансовый δ-шок → Nash Reversion кризиса → частичная смена элит и новый пакт).

Теория повторяемых игр не предсказывает, какой из трёх путей реализуется — это зависит от экзогенных шоков и координации ожиданий. Но она точно указывает: при δ_факт < δ* нынешний кооперативный исход не может сохраняться как равновесие бесконечно долго.