У дома · други · Равновесие на Наш. Теория на игрите за икономисти (Джон Наш). Теория на играта

Равновесие на Наш. Теория на игрите за икономисти (Джон Наш). Теория на играта

И кибернетиката, особено с интерес към интелигентните агенти.

История

Оптимални решенияили стратегии в математическото моделиране са били предложени още през 18 век. Проблеми на производството и ценообразуването в олигопол, който по-късно се превърна в примери от учебницитеориите на игрите се разглеждат през 19 век. А. Курно и Ж. Бертран. В началото на 20в. Е. Ласкер, Е. Зермело, Е. Борел излагат идеята за математическа теория на конфликта на интереси.

Математическата теория на игрите произхожда от неокласическата икономика. Математическите аспекти и приложения на теорията са очертани за първи път в класическата книга от 1944 г. на Джон фон Нойман и Оскар Моргенщерн, Теория на игрите и икономическо поведение. Теория на игрите и икономическото поведение).

Тази област на математиката е намерила известно отражение в обществената култура. През 1998 г. американската писателка и журналистка Силвия Назар издава книга за съдбата на Джон Неш, нобелов лауреат по икономика и учен в областта на теорията на игрите; и по книгата е направен филмът „Игри на ума“. Някакъв американец телевизионни предавания, като „Приятел или враг“, „Псевдоним“ или „NUMB3RS“, периодично препращат към теорията в своите епизоди.

Математическата теория на игрите сега се развива бързо и се обмислят динамични игри. Въпреки това, математическият апарат на теорията на игрите е скъп. Използва се за оправдани задачи: политика, икономика на монополите и разпределение на пазарната власт и др. Редица известни учени станаха Нобелови лауреати по икономика за приноса им в развитието на теорията на игрите, която описва социално-икономическите процеси. Дж. Наш, благодарение на изследванията си в теорията на игрите, стана един от водещите експерти в областта на Студената война, което потвърждава мащаба на проблемите, с които се занимава теорията на игрите.

Представяне на играта

Игрите са строго определени математически обекти. Играта се формира от играчите, набор от стратегии за всеки играч и индикация за печалби, или плащания, играчи за всяка комбинация от стратегии. Повечето кооперативни игри се описват с характерна функция, докато за други видове по-често се използва нормалната или разширената форма. Характеристики на играта като математически модел на ситуацията:

  1. присъствие на няколко участника;
  2. несигурност в поведението на участниците, свързана с наличието на няколко възможности за всеки от тях;
  3. разлика (несъответствие) на интересите на участниците;
  4. взаимосвързаността на поведението на участниците, тъй като резултатът, получен от всеки от тях, зависи от поведението на всички участници;
  5. наличието на правила за поведение, известни на всички участници.

Разширена форма

Основна статия: Разширена форма на играта

Игрите в разширена или разширена форма са представени като насочено дърво, където всеки връх съответства на ситуацията, когато играчът избира своята стратегия. На всеки играч се присвоява цяло ниво от върхове. Плащанията се записват в долната част на дървото, под всяко връх на листа.

Картината вляво е игра за двама играчи. Играч 1 отива първи и избира стратегия F или U. Играч 2 анализира позицията си и решава дали да избере стратегия A или R. Най-вероятно първият играч ще избере U, а вторият - A (за всеки от тях това оптимални стратегии); тогава ще получат съответно 8 и 2 точки.

Обширната форма е много визуална и е особено полезна за представяне на игри с повече от двама играчи и игри с последователни ходове. Ако участниците правят едновременни ходове, тогава съответните върхове се свързват с пунктирана линия или се очертават с плътна линия.

Нормална форма

Играч 2
стратегия 1
Играч 2
стратегия 2
Играч 1
стратегия 1
4 , 3 –1 , –1
Играч 1
стратегия 2
0 , 0 3 , 4
Нормална форма за игра с 2 играчи, всеки с 2 стратегии.

В нормална или стратегическа форма играта е описана платежна матрица. Всяка страна (по-точно измерение) на матрицата е играч, редовете определят стратегиите на първия играч, а колоните определят стратегиите на втория. В пресечната точка на двете стратегии можете да видите печалбите, които играчите ще получат. В примера вдясно, ако играч 1 избере първата стратегия, а играч 2 избере втората стратегия, тогава в пресечната точка виждаме (−1, −1), което означава, че в резултат на хода и двамата играчи са загубили една точка.

Играчите избраха стратегии с максимален резултат за себе си, но загубиха поради непознаване на хода на другия играч. Обикновено игрите са представени в нормална форма, в която се правят ходове едновременно, или поне се предполага, че всички играчи не знаят какво правят другите участници. Такива игри мечта пълна информация ще бъдат разгледани по-долу.

Характерна функция

В кооперативните игри с прехвърляема полезност, тоест възможността за прехвърляне на средства от един играч на друг, е невъзможно да се приложи концепцията индивидуални плащания. Вместо това се използва така наречената характеристична функция, която определя изплащането на всяка коалиция от играчи. Приема се, че печалбата на празната коалиция е нула.

Основата за този подход може да се намери в книгата на фон Нойман и Моргенщерн. Изучавайки нормалната форма за коалиционни игри, те разсъждават, че ако игра с две страни формира коалиция ° С, тогава коалицията се противопоставя н \ ° С. Това е като игра за двама играчи. Но тъй като има много варианти за възможни коалиции (а именно 2 н, Където н- брой играчи), след това печалбите за ° Сще има някои характерно количество, в зависимост от състава на коалицията. Формално, игра в тази форма (наричана още TU игра) е представена от двойка (N, v), Където н- набор от всички играчи, и v: 2 N → Р е характерна функция.

Тази форма на представяне може да се използва за всички игри, включително тези без прехвърляема полезност. В момента има начини за преобразуване на всяка игра от нормална форма в характерна форма, но обратната трансформация не е възможна във всички случаи.

Приложение на теорията на игрите

Теорията на игрите като един от подходите в приложната математика се използва за изучаване на поведението на хора и животни различни ситуации. Първоначално теорията на игрите започва да се развива в рамките на икономическата наука, което дава възможност да се разбере и обясни поведението на икономическите агенти в различни ситуации. По-късно обхватът на теорията на игрите беше разширен до други социални науки; Теорията на игрите в момента се използва за обяснение на човешкото поведение в политическите науки, социологията и психологията. Анализът на теорията на игрите е използван за първи път за описание на поведението на животните от Роналд Фишър през 30-те години на миналия век (въпреки че дори Чарлз Дарвин е използвал идеи на теорията на игрите без формална обосновка). Терминът "теория на игрите" не се появява в работата на Роналд Фишър. Въпреки това работата по същество беше извършена в съответствие с теоретико-игровия анализ. Развитието на икономиката е приложено от Джон Мейнард Смит в книгата му „Еволюция и теория на игрите“. Теорията на игрите не се използва само за прогнозиране и обяснение на поведението; Правени са опити да се използва теорията на игрите за разработване на теории за етично или стандартно поведение. Икономисти и философи са използвали теорията на игрите, за да по-добро разбиранедобро (достойно) поведение.

Описание и моделиране

Теорията на игрите първоначално е била използвана за описване и моделиране на поведението на човешките популации. Някои изследователи смятат, че чрез определяне на равновесието на подходящите игри те могат да предвидят поведението на човешките популации в ситуации на реална конфронтация. Този подход към теорията на игрите наскоро беше критикуван по няколко причини. Първо, предположенията, използвани при моделирането, често се нарушават Истински живот. Изследователите могат да приемат, че играчите избират поведение, което максимизира общата им полза (икономическият човешки модел), но на практика човешкото поведение често не отговаря на това предположение. Има много обяснения за този феномен - ирационалност, симулация на дискусии и дори различни мотиви на играчите (включително алтруизъм). Авторите на модели на теория на игрите се противопоставят на това, като казват, че техните предположения са подобни на подобни предположения във физиката. Следователно, дори ако техните предположения не винаги са изпълнени, теорията на игрите може да се използва като разумен идеален модел, подобен на същите модели във физиката. Теорията на игрите обаче получи нова вълна от критики, когато експериментите разкриха, че хората не следват стратегиите за равновесие на практика. Например в игрите „Стоножка“ и „Диктатор“ участниците често не използват стратегическия профил, който представлява равновесието на Наш. Дебатът за значението на подобни експерименти продължава. Друго мнение е, че равновесието на Неш не е прогноза за очакваното поведение, то само обяснява защо популациите, които вече са в равновесие на Неш, остават в това състояние. Въпреки това, въпросът как тези популации достигат до равновесието на Наш остава открит. Някои изследователи се обърнаха към еволюционната теория на игрите, за да отговорят на този въпрос. Моделите на еволюционната теория на игрите предполагат ограничена рационалност или ирационалност на играчите. Въпреки името си, еволюционната теория на игрите не се занимава толкова много с въпроси естествен подбор биологични видове. Този клон на теорията на игрите изучава модели на биологични и културна еволюция, както и модели на учебния процес.

Нормативен анализ (определяне на най-доброто поведение)

От друга страна, много изследователи разглеждат теорията на игрите не като инструмент за прогнозиране на поведението, а като инструмент за анализиране на ситуации, за да се идентифицира най-доброто поведение за рационален играч. Тъй като равновесието на Наш включва стратегии, които са най-добрият отговор на поведението на другия играч, използването на концепцията за равновесие на Наш за избор на поведение изглежда доста разумно. Въпреки това, това използване на модели на теория на игрите също е критикувано. Първо, в някои случаи е изгодно за играча да избере стратегия, която не е част от равновесието, ако очаква, че другите играчи също няма да следват равновесните стратегии. Второ, известната игра „Дилемата на затворника“ ни позволява да дадем още един контрапример. В дилемата на затворника преследването на личен интерес води до това, че и двамата играчи се оказват в по-лоша ситуация, отколкото ако бяха пожертвали личния си интерес.

Видове игри

Кооперативни и некооперативни

Играта се нарича кооперативна, или коалиция, ако играчите могат да се обединяват в групи, като поемат някои задължения към други играчи и координират действията си. Това се различава от игрите без сътрудничество, в които всеки трябва да играе сам. Развлекателни игрирядко са кооперативни, но подобни механизми не са необичайни в ежедневието.

Често се приема, че това, което прави кооперативните игри различни, е способността на играчите да общуват помежду си. Като цяло това не е вярно. Има игри, в които комуникацията е разрешена, но играчите преследват лични цели и обратното.

От двата вида игри некооперативните описват ситуации в най-малките детайлии дава по-точни резултати. Кооперациите разглеждат процеса на играта като цяло. Опитите за комбиниране на двата подхода дадоха значителни резултати. Т.нар Програма Нашвече е намерил решения за някои кооперативни игри като равновесни ситуации на некооперативни игри.

Хибридните игри включват елементи на кооперативни и некооперативни игри. Например, играчите могат да формират групи, но играта ще се играе в стил без сътрудничество. Това означава, че всеки играч ще преследва интересите на своята група, като в същото време се опитва да постигне лична изгода.

Симетрични и асиметрични

А Б
А 1, 2 0, 0
Б 0, 0 1, 2
Асиметрична игра

Основна статия: Симетрична игра

Играта ще бъде симетрична, когато съответните стратегии на играчите са равни, тоест те имат еднакви плащания. С други думи, ако играчите могат да си сменят местата и техните печалби за едни и същи ходове няма да се променят. Много от изследваните игри за двама играчи са симетрични. По-специално това са: „Дилемата на затворника“, „Лов на елени“, „Ястреби и гълъби“. Асиметричните игри включват „Ултиматум“ или „Диктатор“.

В примера вдясно играта на пръв поглед може да изглежда симетрична поради подобни стратегии, но това не е така - в крайна сметка печалбата на втория играч със стратегически профили (A, A) и (B, B) ще бъде по-голям от този на първия.

Нулева и ненулева сума

Игри с нулева сума- специален сорт игри с постоянна сума, тоест такива, при които играчите не могат да увеличат или намалят наличните ресурси или игровия фонд. В този случай сборът от всички печалби е равен на сбора от всички загуби за всеки ход. Погледнете надясно - числата представляват плащания към играчите - и тяхната сума във всяка клетка е нула. Примери за такива игри включват покер, където един печели всички залози на останалите; reversi, където фигурите на противника се залавят; или банално кражба.

Много игри, изучавани от математиците, включително вече споменатата „Дилемата на затворника“, са от различен вид: в игри с ненулева сумаПобедата на един играч не означава непременно загуба на друг и обратното. Резултатът от такава игра може да бъде по-малък или по-голям от нула. Такива игри могат да бъдат превърнати в нулева сума - това става чрез въвеждане фиктивен играч, който „присвоява“ излишъка или компенсира липсата на средства.

Друга игра с ненулева сума е търговия, където всеки участник печели. Широка известен пример, където намалява, е

Забавен пример за приложение на теорията на игрите е във фентъзи книгата „Смелият голем“ на Антъни Пиърс.

Много текст

„Смисълът на това, което ще ви демонстрирам на всички“, започна Гранди, „е да се постави необходимо количествоточки. Резултатите могат да бъдат много различни - всичко зависи от комбинацията от решения, взети от участниците в играта. Да предположим например, че всеки участник свидетелства срещу друг играч. В този случай всеки участник може да получи една точка!
- Една точка! – каза Морската вещица, проявявайки неочакван интерес към играта. Очевидно магьосницата искаше да се увери, че големът няма шанс да направи демона Ксант щастлив с него.
– А сега да приемем, че всеки от участниците в играта не свидетелства срещу своя приятел! – продължи Гранди. – В този случай всеки може да получи три точки. Искам специално да отбележа, че докато всички участници действат по един и същи начин, те получават еднакъв брой точки. Никой няма предимство пред друг.
- Три точки! - каза втората вещица.
– Но сега имаме право да предположим, че един от играчите е започнал да свидетелства срещу втория, но вторият все още мълчи! - каза Грънди. - В случая този, който дава това свидетелство, получава наведнъж пет точки, а този, който мълчи, не получава нито една точка!
- да! – възкликнаха в един глас и двете вещици, облизвайки хищнически устни. Беше ясно, че и двамата очевидно щяха да вземат пет точки.
– Все си губех очилата! – възкликна демонът. – Но вие само очертахте ситуацията, а още не сте представили начин за разрешаването й! И така, каква е вашата стратегия? Няма нужда да губите време!
- Чакай, сега ще ти обясня всичко! - възкликна Гранди. „Всеки от нас четиримата – има двама голема и две вещици – ще се бие срещу нашите противници. Разбира се, вещиците ще се опитат да не отстъпват на никого в нищо...
- Със сигурност! – отново възкликнаха двете вещици в един глас. Те перфектно разбраха голема от един поглед!
„И вторият голем ще следва моята тактика“, продължи спокойно Гранди. Той погледна своя двойник. - Разбира се, знаеш ли?
- Да, разбира се! Аз съм вашето копие! Разбирам много добре какво мислиш!
- Това е страхотно! В такъв случай нека направим първия ход, за да може демонът да види всичко сам. Ще има няколко рунда във всяка битка, така че цялата стратегия да може да бъде напълно реализирана и да създаде впечатление за цялостна система. Може би трябва да започна.

– Сега всеки от нас трябва да отбележи своите листчета! – обърна се големът към вещицата. – Първо трябва да нарисувате усмихнато лице. Това ще означава, че няма да свидетелстваме срещу друг затворник. Можете също така да нарисувате намръщено лице, което означава, че мислим само за себе си и необходими четенияДаваме го на наш приятел. И двамата осъзнаваме, че би било по-добре никой да не се оказва същото намръщено лице, но от друга страна, намръщеното лице получава известни предимства пред усмихнатото! Но въпросът е, че всеки от нас не знае какво ще избере другият! Няма да разберем, докато нашият партньор не разкрие рисунката си!
- Започвай, копеле! – изруга вещицата. Тя, както винаги, не можеше без обидни епитети!
- Готов! - възкликна Грънди, рисувайки голямо усмихнато лице на листчето си, така че вещицата да не може да види какво е нарисувал там. Вещицата я накара да се движи, като също направи физиономия. Човек трябва да си помисли, че тя със сигурност направи нелюбезно лице!
„Е, сега всичко, което трябва да направим, е да си покажем рисунките един на друг“, обяви Гранди. Обръщайки се назад, той отвори рисунката за обществеността и я показа във всички посоки, така че всички да могат да видят рисунката. Измърморвайки нещо недоволно, Морската вещица направи същото.
Както очакваше Грънди, от рисунката на вещицата се появи гневно, недоволно лице.
„Сега вие, скъпи зрители“, каза тържествено Грънди, „виждате, че вещицата избра да свидетелства срещу мен.“ Няма да го направя. Така Морската вещица отбелязва пет точки. И съответно не получавам нито една точка. И тук…
През редиците от зрители отново се разнесе лек шум. Всички явно симпатизираха на голема и страстно искаха Морската вещица да загуби.
Но играта току-що започна! Само ако стратегията му беше правилна...
– Сега можем да преминем към втори кръг! – тържествено обяви Гранди. – Трябва да повторим движенията отново. Всеки рисува лицето, което му е най-близо!
Така и направиха. Сега Гранди имаше мрачно, недоволно лице.
Веднага след като играчите показаха рисунките си, публиката видя, че и двамата вече правят ядосани физиономии.
- По две точки! - каза Грънди.
- Седем две в моя полза! – радостно извика вещицата. — Няма да излезеш оттук, копеле!
- Да започнем отначало! - възкликна Гранди. Те направиха друга рисунка и ги показаха на публиката. Отново същите ядосани лица.
– Всеки от нас повтори предишния ход, държеше се егоистично и затова, струва ми се, е по-добре да не даваме точки на никого! - каза големът.
– Но все пак аз водя играта! - каза вещицата, потривайки щастливо ръце.
- Добре, не вдигай шум! - каза Грънди. - Играта не е приключила. Да видим какво ще стане! И така, скъпа публика, започваме четвъртия кръг!
Играчите отново рисуваха, показвайки на публиката какво са нарисували на листовете си. И двата листа хартия отново показаха същите зли лица на публиката.
- Осем - три! - изкрещя вещицата, избухвайки в злобен смях. „Ти сам си изкопа гроба с глупавата си стратегия, голем!“
- Пети кръг! - извика Гранди. Случи се същото като в предишните кръгове - отново гневни лица, само че резултатът се промени - стана девет - четири в полза на магьосницата.
– Сега последният, шести кръг! - обяви Гранди. Неговата предварителни изчисленияпоказа, че този конкретен кръг трябва да стане съдбовен. Сега теорията трябваше да бъде потвърдена или опровергана от практиката.
Няколко бързи и нервни движения на молива върху хартията - и двете рисунки се появиха пред очите на обществеността. Отново две лица, вече дори с оголени зъби!
– Десет – пет в моя полза! Моята игра! Аз спечелих! – изкиска се Морската вещица.

„Ти наистина спечели“, мрачно се съгласи Гранди. Публиката мълчеше зловещо.
Демонът раздвижи устните си, за да каже нещо.

- Но нашето състезание още не е приключило! - гръмко извика Гранди. – Това беше само първата част от мача.
- Да ти дам цяла вечност! – измърмори недоволно демонът Ксант.
- Правилно е! - спокойно каза Гранди. – Но един кръг не решава нищо, само методичността показва най-добрия резултат.
Сега големът се приближи до другата вещица.
– Бих искал да играя този кръг с друг противник! - обяви той. – Всеки от нас ще изобрази лица, както беше предишния път, след което ще покажем това, което сме нарисували пред публика!
Така и направиха. Резултатът беше същият като миналия път - Грънди нарисува усмихнато лице, а вещицата просто череп. Тя веднага спечели преднина от цели пет точки, оставяйки Grundy зад себе си.
Останалите пет кръга завършиха с очакваните резултати. Резултатът отново беше десет - пет в полза на Морската вещица.
– Голем, много ми харесва твоята стратегия! - засмя се вещицата.
– И така, изгледахте два кръга от играта, уважаеми зрители! - възкликна Гранди. „Така вкарах десет точки, а съперниците ми вкараха двадесет!“
Публиката, която също броеше точки, кимаше тъжно с глава. Техният брой съвпадна с този на голема. Само облакът на име Фракто изглеждаше много доволен, но, разбира се, той също не съчувстваше на вещицата.
Но Рапунцел се усмихна одобрително на голема - тя продължи да вярва в него. Тя може би беше единствената останала, която му вярваше сега. Гранди се надяваше, че ще оправдае това безгранично доверие.
Сега Грънди се приближи до третия си опонент – неговия двойник. Той трябваше да бъде последният му противник. Бързо драскайки моливите си върху хартията, големите показаха парчетата хартия на обществеността. Всички видяха две смеещи се лица.
– Забележете, уважаеми зрители, всеки от нас избра да бъде добър съкилийник! - възкликна Гранди. „И следователно никой от нас не получи необходимото предимство пред нашите опоненти в тази игра.“ Така и двамата печелим три точки и продължаваме към следващия кръг!
Вторият кръг започна. Резултатът беше същият като предишния път. След това останалите кръгове. И във всеки кръг и двамата съперници отново записаха по три точки! Беше просто невероятно, но обществеността беше готова да потвърди всичко, което се случваше.

Най-накрая този кръг приключи и Грънди, бързо прокарвайки молива си по листа, започна да изчислява резултата. Накрая той обяви тържествено:
- Осемнадесет на осемнадесет! Общо аз вкарах двадесет и осем точки, докато опонентите ми вкараха тридесет и осем!
„Значи загубихте“, радостно обяви Морската вещица. – Така един от нас ще стане победител!
- Може би! – отвърна спокойно Гранди. Сега дойде друг важен момент. Ако всичко върви по план...
– Трябва да сложим край на този въпрос! – възкликна вторият голем. „Също така все още трябва да се бия с две морски вещици!“ Играта още не е приключила!
- Да, разбира се, давай! - каза Грънди. – Но просто се ръководете от стратегия!
- Да, разбира се! – увери двойникът му.
Този голем се приближи до една от вещиците и обиколката започна. Завърши със същия резултат, с който самият Гранди излезе от подобен кръг - резултатът беше десет на пет в полза на магьосницата. Вещицата наистина сияеше от неизразима радост, а публиката замлъкна навъсена. Демон Ксант изглеждаше някак уморен, което не беше много добра поличба.
Сега беше време за последния кръг - една вещица трябваше да се бие срещу втората. Всеки имаше двадесет точки, които тя успя да получи, като се биеше с големи.
„А сега, ако ми позволиш да спечеля поне няколко допълнителни точки...“ – прошепна заговорнически Морската вещица на двойничката си.
Гранди се опита да запази спокойствие, поне външно, въпреки че в душата му бушуваше ураган от противоречиви чувства. Късметът му сега зависеше от това колко правилно предсказа възможното поведение на двете вещици - в края на краищата, характерът им беше по същество един и същ!
Сега идва най-много, може би, критичен момент. Но какво, ако греши?
- Защо, за бога, да ти се поддавам! – изграчи втората вещица на първата. – Аз самият искам да спечеля повече точки и да се махна оттук!
„Е, щом се държиш толкова нахално – изкрещя кандидатът, – тогава ще те набия, за да не си вече като мен!“
Вещиците, като си хвърляха омразни погледи, нарисуваха своите рисунки и ги показаха на обществеността. Разбира се, там не можеше да има нищо друго освен два черепа! Всеки отбеляза една точка.
Вещиците, обсипвайки една друга с проклятия, започнаха втория кръг. Резултатът отново е същият - отново два нескопосано нарисувани черепа. Така вещиците спечелиха още една точка. Обществеността прилежно записваше всичко.
Това продължи и в бъдеще. Когато рундът приключи, уморените вещици откриха, че всяка от тях е отбелязала по шест точки. Рисувай отново!
– Сега нека изчислим резултатите и да сравним всичко! – триумфално каза Гранди. – Всяка от вещиците отбеляза двадесет и шест точки, а големите отбелязаха двадесет и осем точки. И така, какво имаме? И имаме резултата, че големите имат повече точки!
Въздишка на изненада се разнесе сред редиците зрители. Развълнуваните зрители започнаха да пишат колони с числа върху листчетата си, проверявайки точността на преброяването. През това време мнозина просто не отчитаха броя на отбелязаните точки, вярвайки, че вече знаят резултата от играта. И двете вещици започнаха да ръмжат от възмущение, не е ясно кого точно са обвинили за случилото се. Очите на демона Ксант отново светнаха с предпазлив огън. Доверието му беше оправдано!
„Моля ви, скъпа публика, да обърнете внимание на факта“, вдигна ръка Гранди, настоявайки публиката да се успокои, „че нито един от големите не спечели нито един рунд.“ Но крайната победа пак ще принадлежи на един от нас, големите. Резултатите ще са по-показателни, ако състезанието продължи! Искам да кажа, скъпи зрители, че във вечния дуел моята стратегия неизменно ще се окаже печеливша!
Демонът Ксант слушаше с интерес какво казваше Грунди. Накрая, изпускайки облаци пара, той отвори уста:
– Каква точно е вашата стратегия?
– Наричам го „Бъдете твърди, но справедливи“! - обясни Гранди. – Започвам играта честно, но след това започвам да губя, защото попадам на много конкретни партньори. Затова в първия рунд, когато се окаже, че Морската вещица започва да свидетелства срещу мен, автоматично оставам губещ във втория рунд – и това продължава до края. Резултатът може да е различен, ако вещицата промени тактиката си на игра. Но тъй като това дори не можеше да й хрумне, ние продължихме да играем по предишния модел. Когато започнах да играя с моя двойник, той се отнасяше добре с мен и аз се отнасях добре с него в следващия рунд на играта. Затова и играта ни вървеше по различен начин и някак монотонно, тъй като не искахме да променяме тактиката...
– Но ти не си спечелил нито един рунд! – учудено възрази демонът.
– Да, и тези вещици не са загубили нито един рунд! – потвърди Гранди. – Но победата не отива автоматично при този, който има оставащите рундове. Победата отива при този, който вкара най-много точки, но това е съвсем различен въпрос! Успях да спечеля повече точки, когато играех с двойника си, отколкото когато играех с вещиците. Егоистичното им отношение им донесе моментна победа, но в по-дългосрочен план се оказа, че именно заради това и двамата загубиха цялата игра. Това се случва често!

Материали от Wikipedia - свободната енциклопедия

    1 История

    2 Представяне на играта

    • 2.1 Разширена форма

      2.2 Нормална форма

      2.3 Характерна функция

    3 Приложение на теорията на игрите

    • 3.1 Описание и моделиране

      3.2 Нормативен анализ (определяне на най-доброто поведение)

    4 Видове игри

    • 4.1 Кооперативни и некооперативни

      4.2 Симетрични и асиметрични

      4.3 Нулева и ненулева сума

      4.4 Паралелни и последователни

      4.5 С пълна или непълна информация

      4.6 Игри с безкраен брой стъпки

      4.7 Дискретни и непрекъснати игри

      4.8 Метаигри

Теория на играта- математически метод за изследване на оптим стратегии V игри. Играта е процес, в който участват две или повече страни, борещи се за реализиране на своите интереси. Всяка страна има своя собствена цел и използва някаква стратегия, която може да доведе до победа или загуба - в зависимост от поведението на другите играчи. Теорията на игрите помага да се изберат най-добрите стратегии, като се вземат предвид идеите за другите участници, техните ресурсии възможните им действия.

Теорията на игрите е раздел приложна математика, по-точно - оперативни изследвания. Най-често се използват методи на теория на игрите икономика, малко по-рядко в др социални науки-социология,Политология,психология,етикаи други. Започвайки с 1970 ггодини е приет биолозиза изучаване на поведението на животните и теории за еволюцията. Много е важно за изкуствен интелектИ кибернетика, особено с интерес към интелигентни агенти.

История на изследването на теорията на игрите

Оптималните решения или стратегии в математическото моделиране са били предложени още през 18 век. Проблеми на производството и ценообразуването в условия олигополи, които по-късно се превърнаха в учебникарски примери по теория на игрите, бяха разгледани през 19 век. А. КурноИ Ж. Бертран. В началото на 20в. Е. Ласкер, Е. Зермело, Е. Борел излагат идеята за математическа теория на конфликта на интереси.

Математическата теория на игрите произхожда от неокласическа икономика. За първи път математическите аспекти и приложения на теорията са представени в класическа книга 1944 гДжон фон НойманИ Оскар Моргенщерн"Теория на игрите и икономическо поведение" (АнглийскиТеория на игри и Икономически Поведение).

Тази област на математиката е намерила известно отражение в обществената култура. IN 1998 гамериканскиписателИ журналистСилвия Назарпубликува книга за съдбата Джон Неш,и учен в областта на теорията на игрите; и в 2001 По книгата е заснет филм. Мисловни игри" Някои американски телевизионни предавания, например, " Приятел или враг“, „Псевдоним“ или „NUMB3RS“, периодично препращат към теорията в своите епизоди.

Дж. Нашпрез 1949 г. пише дисертация по теория на игрите; 45 години по-късно получава Нобелова награда за икономика. Дж. НашСлед като завършва Политехническия институт Карнеги с две дипломи – бакалавърска и магистърска, постъпва в Принстънския университеткъдето посещавах лекции Джон фон Нойман. В своите писания Дж. Нашразработи принципите на „управленската динамика“. Бяха анализирани първите концепции на теорията на игрите антагонистични игрикогато има губещи и играчи, които печелят за тяхна сметка. Наш разработва методи за анализ, при които всеки участващ или печели, или губи. Тези ситуации се наричат "Равновесие на Наш", или „некооперативно равновесие”, в дадена ситуация страните използват оптималната стратегия, която води до създаване на стабилно равновесие. За играчите е полезно да поддържат този баланс, тъй като всяка промяна ще влоши позицията им. Тези работи Дж. Нашима сериозен принос в развитието на теорията на игрите и математическите инструменти на икономическото моделиране са преразгледани. Дж. Нашпоказва, че класическият подход към конкуренцията А. Смит, когато всеки е за себе си, е неоптимално. По-оптималните стратегии са, когато всеки се опитва да направи по-добре за себе си, докато прави по-добре за другите.

Въпреки че теорията на игрите първоначално се занимава с икономически модели, тя остава официална теория в математиката до 50-те години на миналия век. Но още от 1950 г. започват опити за прилагане на методите на теорията на игрите не само в икономиката, но и в биологията, кибернетика,технология,антропология. По време на Втората световна войнаи веднага след него военните се интересуват сериозно от теорията на игрите, които виждат в нея мощен апарат за изучаване на стратегически решения.

През 1960-1970г интересът към теорията на игрите избледнява, въпреки значителните математически резултати, получени по това време. От средата на 80-те години. започва активно практическо използване на теорията на игрите, особено в икономиката и управлението. През последните 20-30 години значението на теорията на игрите и интересът нарастват значително, някои области на модерното икономическа теорияневъзможно да се обясни без прилагане на теорията на игрите.

Основен принос за прилагането на теорията на игрите беше работата Томас Шелинг,Нобелов лауреат по икономика 2005. „Стратегията на конфликта“. Т. Шелинг разглежда различни „стратегии” на поведение на участниците в конфликта. Тези стратегии съвпадат с тактиките за управление на конфликти и принципите за анализ на конфликти конфликтология(това е психологическа дисциплина) и в управлението на конфликти в една организация (теория на управлението). В психологията и други науки думата „игра“ се използва в различен смисъл от този в математиката. Някои психолози и математици са скептични относно използването на този термин в други установени преди това значения. Културната концепция за играта е дадена в работата Йохан ХейзингаХомо Луденс(статии по история на културата), авторът говори за използването на игрите в правосъдието, културата, етиката... казва, че играта е по-стара от самия човек, тъй като животните също играят. Концепцията за игра се намира в концепцията Ерик Бърна„Игри, които хората играят, хора, които играят игри.“ Това са чисто психологически игри, базирани на транзакционен анализ. Концепцията на J. Hözing за играта се различава от интерпретацията на играта в теорията на конфликта и математическата теория на игрите. Игрите се използват и за обучение по бизнес казуси, семинари Г. П. Щедровицки, основоположник на организационно-дейностния подход. По време на Перестройката в СССР Г. П. Щедровицкиизигра много игри със съветски мениджъри. От гледна точка на психологическия интензитет ODI (игрите за организационна дейност) бяха толкова силни, че послужиха като мощен катализатор за промените в СССР. Сега в Русия има цяло движение ODI. Критиците отбелязват изкуствената уникалност на ODI. Основата на ODI беше Московски методически кръг (ММК).

Математическата теория на игрите сега се развива бързо и се обмислят динамични игри. Въпреки това, математическият апарат на теорията на игрите е скъп . Използва се за оправдани задачи: политика, икономика на монополите и разпределение на пазарната власт и др. Редица известни учени са станали за приноса му в развитието на теорията на игрите, която описва социално-икономическите процеси. Дж. Наш, благодарение на изследванията си в теорията на игрите, стана един от водещите експерти в областта на "студена война", което потвърждава мащаба на проблемите, с които се занимава теорията на игрите.

Нобелови лауреати по икономиказа постижения в областта на теорията на игрите и икономическата теория: Робърт Ауман,Райнхард Зелтен,Джон Неш,Джон Харсани,Уилям Викри,Джеймс Мирлис,Томас Шелинг,Джордж Акерлоф,Майкъл Спенс,Джоузеф Стиглиц,Леонид Гурвиц,Ерик Маскин,Роджър Майерсън.

В резултат на изучаването на тази глава студентът трябва:

зная

Концепции за игри, базирани на принципа на доминиране, равновесие на Наш, какво е обратна индукция и др.; концептуални подходи за решаване на играта, значението на концепцията за рационалност и равновесие в рамките на стратегията на взаимодействие;

да бъде в състояние да

Разграничаване на игрите в стратегически и детайлни форми, изграждане на „дърво на играта“; формулират игрови модели на състезание за различни видовепазари;

собствен

Методи за определяне на резултатите от играта.

Игри: основни понятия и принципи

Първият опит за създаване на математическа теория на игрите е направен през 1921 г. от Е. Борел. Като самостоятелна научна област теорията на игрите е систематично представена за първи път в монографията на Й. фон Нойман и О. Моргенщерн „Теория на игрите и икономическо поведение“ през 1944 г. Оттогава много клонове на икономическата теория (например теорията на несъвършената конкуренция, теорията на икономическите стимули и др.) .) се развива в тясна връзка с теорията на игрите. Теорията на игрите се използва успешно и в социалните науки (например анализ на процедурите за гласуване, търсене на концепции за равновесие, които определят кооперативното и некооперативното поведение на индивидите). Избирателите обикновено предпочитат кандидати, които представят крайни гледни точки, но има битка при избирането на един от двама кандидати, предлагащи различни компромиси. Дори идеята на Русо за еволюция от "естествена свобода" към "гражданска свобода" формално съответства, от гледна точка на теорията на игрите, на гледна точка на сътрудничеството.

Играе идеализиран математически модел на колективното поведение на няколко индивида (играчи), чиито интереси са различни, което поражда конфликт. Конфликтът не предполага непременно наличието на антагонистични противоречия между страните, но винаги е свързан с някакъв вид несъгласие. Конфликтната ситуация ще бъде антагонистична, ако увеличаването на печалбата на една от страните с определена сума води до намаляване на печалбата на другата страна със същата сума и обратно. Антагонизмът на интересите поражда конфликт, а съвпадението на интереси свежда играта до координация на действията (сътрудничество).

Примери за конфликтна ситуация са ситуации, които възникват в отношенията между купувач и продавач; в условията на конкуренция между различни фирми; по време на бойни действия и др. Примери за игри са обикновените игри: шах, дама, карти, салонни игри и др. (оттук и името "теория на игрите" и неговата терминология).

В повечето игри, произтичащи от анализа на финансови, икономически и управленски ситуации, интересите на играчите (страните) не са нито строго антагонистични, нито абсолютно съвпадащи. Купувачът и продавачът се съгласяват, че е в техен взаимен интерес да се споразумеят за покупко-продажба, но преговарят енергично за конкретна цена в рамките на взаимната изгода.

Теория на играта- Това математическа теорияконфликтни ситуации.

Играта се различава от истинския конфликт по това, че се играе според определени правила. Тези правила установяват последователността на ходовете, количеството информация, която всяка страна има за поведението на другата, и резултата от играта в зависимост от текущата ситуация. Правилата също определят края на играта, когато вече е направена определена последователност от ходове и не са разрешени повече ходове.

Теорията на игрите, както всеки математически модел, има своите ограничения. Едно от тях е предположението за пълна (идеална) интелигентност на опонентите. В истински конфликт често най-добрата стратегия е да отгатнете за какво е глупав врагът и да използвате тази глупост в своя полза.

Друг недостатък на теорията на игрите е, че всеки играч трябва да знае всички възможни действия (стратегии) ​​на противника, не е известно само кои от тях ще използва в дадена игра. В реален конфликт това обикновено не е така: списъкът с всички възможни вражески стратегии е точно неизвестен и най-доброто решениев конфликтна ситуация често ще бъде именно излизане отвъд границите на стратегиите, известни на противника, „зашеметявайки“ го с нещо съвсем ново, непредвидено.

Теорията на игрите не включва елементите на риск, които неизбежно съпътстват разумните решения в реални конфликти. То обуславя най-предпазливото, презастрахователно поведение на страните в конфликта.

Освен това в теорията на игрите оптималните стратегии се намират въз основа на един показател (критерий). В практически ситуации често се налага да се вземе предвид не един, а няколко числови критерия. Стратегия, която е оптимална за един показател, може да не е оптимална за други.

Като сте наясно с тези ограничения и следователно не се придържате сляпо към препоръките, дадени от теориите на игрите, все още е възможно да се разработи напълно приемлива стратегия за много конфликтни ситуации в реалния живот.

В момента тече Научно изследване, насочен към разширяване на областите на приложение на теорията на игрите.

В литературата има следните определенияелементи, които изграждат играта.

Играчи- това са субекти, участващи във взаимодействие, представени под формата на игра. В нашия случай това са домакинства, фирми и правителство. Въпреки това, в случай на несигурност на външните обстоятелства, е доста удобно да се представят случайните компоненти на играта, независимо от поведението на играчите, като действия на „природата“.

Правила на играта.Правилата на играта се отнасят до наборите от действия или ходове, достъпни за играчите. В този случай действията могат да бъдат много разнообразни: решения на купувачите относно обема на закупените стоки или услуги; фирми - по обеми на производство; нивото на данъците, определени от правителството.

Определяне на изхода (резултата) от играта.За всяка комбинация от действия на играча резултатът от играта се определя почти механично. Резултатът може да бъде: съставът на потребителската кошница, векторът на продукцията на компанията или набор от други количествени показатели.

Печалби.Значението на концепцията за печалба може да се различава за различни видовеигри. В този случай е необходимо ясно да се разграничат печалбите, измерени по редовна скала (например нивото на полезност) и стойностите, за които сравнението на интервали има смисъл (например печалба, ниво на благосъстояние).

Информация и очаквания.Несигурността и постоянно променящата се информация могат да имат изключително сериозно въздействие върху възможните резултати от взаимодействието. Ето защо е необходимо да се вземе предвид ролята на информацията в развитието на играта. В това отношение концепцията излиза на преден план набор от информацияиграч, т.е. съвкупността от цялата информация за състоянието на играта, с която разполага ключови точкивреме.

Когато разглеждаме достъпа на играчите до информация, интуитивната идея за споделено знание или публичност,което означава следното: даден факт е общоизвестен, ако всички играчи са наясно с него и всички играчи знаят, че другите играчи също знаят за него.

За случаите, в които прилагането на понятието общо знание не е достатъчно, понятието индивидуално очакванияучастници - идеи за това как е игровата ситуация на този етап.

В теорията на игрите се приема, че играта се състои от се движи,изпълнявани от играчи едновременно или последователно.

Ходовете са лични и произволни. Ходът се нарича лично,ако играчът съзнателно го избира от набор от възможни опции за действия и го изпълнява (например всеки ход в шахматна игра). Ходът се нарича случаен,ако изборът му се прави не от играча, а от някакъв механизъм за произволен избор (например въз основа на резултатите от хвърлянето на монета).

Наборът от ходове, предприети от играчите от началото до края на играта, се нарича партия.

Една от основните концепции на теорията на игрите е концепцията за стратегия. СтратегияИграчът е набор от правила, които определят избора на действие за всеки личен ход, в зависимост от ситуацията, която възниква по време на играта. В прости (с един ход) игри, когато във всяка игра играчът може да направи само един ход, концепцията за стратегия и възможен вариантдействията съвпадат. В този случай наборът от стратегии на играча обхваща всички негови възможни действия и всички възможни за играча iдействието е неговата стратегия. В сложни (многоходови игри) понятието "опция" възможни действия" и "стратегия" може да се различават един от друг.

Стратегията на играча се нарича оптимален,ако предоставя на даден играч многократни повторения на играта, максималната възможна средна печалба или минималната възможна средна загуба, независимо какви стратегии използва опонентът. Могат да се използват и други критерии за оптималност.

Възможно е стратегията, която осигурява максимална печалба, да няма друго важно представяне на оптималността, като например стабилността (равновесието) на решението. Решението на играта е устойчиви(равновесие), ако стратегиите, съответстващи на това решение, образуват ситуация, която никой от играчите не е заинтересован да промени.

Нека повторим, че задачата на теорията на игрите е да намери оптимални стратегии.

Класификацията на игрите е представена на фиг. 8.1.

  • 1. В зависимост от видовете ходове игрите се делят на стратегически и хазартни. хазартигрите се състоят само от произволни ходове, с които теорията на игрите не се занимава. Ако наред със случайните ходове има лични ходове или всички ходове са лични, тогава такива игри се наричат стратегически.
  • 2. В зависимост от броя на играчите игрите се делят на двойки и многократни игри. IN игра на двойкиброят на участниците е двама, в многократни- повече от две.
  • 3. Участниците в многократна игра могат да формират коалиции, както постоянни, така и временни. Въз основа на характера на взаимоотношенията между играчите, игрите се делят на некоалиционни, коалиционни и кооперативни.

НекоалиционенТова са игри, в които играчите нямат право да сключват споразумения или да формират коалиции, а целта на всеки играч е да получи възможно най-голямата индивидуална печалба.

Игри, при които действията на играчите са насочени към максимизиране на печалбите на групи (коалиции) без последващото им разделяне между играчите, се наричат коалиция.

Ориз. 8.1.

Резултатът кооперативенИграта е разделяне на печалбите на коалицията, което възниква не в резултат на определени действия на играчите, а в резултат на техните предварително определени споразумения.

В съответствие с това в кооперативните игри не се сравняват ситуации по предпочитание, както е в некооперативните игри, а разделения; и това сравнение не се ограничава до разглеждане на отделни печалби, а е по-сложно.

  • 4. Според броя на стратегиите на всеки играч игрите се делят на финал(броят на стратегиите за всеки играч е краен) и безкраен(наборът от стратегии за всеки играч е безкраен).
  • 5. Според количеството информация, достъпна за играчите относно минали ходове, игрите се разделят на игри с пълна информация(цялата информация за предишни ходове е налична) и непълна информация.Примери за игри с пълна информация включват шах, дама и др.
  • 6. Въз основа на вида описания на игри те се разделят на позиционни игри (или игри в разширен вид) и игри в нормална форма. Позиционни игриса дадени под формата на дърво на играта. Но всяка позиционна игра може да се сведе до нормална форма,в който всеки играч прави само един независим ход. В позиционните игри ходовете се правят в отделни моменти от времето. Съществуват диференциални игри,при които ходовете се правят непрекъснато. Тези игри изучават проблема с преследването на контролиран обект от друг контролиран обект, като вземат предвид динамиката на тяхното поведение, което се описва с диференциални уравнения.

Също така има отразяващи игри,които разглеждат ситуациите, като вземат предвид мисленото възпроизвеждане на възможния ход на действие и поведение на противника.

7. Ако всяка възможна игра от някоя игра има нулева сума от печалби от всички н players(), тогава говорим за игра с нулева сума.Иначе се казват игрите игри с ненулева сума.

Очевидно е, че това е игра с двойки с нулева сума антагонистичен,тъй като печалбата на един играч е равна на загубата на втория и следователно целите на тези играчи са директно противоположни.

Извиква се игра с ограничени двойки с нулева сума матрична игра.Такава игра се описва от матрица на изплащане, в която са посочени печалбите на първия играч. Номерът на реда на матрицата съответства на номера на приложената стратегия на първия играч, колоната – на номера на приложената стратегия на втория играч; в пресечната точка на реда и колоната има съответната печалба на първия играч (загуба на втория играч).

Извиква се игра с крайна ненулева сума биматрична игра.Такава игра се описва от две матрици на изплащане, всяка за съответния играч.

Да вземем следния пример. Игра "Тест".Нека играч 1 е ученик, който се подготвя за теста, а играч 2 е учител, който прави теста. Ще приемем, че ученикът има две стратегии: A1 – да се подготви добре за теста; А 2 – не е подготвен. Учителят също има две стратегии: B1 – даде тест; Б 2 – не давам кредит. Основата за оценка на стойностите на печалбите на играчите може да се основава например на следните съображения, отразени в матриците на печалбите:

Тази игра, в съответствие с горната класификация, е стратегическа, сдвоена, некооперативна, крайна, описана в нормална форма, с ненулева сума. По-накратко, тази игра може да се нарече bimatrix.

Задачата е да се определят оптималните стратегии за ученика и за учителя.

Друг пример за добре познатата биматрична игра „Дилемата на затворника“.

Всеки от двамата играчи има две стратегии: А 2 и Б 2 – стратегии на агресивно поведение, а Ааз и Б i – мирно поведение. Да приемем, че "мирът" (и двамата играчи са мирни) е по-добър и за двамата играчи, отколкото "войната". Случаят, когато единият играч е агресивен, а другият е мирен, е по-изгоден за агресора. Нека матриците на изплащане на играчи 1 и 2 в тази биматрична игра имат формата

И за двамата играчи агресивните стратегии A2 и B2 доминират над мирните стратегии A и Б v Следователно единственото равновесие в доминиращите стратегии има формата (A2, Б 2), т.е.постулира се, че резултатът от некооперативното поведение е война. В същото време изходът (A1, B1) (свят) дава по-голяма печалба и за двамата играчи. По този начин егоистичното поведение без съдействие е в конфликт с колективните интереси. Колективните интереси диктуват избора на мирни стратегии. В същото време, ако играчите не обменят информация, войната е най-вероятният изход.

В този случай ситуацията (A1, B1) е оптимална по Парето. Тази ситуация обаче е нестабилна, което води до възможността играчите да нарушат установеното споразумение. Наистина, ако първият играч наруши споразумението, но вторият не го направи, тогава печалбата на първия играч ще се увеличи до три, а вторият ще падне до нула и обратно. Освен това всеки играч, който не наруши споразумението, губи повече, когато вторият играч наруши споразумението, отколкото в случай, че и двамата нарушат споразумението.

Има две основни форми на играта. Игра на обширна формасе представя като дървовидна диаграма за вземане на решения, като „коренът“ съответства на началната точка на играта и началото на всеки нов „клон“, наречен възел,– състоянието, постигнато на този етап с тези действия, които вече са предприети от играчите. На всеки краен възел – всяка крайна точка на играта – се присвоява вектор на печалба, по един компонент за всеки играч.

стратегически,наречен иначе нормална, формаПредставянето на играта съответства на многомерна матрица, като всяко измерение (в двумерния случай редове и колони) включва набор от възможни действия за един агент.

Отделна клетка от матрицата съдържа вектор от печалби, съответстващ на дадена комбинация от стратегии на играча.

На фиг. 8.2 показва разширената форма на играта и таблицата. 8.1 – стратегическа форма.

Ориз. 8.2.

Таблица 8.1.Игра с едновременно вземане на решения в стратегическа форма

Има достатъчно подробна класификация компонентитеория на играта. Един от най общи критерииТакава класификация е разделянето на теорията на игрите на теория на некооперативните игри, в които субектите на вземане на решения са самите индивиди, и теория на кооперативните игри, в които субектите на вземане на решения са групи или коалиции на физически лица.

Некооперативните игри обикновено се представят в нормална (стратегическа) и разширена (обширна) форма.

  • Воробьов Н. Н.Теория на игрите за екокиберетици. М.: Наука, 1985.
  • Венцел Е. С.Оперативни изследвания. М.: Наука, 1980.

Математическата теория на игрите, възникнала през 40-те години на 20 век, се използва най-често в икономиката. Но как можем да използваме концепцията за игрите, за да моделираме поведението на хората в обществото? Защо учат икономистите, в кой ъгъл футболистите бият дузпи по-често и как да спечелим в „Камък, ножица, хартия“, обясни в лекцията си старши преподавателят в катедрата по микроикономически анализ на HSE Данил Федоровых.

Джон Неш и блондинка в бар

Игра е всяка ситуация, в която печалбата на агент зависи не само от неговите собствени действия, но и от поведението на другите участници. Ако играете пасианс у дома, от гледна точка на икономист и теория на игрите, това не е игра. То предполага задължително наличие на конфликт на интереси.

Във филма "Красив ум" за Джон Неш, Нобелов лауреатпо икономика има сцена с блондинка в бар. Той показва идеята, за която ученият получи наградата - това е идеята за равновесието на Неш, което самият той нарича динамика на управлението.

Игра- всяка ситуация, в която изплащанията на агентите зависят един от друг.

Стратегията е описание на действията на играча във всички възможни ситуации.

Резултатът е комбинация от избрани стратегии.

Така че, от теоретична гледна точка, играчите в тази ситуация са само мъже, тоест тези, които вземат решението. Техните предпочитания са прости: блондинка е по-добра от брюнетка, а брюнетка е по-добра от нищо. Можете да действате по два начина: отидете при блондинка или при „вашата“ брюнетка. Играта се състои от един ход, решенията се вземат едновременно (т.е. не можете да видите къде са отишли ​​другите и след това да се придвижите сами). Ако някое момиче отхвърли мъж, играта приключва: невъзможно е да се върнете при нея или да изберете друг.

Какъв е вероятният изход от тази игрова ситуация? Тоест каква е стабилната му конфигурация, от която всеки ще разбере какво е направил най-добрият избор? Първо, както Неш правилно отбелязва, ако всички отиват при блондинките, това няма да свърши добре. Затова ученият допълнително предполага, че всеки трябва да отиде при брюнетките. Но тогава, ако се знае, че всички ще ходят на брюнетки, той трябва да отиде на блондинка, защото тя е по-добра.

Това е истинският баланс - развръзка, при която една отива при блондинките, а останалите при брюнетките. Това може да изглежда несправедливо. Но в ситуация на равновесие никой не може да съжалява за избора си: тези, които отиват при брюнетки, разбират, че така или иначе няма да получат нищо от блондинка. По този начин равновесието на Наш е конфигурация, в която никой поотделно не иска да промени избраната от всички стратегия. Тоест, размишлявайки в края на играта, всеки участник разбира, че дори и да знаеше как се справят другите, той би направил същото. Друг начин да го наречем е резултат, при който всеки участник реагира оптимално на действията на останалите.

"Камък ножица хартия"

Нека разгледаме други игри за баланс. Например Камък, ножица, хартия няма равновесие на Неш: във всички възможни резултати няма вариант, при който и двамата участници биха били доволни от избора си. Все пак има Световно първенство и Световно общество Rock Paper Scissors Society, което събира статистика за играта. Очевидно можете да подобрите шансовете си за победа, ако знаете нещо за общото поведение на хората в тази игра.

Чиста стратегия в играта е тази, при която човек винаги играе по един и същи начин, избирайки едни и същи ходове.

Според World RPS Society камъкът е най-често избираният ход (37,8%). 32,6% използват хартия, 29,6% използват ножици. Сега знаете, че трябва да изберете хартия. Ако обаче играете с някой, който също знае това, вече не трябва да избирате хартията, защото същото се очаква и от вас. Има известен случай: през 2005 г. двама аукционни къщи Sotheby's и Christie's решаваха кой да получи много голям лот - колекция от Пикасо и Ван Гог с начална цена от 20 милиона долара. Собственикът ги покани да играят на „Камък, ножица хартия“, а представители на къщите му изпратиха своите варианти за електронна поща. Sotheby's, както казаха по-късно, избраха хартията без много да се замислят. Спечелени от Christie's. Когато вземат решение, те се обърнаха към експерт - 11-годишната дъщеря на един от топ мениджърите. Тя каза: „Камъкът изглежда най-здравият, затова повечето хора го избират. Но ако не играем с напълно глупав начинаещ, той няма да хвърли камъка, ще очаква от нас да го направим и сам ще хвърли хартията. Но ние ще мислим една крачка напред и ще захвърлим ножицата.”

Така можете да мислите напред, но това не е задължително да ви доведе до победа, защото може да не сте наясно с компетентността на опонента си. Ето защо понякога вместо чисти стратегии е по-правилно да изберете смесени, тоест да вземете решения на случаен принцип. Така в „Камък, ножица хартия“ равновесието, което не бяхме открили преди, е именно в смесени стратегии: избор на всеки от трите варианта на ход с една трета вероятност. Ако избирате камък по-често, опонентът ви ще коригира избора си. Знаейки това, вие ще коригирате своето и баланс няма да се постигне. Но никой от вас няма да започне да променя поведението си, ако всички просто изберат камък, ножица или хартия с еднаква вероятност. Това е така, защото при смесените стратегии е невъзможно да се предвиди следващия ви ход въз основа на предишни действия.

Смесена стратегия и спорт

Има много по-сериозни примери за смесени стратегии. Например къде да сервираме в тениса или да изпълним/изпълним дузпа във футбола. Ако не знаете нищо за опонента си или просто играете срещу различни през цялото време, най-добра стратегияще действа повече или по-малко произволно. Професорът от London School of Economics Ignacio Palacios-Huerta публикува статия в American Economic Review през 2003 г., чиято същност е да се намери равновесието на Наш в смесените стратегии. Паласиос-Уерта избра футбола като предмет на своите изследвания и затова разгледа повече от 1400 наказателни удара. Разбира се, в спорта всичко е подредено по-хитро, отколкото в „Камък, ножица хартия“: взема се предвид силен кракспортист, удряне под различни ъгли при удряне с пълна сила и други подобни. Равновесието на Неш тук се състои от изчисляване на опции, тоест например определяне на ъглите на вратата, към които да стреляте, за да спечелите с по-голяма вероятност, като знаете вашите слаби и силни страни. Статистиката за всеки футболист и установеното в тях равновесие в смесени стратегии показаха, че футболистите действат приблизително според прогнозите на икономистите. Едва ли си струва да се каже, че хората, които изпълняват дузпи, са чели учебници по теория на игрите и са правили доста сложни изчисления. Най-вероятно има различни начининаучете се да се държите оптимално: можете да сте брилянтен футболист и да усещате какво да правите или можете да бъдете икономист и да търсите баланс в смесени стратегии.

През 2008 г. професор Игнасио Паласиос-Уерта се срещна с Ейбрахам Грант, треньорът на Челси, който тогава играеше финала на Шампионската лига в Москва. Ученият написа бележка до треньора с препоръки за изпълнение на дузпи, които се отнасяха до поведението на противниковия вратар Едуин ван дер Сар от Манчестър Юнайтед. Например, според статистиката, той почти винаги спасяваше удари на средно ниво и по-често се хвърляше в естествената посока за изпълнение на дузпа. Както определихме по-горе, все още е по-правилно да рандомизирате поведението си, като вземете предвид знанията за опонента си. Когато дузпите вече бяха 6:5, трябваше да вкара нападателят на Челси Никола Анелка. Посочвайки десния ъгъл преди удара, ван дер Сар сякаш попита Анелка дали ще стреля там.

Въпросът е, че всички предишни удари на Челси бяха насочени към десния ъгъл на нападателя. Не знаем точно защо, може би заради съвета на един икономист, да ударят в неестествена за тях посока, защото според статистиката Ван дер Сар е по-малко готов за това. Повечето от играчите на Челси бяха десничари: удряйки неестествения десен ъгъл, всички те, с изключение на Тери, отбелязаха. Явно стратегията е била Анелка да стреля там. Но ван дер Сар изглежда разбираше това. Той се представи блестящо: посочи левия ъгъл и каза: „Там ли ще стреляш?“, което сигурно ужаси Анелка, защото го бяха познали. В последния момент той реши да действа по различен начин, като удари в естествената си посока, от което се нуждаеше Ван дер Сар, който отправи този удар и осигури победата на Манчестър. Тази ситуация учи на случаен избор, защото в противен случай решението ви може да бъде пресметнато и ще загубите.

"Дилемата на затворника"

Вероятно най-известната игра, с която започват университетски курсове по теория на игрите, е Дилемата на затворника. Според легендата двама заподозрени за тежко престъпление са заловени и затворени в отделни килии. Има данни, че са държали оръжие и това позволява да бъдат вкарани в затвора за кратък период от време. Няма обаче доказателства, че те са извършили това ужасно престъпление. Следователят разказва на всеки индивидуално за условията на играта. Ако и двамата престъпници си признаят, и двамата ще влязат в затвора за три години. Ако единият си признае, а съучастникът мълчи, този, който си е признал, веднага ще бъде освободен, а другият ще лежи в затвора за пет години. Ако напротив, първият не си признае, а вторият го предаде, първият ще влезе в затвора за пет години, а вторият ще бъде освободен веднага. Ако никой не си признае, и двамата ще лежат по една година в затвора за притежание на оръжие.

Равновесието на Наш тук е в първата комбинация, когато и двамата заподозрени не мълчат и двамата влизат в затвора за три години. Разсъжденията на всички са следните: „Ако говоря, ще вляза в затвора за три години, ако мълча, ще вляза в затвора за пет години. Ако вторият мълчи, по-добре и аз да го кажа: по-добре да не влизаш в затвора, отколкото да лежиш една година в затвора. Това е доминиращата стратегия: говоренето е полезно, независимо какво прави другият. Има обаче проблем с това - има по-добър вариант, защото да си в затвора за три години е по-лошо, отколкото да си в затвора за една година (ако разглеждате историята само от гледна точка на участниците и не вземате предвид морални въпроси). Но е невъзможно да седнете за една година, защото, както разбрахме по-горе, за двамата престъпници е неизгодно да мълчат.

Подобрение по Парето

Има известна метафора за невидимата ръка на пазара, която принадлежи на Адам Смит. Той каза, че ако месарят се опита да спечели пари за себе си, ще бъде по-добре за всички: той ще направи вкусно месо, което пекарят ще купи с пари от продажбата на кифли, които той от своя страна също ще трябва да направи вкусно, така че те продават. Но се оказва, че тази невидима ръка не винаги работи и има много ситуации, когато всеки действа за себе си и всеки се чувства зле.

Затова понякога икономистите и теоретиците на игрите не мислят за оптималното поведение на всеки играч, тоест не за равновесието на Наш, а за резултата, при който цялото общество ще бъде по-добре (в Дилемата обществото се състои от двама престъпници) . От тази гледна точка резултатът е ефективен, когато в него няма подобрение по Парето, т.е. невъзможно е да направиш някой по-добър, без да направиш другите по-лоши. Ако хората просто обменят стоки и услуги, това е подобрение на Парето: те го правят доброволно и е малко вероятно някой да се чувства зле от това. Но понякога, ако просто оставите хората да си взаимодействат и дори не се намесите, това, което измислят, няма да бъде оптимално по Парето. Това се случва в Дилемата на затворника. В него, ако оставим всеки да действа така, както му е изгодно, се оказва, че това кара всеки да се чувства зле. За всички би било по-добре, ако всеки действа не толкова оптимално за себе си, тоест мълчи.

Трагедия на общините

Дилемата на затворника е история за играчки. Това не е ситуация, в която бихте очаквали да попаднете, но подобни ефекти съществуват навсякъде около нас. Помислете за "Дилемата" с голяма сумаиграчи, понякога се нарича трагедията на общите блага. Например, има задръствания по пътищата и аз решавам как да отида на работа: с кола или с автобус. Останалите правят същото. Ако отида с кола и всички решат да направят същото, ще има задръстване, но ще стигнем удобно. Ако пътувам с автобус, пак ще има задръстване, но пътуването ще е неудобно и не особено бързо, така че този резултат ще бъде още по-лош. Ако средно всички вземат автобуса, тогава ако аз направя същото, ще стигна доста бързо без задръстване. Но ако ходя с кола при такива условия, също ще стигна бързо, но и удобно. Така че наличието на задръстване не зависи от моите действия. Равновесието на Неш тук е в ситуация, в която всеки избира да шофира. Без значение какво правят другите, за мен е по-добре да избера кола, защото не се знае дали ще има задръстване или не, но във всеки случай ще стигна удобно. Това е доминиращата стратегия, така че в крайна сметка всеки кара кола и имаме това, което имаме. Задачата на държавата е да направи пътуване с автобус най-добрият вариантпоне за някои, поради което има платени входове в центъра, паркинги и т.н.

Друга класическа история е рационалното невежество на избирателя. Представете си, че не знаете резултата от изборите предварително. Можете да изучавате програмите на всички кандидати, да слушате дебатите и след това да гласувате за най-добрия. Втората стратегия е да дойдете в избирателната секция и да гласувате на случаен принцип или за този, който е показван по телевизията по-често. Какво е оптималното поведение, ако моят глас никога не определя кой ще спечели (а в страна от 140 милиона души един глас никога няма да реши нищо)? Разбира се, искам страната да има добър президент, но знам, че вече никой няма да изучава внимателно програмите на кандидатите. Следователно да не губите време за това е доминиращата стратегия на поведение.

Когато ви извикат на ден за почистване, няма да зависи от никого поотделно дали дворът ще бъде чист или не: ако изляза сам, няма да мога да изчистя всичко или всички да излязат , тогава няма да излизам, защото всичко ще бъде направено без мен ще бъде премахнато. Друг пример е транспортирането на стоки в Китай, за което научих в прекрасната книга на Стивън Ландсбърг „Икономистът на дивана“. Преди 100-150 години в Китай имаше обичаен начин за транспортиране на стоки: всичко беше сгънато в голямо тяло, което беше теглено от седем души. Клиентите плащат, ако стоките са доставени навреме. Представете си, че сте един от тези шест. Можете да положите усилия и да дърпате колкото можете и ако всички го правят, товарът ще пристигне навреме. Ако един човек не направи това, всички също ще пристигнат навреме. Всеки си мисли: „Ако всички останали се дърпат както трябва, защо трябва да го правя и ако всички останали не се дърпат колкото могат, тогава няма да мога да променя нищо.“ В резултат на това всичко беше много лошо с времето за доставка и самите товарачи намериха изход: започнаха да наемат седмия и да му плащат пари, за да бие мързеливите хора с камшик. Самото присъствие на такъв човек принуждаваше всеки да работи колкото може, защото иначе всеки би изпаднал в лошо равновесие, от което никой не би могъл да излезе изгодно.

Същият пример може да се наблюдава и в природата. Едно дърво, което расте в градината, се различава от това, което расте в гората, по короната си. В първия случай той обгражда целия ствол, във втория се намира само на върха. В гората това е равновесие на Наш. Ако всички дървета бяха съгласни и растяха еднакво, те щяха да разпределят броя на фотоните поравно и всички щяха да бъдат по-добре. Но за никого не е изгодно да прави това. Следователно всяко дърво иска да расте малко по-високо от тези около него.

Устройство за ангажиране

В много ситуации един от участниците в играта може да се нуждае от инструмент, който ще убеди другите, че не блъфира. Нарича се устройство за обвързване. Например, законът в някои страни забранява плащането на откуп на похитителите, за да се намали мотивацията на престъпниците. Това законодателство обаче често не работи. Ако твой близък е заловен и имаш възможност да го спасиш, заобикаляйки закона, ще го направиш. Да си представим ситуация, в която законът може да бъде заобиколен, но роднините са бедни и няма с какво да платят откупа. Престъпникът има две възможности в тази ситуация: да освободи или да убие жертвата. Не обича да убива, но вече не обича и затвора. Освободената жертва от своя страна може или да даде показания, така че похитителят да бъде наказан, или да мълчи. Най-добрият изход за престъпника е да пусне жертвата, ако не го предаде. Жертвата иска да бъде освободена и да даде показания.

Балансът тук е, че терористът не иска да бъде заловен, което означава, че жертвата умира. Но това не е равновесие по Парето, защото има вариант, при който всички са по-добре - жертвата на свобода мълчи. Но за това е необходимо да се уверите, че за нея е полезно да мълчи. Някъде прочетох опция, при която тя може да помоли терорист да организира еротична фотосесия. Ако престъпникът влезе в затвора, неговите съучастници ще публикуват снимки в интернет. Сега, ако похитителят остане на свобода, това е лошо, но снимките в публичното пространство са още по-лоши, така че има баланс. За жертвата това е начин да остане жив.

Други примери за игри:

Модел Бертран

Тъй като говорим за икономика, нека да разгледаме един икономически пример. При модела Bertrand два магазина продават един и същ продукт, като го купуват от производителя на една и съща цена. Ако цените в магазините са еднакви, то печалбите им са приблизително еднакви, защото тогава купувачите избират магазин на случаен принцип. Единственото равновесие на Неш тук е да се продаде продуктът по себестойност. Но магазините искат да правят пари. Следователно, ако някой определи цената на 10 рубли, вторият ще я намали с една стотинка, като по този начин ще удвои приходите си, тъй като всички купувачи ще отидат при него. Следователно за участниците на пазара е полезно да намалят цените, като по този начин разпределят печалбите помежду си.

Шофиране по тесен път

Нека да разгледаме примери за избор между две възможни равновесия. Представете си, че Петя и Маша се движат една срещу друга по тесен път. Пътят е толкова тесен, че и двамата трябва да отбият отстрани на пътя. Ако решат да се обърнат наляво или надясно, те просто ще се раздалечат. Ако единият завие надясно, а другият завие наляво или обратното, ще настъпи инцидент. Как да изберем къде да се преместим? За да се намери баланс в такива игри, има например правила за движение. В Русия всеки трябва да завие надясно.

В Chicken fun, когато двама души се возят висока скоростедин към друг, също има две равновесия. Ако и двамата отбият отстрани на пътя, възниква ситуация, наречена Chicken out; ако и двамата не отбият, те умират в ужасен инцидент. Ако знам, че опонентът ми върви направо, за мен е изгодно да се преместя, за да оцелея. Ако знам, че опонентът ми ще напусне, тогава за мен е изгодно да отида направо, за да мога да получа 100 долара по-късно. Трудно е да се предвиди какво ще се случи в действителност, но всеки играч има свой собствен метод за победа. Представете си, че поправих волана така, че да не може да се върти, и показах това на опонента си. Знаейки, че нямам избор, противникът ще отскочи.

QWERTY ефект

Понякога може да бъде много трудно да се премине от едно равновесие към друго, дори ако това означава полза за всички. Оформлението QWERTY е проектирано да намали скоростта на писане. Защото ако всички печатаха твърде бързо, главите пишеща машина, които удариха хартията, биха се вкопчили един в друг. Затова Кристофър Шоулс поставя букви, които често са съседни една на друга на възможно най-голямото разстояние. Ако отидете в настройките на клавиатурата на вашия компютър, можете да изберете оформлението на Dvorak там и да пишете много по-бързо, тъй като сега няма проблем с аналоговите машини за писане. Дворжак очакваше светът да премине към неговата клавиатура, но ние все още живеем с QWERTY. Разбира се, ако преминем към оформлението Дворак, бъдещите поколения ще са ни благодарни. Всички ще положим усилия и ще се научим отново, а резултатът ще бъде равновесие, в което всеки пише бързо. Сега също сме в баланс - в лош смисъл. Но за никого не е изгодно само той да се преквалифицира, защото ще е неудобно да работиш на друг компютър, освен на личен.