huis » Zomer schoenen » Samenvatting: Speltheorie en de praktische toepassing ervan. Wiskundige speltheorie

Samenvatting: Speltheorie en de praktische toepassing ervan. Wiskundige speltheorie

Voorwoord

Het doel van dit artikel is om de lezer vertrouwd te maken met de basisconcepten van de speltheorie. Uit het artikel zal de lezer leren wat speltheorie is, een korte geschiedenis van de speltheorie beschouwen, kennis maken met de belangrijkste bepalingen van de speltheorie, inclusief de belangrijkste soorten spellen en hun presentatievormen. Het artikel gaat in op het klassieke probleem en het fundamentele probleem van de speltheorie. Het laatste deel van het artikel is gewijd aan de overweging van de problemen van toepassing van speltheorie voor het nemen van managementbeslissingen en de praktische toepassing van speltheorie in management.

Invoering.

21ste eeuw. Het tijdperk van informatie, zich snel ontwikkelende informatietechnologie, innovatie en technologische innovatie. Maar waarom precies het informatietijdperk? Waarom speelt informatie een sleutelrol in bijna alle processen in de samenleving? Alles is heel eenvoudig. Informatie geeft ons tijd van onschatbare waarde, en in sommige gevallen zelfs de mogelijkheid om erop vooruit te lopen. Het is tenslotte voor niemand een geheim dat je in het leven vaak te maken krijgt met taken waarbij het nodig is om beslissingen te nemen in onzekere omstandigheden, bij gebrek aan informatie over de reacties op je acties, dat wil zeggen situaties ontstaan in welke twee (of meer) partijen verschillende doelen nastreven, en de resultaten van elke actie van elk van de partijen zijn afhankelijk van de activiteiten van de partner. Dergelijke situaties doen zich elke dag voor. Bijvoorbeeld bij het schaken, dammen, dominostenen enzovoort. Ondanks dat de games voornamelijk entertainment van aard zijn, hebben ze van nature betrekking op conflictsituaties waarin het conflict al is ingebed in het doel van het spel - een van de partners winnen. Tegelijkertijd hangt het resultaat van de zet van elke speler af van de vergeldingszet van de tegenstander. In de economie komen conflictsituaties heel vaak voor en zijn ze van uiteenlopende aard, en hun aantal is zo groot dat het onmogelijk is om alle conflictsituaties die zich in de markt voordoen op zijn minst in één dag te berekenen. Conflictsituaties in de economie zijn bijvoorbeeld de relatie tussen een leverancier en een consument, een koper en een verkoper, een bank en een klant. In alle bovenstaande voorbeelden wordt een conflictsituatie gegenereerd door het verschil in de belangen van partners en de wens van elk van hen om optimale beslissingen te nemen die de gestelde doelen zoveel mogelijk realiseren. Tegelijkertijd moet iedereen niet alleen rekening houden met zijn eigen doelen, maar ook met de doelen van de partner, en rekening houden met de vooraf onbekende beslissingen die deze partners zullen nemen. Voor competente probleemoplossing in conflictsituaties zijn wetenschappelijk onderbouwde methoden vereist. Dergelijke methoden zijn ontwikkeld door de wiskundige theorie van conflictsituaties, die wordt genoemd spel theorie.

Wat is speltheorie?

Speltheorie is een complex multidimensionaal concept, dus het lijkt onmogelijk om met slechts één definitie een interpretatie van speltheorie te geven. Overweeg drie benaderingen voor het definiëren van speltheorie.

1. Speltheorie is een wiskundige methode om optimale strategieën in games te bestuderen. Onder een game wordt verstaan een proces waarbij twee of meer partijen betrokken zijn in de strijd om de verwezenlijking van hun belangen. Elke kant heeft zijn eigen doel en gebruikt een strategie die kan leiden tot winst of verlies, afhankelijk van het gedrag van andere spelers. Speltheorie helpt je bij het kiezen van de beste strategieën, rekening houdend met de percepties van andere deelnemers, hun middelen en hun mogelijke acties.

2. Speltheorie is een tak van toegepaste wiskunde, meer bepaald operationeel onderzoek. Meestal worden speltheoriemethoden gebruikt in de economie, iets minder vaak in andere sociale wetenschappen - sociologie, politieke wetenschappen, psychologie, ethiek en andere. Sinds de jaren zeventig is het door biologen aangenomen om het gedrag van dieren en de evolutietheorie te bestuderen. Speltheorie is erg belangrijk voor kunstmatige intelligentie en cybernetica.

3. Een van de belangrijkste variabelen waarvan het succes van de organisatie afhangt - concurrentievermogen. Het is duidelijk dat het vermogen om de acties van concurrenten te voorspellen een voordeel is voor elke organisatie. Speltheorie is een methode om de beoordeling van de impact van een genomen beslissing op concurrenten te modelleren.

Geschiedenis van de speltheorie

Optimale oplossingen of strategieën in wiskundige modellering werden al in de 18e eeuw voorgesteld. De problemen van productie en prijsstelling in een oligopolie, dat later schoolvoorbeelden van speltheorie werden, werden in de 19e eeuw overwogen. A. Cournot en J. Bertrand. Aan het begin van de XX eeuw. E. Lasker, E. Cermelo, E. Borel brachten het idee van de wiskundige theorie van belangenverstrengeling naar voren.

Wiskundige speltheorie vindt zijn oorsprong in de neoklassieke economie. Voor het eerst werden de wiskundige aspecten en toepassingen van de theorie gepresenteerd in het klassieke boek uit 1944 van John von Neumann en Oskar Morgenstern, 'Game Theory and Economic Behaviour'.

John Nash ging na zijn afstuderen aan het Carnegie Polytechnic Institute met twee graden - bachelor en master - naar Princeton University, waar hij lezingen bijwoonde van John von Neumann. In zijn geschriften ontwikkelde Nash de principes van 'managementdynamiek'. De eerste concepten van de speltheorie analyseerden antagonistische spellen, wanneer er verliezers en winnaars zijn ten koste van hen. Nash ontwikkelt analysemethoden waarbij alle deelnemers winnen of falen. Deze situaties worden "Nash-evenwicht" of "niet-coöperatief evenwicht" genoemd, in een situatie waarbij de partijen de optimale strategie gebruiken, wat leidt tot het creëren van een stabiel evenwicht. Het is gunstig voor de spelers om dit evenwicht te bewaren, aangezien elke verandering hun situatie zal verslechteren. Deze werken van Nash hebben een belangrijke bijdrage geleverd aan de ontwikkeling van de speltheorie, de wiskundige instrumenten van economische modellering werden herzien. John Nash laat zien dat de klassieke benadering van competitie van A. Smith, waarin iedereen voor zichzelf is, niet optimaal is. Meer optimale strategieën zijn wanneer iedereen probeert het beter te doen voor zichzelf, het beter te doen voor anderen. In 1949 schreef John Nash een proefschrift over speltheorie, 45 jaar later ontving hij de Nobelprijs voor economie.

Hoewel de speltheorie tot de jaren vijftig oorspronkelijk naar economische modellen keek, bleef het een formele theorie binnen de wiskunde. Maar sinds de jaren vijftig. Pogingen begonnen de methoden van de speltheorie toe te passen, niet alleen in de economie, maar ook in de biologie, cybernetica, technologie en antropologie. Tijdens en direct na de Tweede Wereldoorlog raakte het leger serieus geïnteresseerd in speltheorie, die het zag als een krachtig apparaat voor het onderzoeken van strategische beslissingen.

1960 - 1970 de belangstelling voor speltheorie neemt af, ondanks de significante wiskundige resultaten die tegen die tijd zijn verkregen. Sinds het midden van de jaren tachtig. begint een actief praktisch gebruik van speltheorie, vooral in economie en management. In de afgelopen 20-30 jaar is het belang van speltheorie en interesse aanzienlijk toegenomen, sommige gebieden van de moderne economische theorie kunnen niet worden uiteengezet zonder de toepassing van speltheorie.

Een belangrijke bijdrage aan de toepassing van de speltheorie was het werk van Thomas Schelling, Nobelprijswinnaar voor economie in 2005, 'The Strategy of Conflict'. T. Schelling onderzoekt verschillende "strategieën" van gedrag van de partijen bij het conflict. Deze strategieën vallen samen met de tactieken van conflicthantering en de principes van conflictanalyse bij conflicthantering en bij de beheersing van conflicten in de organisatie.

Grondbeginselen van de speltheorie

Laten we kennis maken met de basisconcepten van de speltheorie. Het wiskundige model van een conflictsituatie heet spel, partijen bij het conflict - spelers... Om het spel te beschrijven, moet je eerst de deelnemers (spelers) identificeren. Aan deze voorwaarde wordt gemakkelijk voldaan als het gaat om gewone spellen zoals schaken, enz. De situatie is anders bij "marktspellen". Het is niet altijd gemakkelijk om alle spelers hier te herkennen, d.w.z. huidige of potentiële concurrenten. De praktijk leert dat het niet nodig is om alle spelers te identificeren, maar om de belangrijkste te vinden. Games beslaan meestal meerdere perioden waarin spelers opeenvolgende of gelijktijdige acties uitvoeren. De keuze en uitvoering van een van de acties waarin de regels voorzien, wordt genoemd Actie speler. De zetten kunnen persoonlijk of willekeurig zijn. persoonlijke zet is een bewuste keuze van de speler voor een van de mogelijke acties (bijvoorbeeld een zet in een schaakspel). willekeurige zet is een willekeurig gekozen actie (bijvoorbeeld een kaart kiezen uit een geschud kaartspel). Activiteiten kunnen betrekking hebben op prijzen, verkoopvolumes, onderzoeks- en ontwikkelingskosten, enz. De perioden waarin de spelers hun zetten doen, worden genoemd stadia spellen. De bewegingen die in elke fase worden gekozen, bepalen uiteindelijk: "betalingen"(winst of verlies) van elke speler, wat kan worden uitgedrukt in materiële waarden of geld. Een ander concept van deze theorie is de strategie van de speler. Strategie een speler is een reeks regels die de keuze van zijn actie voor elke persoonlijke zet bepalen, afhankelijk van de huidige situatie. Meestal maakt de speler tijdens het spel bij elke persoonlijke zet een keuze afhankelijk van de specifieke situatie. In principe is het echter mogelijk dat alle beslissingen vooraf door de speler worden genomen (in reactie op elke situatie die zich voordoet). Dit betekent dat de speler een bepaalde strategie heeft gekozen, die kan worden ingesteld in de vorm van een lijst met regels of een programma. (Zo speel je het spel met een computer). Met andere woorden, een strategie wordt opgevat als mogelijke acties waarmee een speler in elke fase van het spel kan kiezen uit een bepaald aantal alternatieve opties, zoals een zet die hem de "beste reactie" lijkt op de acties van andere spelers. Met betrekking tot het concept van strategie moet worden opgemerkt dat de speler zijn acties niet alleen bepaalt voor de fasen die een bepaald spel daadwerkelijk heeft bereikt, maar ook voor alle situaties, inclusief situaties die zich tijdens dit spel niet voordoen. Het spel heet stoombad als er twee spelers aan deelnemen, en meerdere als het aantal spelers meer dan twee is. Voor elk geformaliseerd spel worden regels geïntroduceerd, d.w.z. een systeem van voorwaarden dat bepaalt: 1) opties voor acties van spelers; 2) de hoeveelheid informatie die elke speler heeft over het gedrag van partners; 3) de winst waartoe elke reeks acties leidt. Doorgaans kan de winst (of het verlies) worden gekwantificeerd; u kunt bijvoorbeeld een verlies schatten als nul, een winst als één en een gelijkspel als ½. Een spel wordt een nulsomspel of antagonistisch genoemd als de winst van een van de spelers gelijk is aan het verlies van de ander, dwz voor een volledige taak van het spel is het voldoende om de waarde van een van de spelers aan te geven. hen. Als we aanduiden: een- winsten van een van de spelers, B- de uitbetaling van de ander, dan voor een nulsomspel b = -а, daarom is het voldoende om bijvoorbeeld te overwegen: A. Het spel heet ultiem, als elke speler een eindig aantal strategieën heeft, en eindeloos- anders. Tot beslissen spel, of vind spel oplossing, moet men voor elke speler een strategie kiezen die aan de voorwaarde voldoet optimaliteit, die. een van de spelers moet ontvangen maximale winst wanneer de ander vasthoudt aan zijn strategie. Tegelijkertijd moet de tweede speler hebben: minimaal verlies als de eerste zich aan zijn strategie houdt. Zo een strategie worden genoemd optimaal... Optimale strategieën moeten ook voldoen aan de voorwaarde duurzaamheid, dat wil zeggen, het zou voor geen van de spelers onrendabel moeten zijn om hun strategie in dit spel op te geven. Als het spel vele malen wordt herhaald, zijn de spelers misschien niet geïnteresseerd in winnen en verliezen in elk specifiek spel, maar gemiddelde winst (verlies) bij alle partijen. Het doel speltheorie is het bepalen van de optimale strategieën voor elke speler... Bij het kiezen van de optimale strategie ligt het voor de hand om aan te nemen dat beide spelers zich vanuit hun belangen redelijk gedragen.

Coöperatief en niet-coöperatief

Het spel heet coöperatief, of coalitie, als spelers groepen kunnen vormen, verplichtingen op zich kunnen nemen jegens andere spelers en hun acties kunnen coördineren. Dit verschilt van niet-coöperatieve spellen waarbij iedereen verplicht is om voor zichzelf te spelen. Recreatieve spellen zijn zelden coöperatief, maar dergelijke mechanismen zijn niet ongewoon in het dagelijks leven.

Vaak wordt aangenomen dat coöperatieve spellen zich juist onderscheiden door het vermogen van spelers om met elkaar te communiceren. In het algemeen is dit niet waar. Er zijn games waarbij communicatie is toegestaan, maar de spelers persoonlijke doelen nastreven en vice versa.

Hybride spellen bevatten elementen van coöp- en niet-coöpspellen. Spelers kunnen bijvoorbeeld groepen vormen, maar het spel wordt gespeeld in een niet-coöperatieve stijl. Dit betekent dat elke speler de belangen van zijn groep nastreeft en tegelijkertijd persoonlijk gewin probeert te behalen.

Symmetrisch en asymmetrisch




Asymmetrisch spel

Het spel zal symmetrisch zijn wanneer de spelers gelijke strategieën hebben, dat wil zeggen, ze hebben dezelfde betalingen. Met andere woorden, als de spelers van plaats kunnen wisselen en hun winsten voor dezelfde zetten niet veranderen. Veel van de tweespelerspellen die worden bestudeerd, zijn symmetrisch. Dit zijn met name: "Prisoner's Dilemma", "Deer Hunt". In het voorbeeld aan de rechterkant lijkt het spel op het eerste gezicht misschien symmetrisch vanwege vergelijkbare strategieën, maar dat is niet zo - de uitbetaling van de tweede speler met strategieprofielen (A, A) en (B, B) zal immers groter zijn dan die van de eerste.

Nul-som en niet-nul-som

Nulsomspellen zijn een speciaal soort spellen met een vast bedrag, dat wil zeggen spellen waarbij spelers de beschikbare middelen of het geld van het spel niet kunnen verhogen of verlagen. In dit geval is de som van alle winsten gelijk aan de som van alle verliezen bij elke zet. Kijk naar rechts - de cijfers vertegenwoordigen betalingen aan de spelers - en hun totaal in elke cel is nul. Voorbeelden van dergelijke spellen zijn poker, waarbij men alle inzetten van anderen wint; omgekeerd, waar de stukken van de tegenstander worden geslagen; of banaal diefstal.

Veel spellen die door wiskundigen zijn bestudeerd, waaronder het reeds genoemde "Prisoner's Dilemma", zijn van een ander soort: niet-nul-som spellen de winst van de ene speler betekent niet noodzakelijk het verlies van een andere, en vice versa. De uitkomst van zo'n spel kan kleiner of groter zijn dan nul. Dergelijke spellen kunnen worden geconverteerd naar nulsom - dit wordt gedaan door te introduceren fictieve speler, die het overschot "toeëigent" of het gebrek aan middelen compenseert.

Een ander spel met een som die niet nul is, is handel waar elk lid van profiteert. Dit omvat ook dammen en schaken; in de laatste twee kan de speler zijn gewone stuk in een sterker stuk veranderen en een voordeel behalen. In al deze gevallen neemt het bedrag van het spel toe. Een bekend voorbeeld waarbij het afneemt is oorlog.

Parallel en sequentieel

In parallelle spellen bewegen de spelers tegelijkertijd, of zijn ze zich tenminste niet bewust van de keuzes van anderen totdat alle zullen hun zet niet doen. Opeenvolgend, of dynamisch In games kunnen deelnemers zetten doen in een vooraf bepaalde of willekeurige volgorde, maar tegelijkertijd krijgen ze informatie over eerdere acties van anderen. Deze informatie kan zelfs niet helemaal compleet een speler kan er bijvoorbeeld achter komen dat zijn tegenstander uit zijn tien strategieën zeker niet gekozen ten vijfde, niets weten over anderen.

De verschillen in de presentatie van parallelle en sequentiële spellen zijn hierboven besproken. De eerste worden meestal gepresenteerd in normale vorm, en de laatste in uitgebreide vorm.

Met volledige of onvolledige informatie

Games met volledige informatie vormen een belangrijke subset van opeenvolgende games. In zo'n spel kennen de deelnemers alle bewegingen die tot nu toe zijn gemaakt, evenals de mogelijke strategieën van de tegenstanders, waardoor ze de verdere ontwikkeling van het spel tot op zekere hoogte kunnen voorspellen. Volledige informatie is niet beschikbaar in parallelle spellen, omdat ze de huidige zetten van de tegenstanders niet kennen. De meeste spellen die in de wiskunde worden bestudeerd, bevatten onvolledige informatie. Bijvoorbeeld alle "zout" Prisoner's dilemma's ligt in zijn onvolledigheid.

Voorbeelden van spellen met volledige informatie: schaken, dammen en andere.

Vaak wordt het concept van volledige informatie verward met iets soortgelijks: perfecte informatie... Voor dit laatste is alleen kennis van alle strategieën die beschikbaar zijn voor tegenstanders voldoende, kennis van al hun zetten is niet nodig.

Games met een oneindig aantal stappen

Echte games of games die in economie zijn gestudeerd, hebben de neiging om lang mee te gaan de laatste aantal zetten. Wiskunde is niet zo beperkt, en in het bijzonder gaat de verzamelingenleer over spellen die oneindig kunnen doorgaan. Bovendien worden de winnaar en zijn winst pas aan het einde van alle zetten bepaald.

Het probleem dat zich in dit geval meestal stelt, is niet om een optimale oplossing te vinden, maar om op zijn minst een winnende strategie te vinden.

Discrete en continue games

De meeste van de bestudeerde games discreet: ze hebben een eindig aantal spelers, zetten, gebeurtenissen, uitkomsten, enz. Deze componenten kunnen echter worden uitgebreid tot een reeks reële getallen. Games die deze elementen bevatten, worden vaak differentiële games genoemd. Ze worden geassocieerd met een soort materiële schaal (meestal een tijdschaal), hoewel de gebeurtenissen die erin plaatsvinden discreet van aard kunnen zijn. Differentiële spellen worden gebruikt in techniek en technologie, natuurkunde.

Metagames

Dit zijn spellen die resulteren in een set regels voor een ander spel (genaamd doelwit of game-object). Het doel van metagames is om het nut van de geproduceerde set regels te vergroten.

Spelpresentatieformulier

In de speltheorie speelt, naast de classificatie van spellen, de vorm van spelpresentatie een grote rol. Gewoonlijk wordt een normale of matrixvorm onderscheiden en een uitgebreide, gegeven in de vorm van een boom. Deze vormen voor een eenvoudig spel worden getoond in Fig. 1a en 1b.

Om de eerste verbinding met het rijk van de controle tot stand te brengen, kan het spel als volgt worden beschreven. Twee fabrieken die homogene producten produceren, staan voor een keuze. In het ene geval kunnen ze voet aan de grond krijgen op de markt door een hoge prijs vast te stellen, wat hen een gemiddelde kartelwinst P K oplevert. Bij het aangaan van een zware concurrentiestrijd ontvangen beide winst P W. Als een van de concurrenten een hoge prijs stelt en de andere een lage prijs, dan realiseert de laatste de monopoliewinst P M, terwijl de ander verlies P G lijdt. Een soortgelijke situatie kan zich bijvoorbeeld voordoen wanneer beide bedrijven hun prijzen moeten bekendmaken, die achteraf niet kunnen worden herzien.

Bij gebrek aan strikte voorwaarden is het voor beide ondernemingen gunstig om een lage prijs vast te stellen. De "lage prijs"-strategie is dominant voor elk bedrijf: welke prijs het concurrerende bedrijf ook kiest, het heeft altijd de voorkeur om een lage prijs vast te stellen. Maar in dit geval staan de bedrijven voor een dilemma, aangezien de winst P K (die voor beide spelers hoger is dan de winst P W) niet wordt behaald.

De strategische combinatie van "lage prijzen / lage prijzen" met de bijbehorende betalingen is een Nash-evenwicht, waarbij het voor geen van de spelers winstgevend is om afzonderlijk van de gekozen strategie af te wijken. Dit concept van evenwicht is fundamenteel bij het oplossen van strategische situaties, maar vereist onder bepaalde omstandigheden nog steeds verbetering.

Wat het bovenstaande dilemma betreft, de oplossing hangt in het bijzonder af van de originaliteit van de zetten van de spelers. Als een onderneming de mogelijkheid heeft om haar strategische variabelen (in dit geval de prijs) te herzien, kan een coöperatieve oplossing voor het probleem worden gevonden, zelfs zonder een rigide overeenkomst tussen de spelers. Intuïtie schrijft voor dat er bij meerdere contacten van spelers mogelijkheden zijn om tot een acceptabele "compensatie" te komen. Zo is het onder bepaalde omstandigheden ongepast om te streven naar hoge winsten op korte termijn door middel van prijsdumping als er in de toekomst een "prijzenoorlog" kan ontstaan.

Zoals opgemerkt kenmerken beide figuren hetzelfde spel. De weergave van het spel in normale vorm weerspiegelt normaal gesproken "synchroniciteit". Dit betekent echter niet de "gelijktijdigheid" van gebeurtenissen, maar geeft aan dat de keuze van de strategie door de speler wordt uitgevoerd in omstandigheden van onwetendheid over de keuze van de strategie door de tegenstander. In de uitgevouwen vorm wordt deze situatie uitgedrukt door de ovale ruimte (informatieveld). Bij het ontbreken van deze ruimte krijgt de spelsituatie een ander karakter: eerst moet de ene speler een beslissing nemen en de andere kan dat na hem doen.

Een klassiek probleem in de speltheorie

Overweeg een klassiek probleem in de speltheorie. Herten jagen is een coöperatief symmetrisch spel uit de speltheorie dat het conflict tussen eigenbelang en algemeen belang beschrijft. Het spel werd voor het eerst beschreven door Jean-Jacques Rousseau in 1755:

"Als ze op een hert jaagden, dan begreep iedereen dat hij hiervoor op zijn post moest blijven; maar als een haas in de buurt van een van de jagers liep, dan was er geen twijfel dat deze jager, zonder een gewetenswroeging, hem zou achtervolgen en, na de prooi te hebben ingehaald, zal heel weinig betreuren dat hij op deze manier zijn kameraden van prooi heeft beroofd."

De jacht op herten is een klassiek voorbeeld van de taak om een publiek goed te verschaffen wanneer een persoon in de verleiding komt te zwichten voor eigenbelang. Moet de jager bij zijn kameraden blijven en wedden op een minder gunstige gelegenheid om grote prooien aan de hele stam af te leveren, of zijn kameraden verlaten en zich toevertrouwen aan een betrouwbaarder zaak die zijn eigen hazenfamilie belooft?

Een fundamenteel probleem in de speltheorie

Overweeg een fundamenteel probleem in de speltheorie dat het Prisoner's Dilemma wordt genoemd.

Het dilemma van de gevangene is een fundamenteel probleem in de speltheorie dat spelers niet altijd met elkaar zullen samenwerken, zelfs als het in hun eigen belang is om dat te doen. Er wordt aangenomen dat de speler (de “gevangene”) zijn eigen gewin maximaliseert zonder zich te bekommeren om het voordeel van anderen. De kern van het probleem werd in 1950 geformuleerd door Merrill Flood en Melvin Drescher. De naam van het dilemma werd gegeven door de wiskundige Albert Tucker.

In het gevangenendilemma, verraad strikt domineert over samenwerking, dus de enige mogelijke balans is het verraad van beide deelnemers. Simpel gezegd, wat de andere speler ook doet, iedereen zal meer winnen als ze verraden. Aangezien verraad in elke situatie winstgevender is dan samenwerking, zullen alle rationele spelers voor verraad kiezen.

Door zich afzonderlijk rationeel te gedragen, komen de deelnemers samen tot een irrationele beslissing: als ze allebei verraden, krijgen ze in totaal minder winst dan wanneer ze zouden samenwerken (het enige evenwicht in dit spel leidt niet tot Pareto-optimaal oplossing, d.w.z. oplossing die niet kan worden verbeterd zonder de positie van andere elementen te verslechteren.). Dit is het dilemma.

In het repetitieve prisoner's dilemma vindt het spel met tussenpozen plaats en kan elke speler de ander 'straffen' omdat hij niet eerder heeft meegewerkt. In zo'n spel kan samenwerking een balans worden, en de prikkel om te verraden kan worden gecompenseerd door de dreiging van straf.

Het klassieke prisoner's dilemma

In alle rechtsstelsels is de straf voor banditisme (het plegen van misdaden als onderdeel van een georganiseerde groep) veel zwaarder dan voor dezelfde misdaden die alleen worden gepleegd (vandaar de alternatieve naam - "bandietendilemma").

De klassieke formulering van het prisoner's dilemma is:

Twee criminelen, A en B, werden ongeveer tegelijkertijd betrapt op soortgelijke misdaden. Er is reden om aan te nemen dat ze in samenspanning hebben gehandeld, en de politie, die hen van elkaar isoleert, biedt hen dezelfde deal aan: als de een tegen de ander getuigt en hij zwijgt, dan wordt de eerste vrijgelaten voor het helpen van het onderzoek, en de tweede krijgt de maximumstraf gevangenisstraf (10 jaar) (20 jaar). Als beiden zwijgen, wordt hun daad onderworpen aan een lichter artikel en worden ze veroordeeld tot 6 maanden (1 jaar). Als beiden tegen elkaar getuigen, krijgen ze een minimumstraf (elk 2 jaar) (5 jaar). Elke gevangene kiest of hij wil zwijgen of tegen de ander wil getuigen. Geen van beiden weet echter precies wat de ander gaat doen. Wat gaat er gebeuren?

Het spel kan worden weergegeven in de vorm van de volgende tabel:

Het dilemma ontstaat als we aannemen dat het beiden alleen maar gaat om het minimaliseren van hun eigen gevangenisstraf.

Laten we de redenering van een van de gevangenen presenteren. Als de partner zwijgt, is het beter om hem te verraden en vrijgelaten te worden (anders - zes maanden gevangenisstraf). Als de partner getuigt, is het beter om ook tegen hem te getuigen om 2 jaar te krijgen (anders - 10 jaar). De "getuigen"-strategie domineert strikt de "zwijg"-strategie. Evenzo komt een andere gevangene tot dezelfde conclusie.

Vanuit het oogpunt van de groep (deze twee gedetineerden) is het het beste om met elkaar samen te werken, te zwijgen en elk zes maanden te krijgen, omdat dit de totale gevangenisstraf vermindert. Elke andere oplossing zal minder gunstig zijn.

gegeneraliseerde vorm

Het spel heeft twee spelers en een bankier. Elke speler heeft 2 kaarten: de ene zegt "samenwerken", de andere zegt "verraden" (dit is de standaardterminologie van het spel). Elke speler legt een kaart met de afbeelding naar beneden voor de bankier (d.w.z. niemand kent de beslissing van de ander, hoewel kennis van de beslissing van de ander geen invloed heeft op de dominantieanalyse). De bankier opent de kaarten en deelt de winst uit.
Als beide ervoor kiezen om samen te werken, ontvangen beide C... Als de een ervoor kiest om te "verraden", de ander "om mee te werken" - de eerste krijgt NS, tweede met... Als beide ervoor kiezen om te "verraden" - krijgen beide NS.
De waarden van de variabelen C, D, c, d kunnen van elk teken zijn (in het bovenstaande voorbeeld is alles kleiner dan of gelijk aan 0). De ongelijkheid D> C> d> c moet in acht worden genomen om het spel het Prisoner's Dilemma (DZ) te laten vertegenwoordigen.
Als het spel wordt herhaald, dat wil zeggen dat het meer dan 1 keer achter elkaar wordt gespeeld, moet de totale winst uit samenwerking groter zijn dan de totale winst in een situatie waarin de ene verraadt en de andere niet, dat wil zeggen, 2C> D + c.

Deze regels zijn opgesteld door Douglas Hofstadter en vormen een canonieke beschrijving van het typische prisoner's dilemma.

Een vergelijkbaar maar ander spel

Hofstadter suggereerde dat mensen taken gemakkelijker begrijpen als een prisoner's dilemma-taak wanneer ze worden gepresenteerd als een afzonderlijk spel of handelsproces. Een voorbeeld is “ gesloten tassen uitwisseling»:

Twee mensen ontmoeten elkaar en wisselen gesloten tassen uit, zich realiserend dat een van hen geld bevat en de andere goederen. Elke speler kan de deal respecteren en in de zak stoppen wat ze hebben afgesproken, of de partner bedriegen door een lege zak te geven.

In dit spel zal vals spelen altijd de beste oplossing zijn, wat ook betekent dat rationele spelers het nooit zullen spelen en dat er geen gesloten beurs zal zijn.

Toepassing van speltheorie op strategische managementbeslissingen

Voorbeelden zijn beslissingen over het voeren van een principieel prijsbeleid, het betreden van nieuwe markten, samenwerken en het opzetten van joint ventures, het identificeren van leiders en uitvoerders op het gebied van innovatie, verticale integratie, enz. Speltheorie kan in principe voor allerlei beslissingen worden gebruikt, zolang andere actoren hun adoptie beïnvloeden. Deze personen of spelers hoeven geen marktconcurrenten te zijn; dit kunnen onderleveranciers, hoofdklanten, medewerkers van de organisatie en collega's zijn.

Speltheorie-instrumenten zijn vooral handig wanneer er belangrijke afhankelijkheden zijn tussen de deelnemers aan het proces. op het gebied van betalingen... De situatie met mogelijke concurrenten is weergegeven in Fig. 2.

 Kwadranten 1 en 2 kenmerken een situatie waarin de reactie van concurrenten de betalingen van de onderneming niet significant beïnvloedt. Dit gebeurt wanneer de deelnemer geen motivatie heeft (veld 1 ) of kans (veld 2 ) terug slaan. Daarom is er geen behoefte aan een gedetailleerde analyse van de strategie van gemotiveerde acties van concurrenten.

Een soortgelijke conclusie volgt, zij het om een andere reden, en voor de situatie die wordt weergegeven door het kwadrant 3 ... Dit is waar de reactie van een concurrent een aanzienlijke impact op het bedrijf kan hebben, maar aangezien zijn eigen acties de betalingen van een concurrent niet sterk kunnen beïnvloeden, hoeft zijn reactie niet te worden gevreesd. Een voorbeeld is de beslissing om een marktniche te betreden: grote concurrenten hebben onder bepaalde omstandigheden geen reden om te reageren op een dergelijke beslissing van een klein bedrijf.

Alleen de situatie weergegeven in het kwadrant 4 (de mogelijkheid van wederzijdse stappen van marktpartners), vereist het gebruik van de bepalingen van de speltheorie. Het weerspiegelt echter alleen de noodzakelijke maar onvoldoende voorwaarden om de toepassing van de basis van de speltheorie om concurrenten te bestrijden te rechtvaardigen. Er zijn situaties waarin één strategie zeker alle andere zal domineren, wat de concurrent ook zal doen. Als we bijvoorbeeld de drugsmarkt nemen, dan is het voor een bedrijf vaak belangrijk om als eerste een nieuw product op de markt aan te kondigen: de winst van de “pionier” blijkt zo groot dat alle andere “spelers ” kunnen hun innovatieactiviteit alleen maar snel intensiveren.

 Een triviaal voorbeeld van een "dominante strategie" vanuit het standpunt van de speltheorie is een beslissing over: penetratie in een nieuwe markt. Neem een onderneming die op een bepaalde markt als monopolist optreedt (bijvoorbeeld IBM op de pc-markt in het begin van de jaren tachtig). Een andere onderneming, die bijvoorbeeld actief is op de markt van randapparatuur voor computers, overweegt de kwestie om de markt voor personal computers te penetreren met een omschakeling van de productie ervan. Een buitenstaander kan beslissen om wel of niet de markt te betreden. Een monopoliebedrijf kan agressief of vriendelijk reageren op de opkomst van een nieuwe concurrent. Beide bedrijven gaan een spel in twee fasen in waarin het bedrijf van buitenaf de eerste zet doet. De spelsituatie met de aanduiding van betalingen is weergegeven in de vorm van een boom in figuur 3.

 Dezelfde spelsituatie kan in normale vorm worden weergegeven (fig. 4).

Er zijn hier twee statussen - "binnenkomst / vriendelijke reactie" en "niet-binnenkomst / agressieve reactie". Het tweede evenwicht is duidelijk onhoudbaar. Uit de uitgebreide vorm volgt dat het voor een bedrijf dat al in de markt is verankerd ongepast is om agressief te reageren op de opkomst van een nieuwe concurrent: bij agressief gedrag krijgt de huidige monopolist 1 (betaling), en als het vriendelijk is - 3. Het buitenstaander bedrijf weet ook dat het niet rationeel is dat een monopolist acties initieert om het te verdrijven, en daarom besluit het de markt te betreden. Het externe bedrijf zal geen dreigende verliezen lijden ten bedrage van (-1).

Zo'n rationeel evenwicht is kenmerkend voor een "gedeeltelijk verbeterd" spel, dat bewust absurde zetten uitsluit. In de praktijk zijn dergelijke evenwichtstoestanden in principe vrij eenvoudig te vinden. Evenwichtsconfiguraties kunnen worden geïdentificeerd met behulp van een speciaal algoritme uit het veld van operationeel onderzoek voor elk eindig spel. De beslisser gaat als volgt te werk: eerst wordt de "beste" zet in de laatste fase van het spel gekozen, vervolgens wordt de "beste" zet in de vorige fase gekozen, rekening houdend met de keuze in de laatste fase , enzovoort, totdat het startknooppunt van de boom games is bereikt.

Hoe kunnen bedrijven profiteren van speltheorie-analyse? Zo is er een belangenconflict tussen IBM en Telex. In verband met de aankondiging van de voorbereidende plannen van laatstgenoemde om de markt te betreden, werd een "crisis"-bijeenkomst van de IBM-directie gehouden, waar de maatregelen die erop gericht waren de nieuwe concurrent te doen afzien van zijn voornemen om de nieuwe markt te betreden, werden geanalyseerd. Telex was blijkbaar op de hoogte van deze gebeurtenissen. Analyse op basis van speltheorie heeft aangetoond dat de hoge kosten van IBM's dreigingen onredelijk zijn. Hieruit blijkt dat het voor bedrijven nuttig is om na te denken over de mogelijke reacties van hun gamepartners. Geïsoleerde bedrijfsberekeningen, zelfs gebaseerd op de theorie van de besluitvorming, zijn vaak, zoals in de beschreven situatie, beperkt van aard. Een bedrijf van buitenaf had dus voor de "non-entry"-koers kunnen kiezen als een voorlopige analyse het ervan had overtuigd dat marktpenetratie een agressieve reactie van de monopolist zou uitlokken. In dit geval is het, in overeenstemming met het verwachtingswaardecriterium, redelijk om de "niet-entry" -zet te kiezen met een waarschijnlijkheid van een agressieve reactie van 0,5.

 Het volgende voorbeeld heeft betrekking op rivaliteit tussen bedrijven op het gebied van technologisch leiderschap. De uitgangssituatie is wanneer de onderneming 1 had voorheen technologische superioriteit, maar heeft nu minder financiële middelen voor onderzoek en ontwikkeling (R&D) dan zijn concurrent. Beide ondernemingen moeten beslissen of ze met behulp van grote investeringen een dominante positie op de wereldmarkt op het relevante technologische gebied willen bereiken. Als beide concurrenten grote fondsen in het bedrijf investeren, dan zijn de vooruitzichten op succes van de onderneming 1 beter zal zijn, hoewel het grote financiële kosten met zich meebrengt (zoals het bedrijf) 2 ). In afb. 5 deze situatie wordt weergegeven door betalingen met negatieve waarden.

Voor de onderneming 1 het zou het beste zijn als de onderneming 2 wedstrijd verlaten. Zijn uitkering zou dan 3 (uitkeringen) zijn. Hoogstwaarschijnlijk de onderneming 2 de rivaliteit zou winnen als de onderneming 1 zou een beperkt investeringsprogramma accepteren, en het bedrijf 2 - breder. Deze positie wordt weergegeven in het kwadrant rechtsboven in de matrix.

Analyse van de situatie laat zien dat evenwicht optreedt tegen hoge kosten van onderzoek en ontwikkeling van de onderneming. 2 en lage ondernemingen 1 ... In elk ander scenario heeft een van de concurrenten een reden om af te wijken van de strategische combinatie: bijvoorbeeld voor een onderneming 1 een verlaagd budget heeft de voorkeur als het bedrijf 2 weigert deel te nemen aan de rivaliteit; tegelijkertijd de onderneming 2 het is bekend dat het tegen lage kosten voor een concurrent winstgevend is om in R&D te investeren.

Een onderneming met een technologische voorsprong kan speltheorie gebruiken om de situatie te analyseren om uiteindelijk het optimale resultaat te bereiken. Met behulp van een bepaald signaal moet het aantonen dat het bereid is grote uitgaven voor onderzoek en ontwikkeling te doen. Als een dergelijk signaal niet wordt ontvangen, dan voor de onderneming 2 het is duidelijk dat de onderneming 1 kiest voor de goedkope optie.

De betrouwbaarheid van het signaal moet blijken uit de inzet van de onderneming. In dit geval kan het een besluit van een onderneming zijn 1 bij de aankoop van nieuwe laboratoria of de aanwerving van bijkomend onderzoekspersoneel.

Vanuit speltheoretisch oogpunt komen dergelijke toezeggingen neer op het veranderen van het spelverloop: de situatie van gelijktijdige besluitvorming wordt vervangen door de situatie van opeenvolgende zetten. Bedrijf 1 toont duidelijk de intentie om naar hoge kosten te gaan, de onderneming 2 registreert deze stap en hij heeft geen reden meer om deel te nemen aan de rivaliteit. Het nieuwe evenwicht komt voort uit de afstemming van "niet-deelname van de onderneming" 2 "en" hoge kosten van onderzoek en ontwikkeling van de onderneming; 1 ".

 Bekende toepassingsgebieden van speltheoriemethoden zijn onder meer: prijsstrategie, oprichting van joint ventures, timing van de ontwikkeling van nieuwe producten.

Een belangrijke bijdrage aan het gebruik van speltheorie wordt geleverd door: experimenteel werk... Veel theoretische berekeningen worden uitgewerkt in laboratoriumomstandigheden en de verkregen resultaten dienen als een aanzet voor beoefenaars. Theoretisch is uitgezocht onder welke voorwaarden het raadzaam is dat twee egoïstische partners samenwerken en voor zichzelf de beste resultaten behalen.

Deze kennis kan in de bedrijfspraktijk worden gebruikt om twee bedrijven te helpen een win / win-situatie te bereiken. Tegenwoordig identificeren game-opgeleide consultants snel en ondubbelzinnig kansen die bedrijven kunnen gebruiken om stabiele en langdurige contracten aan te gaan met klanten, onderleveranciers, ontwikkelingspartners en dergelijke.

Problemen van praktische toepassing in management

Natuurlijk moet ook worden gewezen op het bestaan van bepaalde grenzen aan de toepassing van de analytische toolkit van de speltheorie. In de volgende gevallen kan het alleen worden gebruikt op voorwaarde van aanvullende informatie.

Aanvankelijk, dit is het geval wanneer bedrijven verschillende ideeën hebben over het spel waaraan ze deelnemen, of wanneer ze niet voldoende op de hoogte zijn van elkaars mogelijkheden. Zo kan er onduidelijke informatie zijn over de betalingen van een concurrent (kostenstructuur). Als niet al te complexe informatie wordt gekenmerkt door onvolledigheid, dan is het mogelijk om dergelijke gevallen te vergelijken, rekening houdend met bepaalde verschillen.

Ten tweede, speltheorie is moeilijk toe te passen op veel evenwichtssituaties. Dit probleem kan zich zelfs voordoen tijdens eenvoudige spellen met een gelijktijdige keuze van strategische beslissingen.

Ten derde, als de situatie van het nemen van strategische beslissingen erg moeilijk is, dan kunnen spelers vaak niet de beste opties voor zichzelf kiezen. Het is gemakkelijk om een complexere marktpenetratiesituatie voor te stellen dan de hierboven besproken situatie. Er kunnen bijvoorbeeld meerdere ondernemingen op verschillende tijdstippen de markt betreden, of de reactie van ondernemingen die daar al actief zijn, kan moeilijker zijn dan agressief of vriendelijk.

Het is experimenteel bewezen dat wanneer het spel wordt uitgebreid tot tien of meer fasen, de spelers niet langer in staat zijn om de juiste algoritmen te gebruiken en het spel voort te zetten met evenwichtsstrategieën.

Speltheorie wordt niet vaak gebruikt. Helaas zijn situaties in de echte wereld vaak erg complex en veranderen ze zo snel dat het onmogelijk is om nauwkeurig te voorspellen hoe concurrenten zullen reageren op veranderingen in bedrijfstactieken. Desalniettemin is speltheorie nuttig wanneer het nodig is om de belangrijkste en meest in aanmerking komende factoren te bepalen in een competitieve besluitvormingssituatie. Deze informatie is belangrijk omdat het het management in staat stelt aanvullende variabelen of factoren in overweging te nemen die van invloed kunnen zijn op de situatie, en daardoor de effectiviteit van de beslissing verbetert.

Concluderend moet worden benadrukt dat speltheorie een zeer complex kennisgebied is. Bij het verwijzen ernaar moet men een zekere voorzichtigheid in acht nemen en duidelijk de grenzen van de toepassing kennen. Te eenvoudige interpretaties, die door het bedrijf alleen of met hulp van adviseurs worden aangenomen, brengen verborgen gevaren met zich mee. Vanwege de complexiteit wordt speltheorie-analyse en -advies alleen aanbevolen voor kritieke probleemgebieden. De ervaring van bedrijven leert dat het gebruik van geschikte instrumenten de voorkeur verdient bij het nemen van eenmalige, fundamenteel belangrijke strategische planningsbeslissingen, ook bij het voorbereiden van grote samenwerkingsovereenkomsten.

Bibliografie

1. Speltheorie en economisch gedrag, von Neumann J., Morgenstern O., Uitgeverij Nauka, 1970

2. Petrosyan L.A., Zenkevich N.A., Semina E.A. Speltheorie: leerboek. handleiding voor hoge bontlaarzen - M.: Hoger. school, Boekenhuis "Universiteit", 1998

3. Dubina I. N. Grondbeginselen van de theorie van economische spellen: leerboek.- M.: KNORUS, 2010

4. Archief van het tijdschrift "Problems of Theory and Practice of Management"., Rainer Felker

5. Speltheorie in het beheer van organisatiesystemen. 2e editie., Gubko MV, Novikov DA 2005

- J.J. Rousseau. Verhandeling over de oorsprong en grondslagen van ongelijkheid tussen mensen // Traktaten / Per. met Frans A. Khayutina - Moskou: Nauka, 1969 .-- P. 75.

Een grappig voorbeeld van de toepassing van speltheorie is te vinden in het fantasieboek van Anthony Pierce "The Brave Golem"

Veel tekst

"Het punt van wat ik jullie allemaal ga laten zien," begon Grundy, "is om het vereiste aantal punten te behalen. De scores kunnen heel verschillend zijn - het hangt allemaal af van de combinatie van beslissingen die door de deelnemers aan het spel worden genomen. Stel bijvoorbeeld dat elke deelnemer tegen zijn of haar speelkameraad getuigt. In dit geval kan aan elke deelnemer één punt worden toegekend!
- Een punt! - zei de Sea Witch, die een onverwachte interesse in het spel toonde. Het is duidelijk dat de tovenares ervoor wilde zorgen dat de golem geen kans had dat de demon Xanth er blij mee zou zijn.
- Laten we nu aannemen dat elk van de deelnemers aan het spel niet tegen zijn kameraad getuigt! - vervolgde Grundy. - In dit geval kan elk drie punten worden toegekend. Ik wil er vooral op wijzen dat zolang alle deelnemers zich op dezelfde manier gedragen, ze hetzelfde aantal punten krijgen. Niemand heeft enig voordeel ten opzichte van anderen.
- Drie punten! zei de tweede heks.
- Maar nu hebben we het recht om te suggereren dat een van de spelers begon te getuigen tegen de tweede, en de tweede zwijgt nog steeds! Zei Grundy. - In dit geval krijgt degene die deze metingen geeft vijf punten tegelijk, en degene die zwijgt krijgt geen enkel punt!
- Aha! - riepen beide heksen in één stem, roofzuchtig hun lippen likkend. Het was duidelijk dat ze allebei duidelijk vijf punten gingen halen.
- Ik verloor de hele tijd punten! riep de demon uit. - Maar je hebt de situatie tot nu toe alleen geschetst en je hebt nog geen manier gepresenteerd om het op te lossen! Dus wat is je strategie? U hoeft geen tijd te verspillen!
- Wacht, ik zal nu alles uitleggen! riep Grundy uit. - Ieder van ons vier - er zijn twee van ons golems en twee heksen - zullen vechten tegen hun tegenstanders. Natuurlijk zullen de heksen proberen aan niemand toe te geven in wat dan ook ...
- Natuurlijk! De twee heksen riepen opnieuw in koor. Ze begrepen de golem perfect!
'En de tweede golem zal mijn tactiek volgen,' vervolgde Grundy onverstoorbaar. Hij keek naar zijn dubbelganger. - Je weet het natuurlijk wel?
- Oh zeker! Ik ben jouw exemplaar! Ik begrijp perfect alles wat je denkt!
- Dat is geweldig! Laten we in dat geval de eerste stap zetten zodat de demon alles zelf kan zien. Elk gevecht zal verschillende rondes hebben, zodat de hele strategie zich tot het einde kan manifesteren en de indruk wekt van een coherent systeem. Misschien moet ik beginnen.

- Nu moet ieder van ons markeringen maken op onze vellen papier! - de golem wendde zich tot de heks. - Teken eerst een lachend gezicht. Dit betekent dat we niet zullen getuigen tegen een medegevangene. Je kunt ook een fronsend gezicht tekenen, wat betekent dat we alleen aan onszelf denken en de nodige getuigenis afleggen aan onze kameraad. We beseffen allebei dat het beter zou zijn als niemand dat fronsende gezicht bleek te zijn, maar aan de andere kant heeft een fronsend gezicht bepaalde voordelen ten opzichte van een lachend gezicht! Maar het komt erop neer dat ieder van ons niet weet wat de ander zal kiezen! We zullen het pas weten als de speelkameraad zijn tekening onthult!
- Begin jij klootzak! De heks zwoer. Ze kon, zoals altijd, niet zonder beledigende scheldwoorden!
- Klaar! - riep Grundy uit, terwijl hij een groot lachend gezicht op zijn stuk papier tekende, zodat de heks niet kon zien wat hij daar afbeeldde. De heks zette haar aan het bewegen, ook met een afbeelding van een gezicht. Vermoedelijk heeft ze zeker een onvriendelijk gezicht geportretteerd!
'Nou, nu hoeven we elkaar alleen maar onze tekeningen te laten zien,' kondigde Grandi aan. Terugkijkend opende hij de tekening voor het publiek en toonde hem in alle richtingen zodat iedereen de tekening kon zien. De Zeeheks gromde iets onaangenaams en deed hetzelfde.
Zoals Grundy had gehoopt, keek een boos, misnoegd gezicht van de tekening van de tovenares.
'Nu, beste toeschouwers,' zei Grandi plechtig, 'zie je dat de heks ervoor koos om tegen mij te getuigen. Ik ga dat niet doen. De Sea Witch scoort dus vijf punten. En ik krijg dan ook geen enkel punt. En hier…
Weer rolde een licht geluid door de rijen toeschouwers. Iedereen sympathiseerde duidelijk met de golem en verlangde ernaar dat de Sea Witch zou mislukken.
Maar het spel is net begonnen! Als zijn strategie maar correct was...
- Nu kunnen we doorgaan naar de tweede ronde! - kondigde Grundy plechtig aan. - We moeten de bewegingen herhalen. Iedereen trekt een gezicht dat dichter bij hem staat!
En dat deden ze. Grundy portretteerde nu een somber, ontevreden gezicht.
Zodra de spelers hun tekeningen lieten zien, zag het publiek dat ze nu allebei met boze gezichten waren uitgebeeld.
- Elk twee punten! Zei Grundy.
- Zeven twee in mijn voordeel! - riep de heks vrolijk. - Je kunt hier niet weg, klootzak!
- Laten we opnieuw beginnen! riep Grundy uit. Ze maakten nog een tekening en toonden die aan het publiek. Weer dezelfde boze gezichten.
- Ieder van ons herhaalde de vorige zet, gedroeg zich egoïstisch, en daarom lijkt het mij dat het beter is om niemand punten toe te kennen! - zei de golem.
- Maar ik leid het spel nog steeds! - zei de heks, vrolijk in haar handen wrijvend.
- Oké, maak geen lawaai! Zei Grundy. - Het spel is nog niet voorbij. Laten we afwachten wat er gebeurt! Dus, beste publiek, we beginnen aan de vierde ronde!
De spelers maakten de tekeningen opnieuw en lieten het publiek zien wat ze op hun lakens hadden afgebeeld. Beide bladen toonden de kijkers opnieuw dezelfde boze gezichten.
- Acht - drie! schreeuwde de heks en barstte in een kwaadaardig gelach uit. 'Je hebt je eigen graf gegraven met je dwaze strategie, golem!
- Ronde vijf! riep Grundy. Hetzelfde werd herhaald als in de vorige rondes - opnieuw boze gezichten, alleen de score veranderde - het werd negen of vier in het voordeel van de tovenares.
- Nu de laatste, zesde ronde! - kondigde Grundy aan. Uit zijn voorlopige berekeningen bleek dat deze specifieke ronde fataal zou worden. Nu moest de theorie door de praktijk worden bevestigd of weerlegd.
Enkele snelle en nerveuze bewegingen van het potlood op het papier - en beide tekeningen verschenen voor de ogen van het publiek. Weer twee gezichten, nu zelfs met ontblote tanden!
- Tien - vijf in mijn voordeel! Mijn spel! Ik won! - de zeeheks kakelde.

'Je hebt echt gewonnen,' beaamde Grundy grimmig. Het publiek was akelig stil.
De demon bewoog zijn lippen om iets te zeggen.

“Maar onze competitie is nog niet voorbij! - schreeuwde luid Grundy. - Het was pas het eerste deel van het spel.
- Geef je voor altijd! De demon Xant gromde ongenoegen.
- Het is juist! zei Grundy kalm. - Maar één ronde lost niets op, alleen methodischheid geeft het beste resultaat aan.
Nu benaderde de golem de andere heks.
- Ik wil deze tour graag met een andere tegenstander spelen! Hij kondigde aan. - Ieder van ons zal gezichten verbeelden, zoals het de vorige keer was, en zal vervolgens de aantrekkingskracht aan het publiek demonstreren!
En dat deden ze. Het resultaat was hetzelfde als de vorige keer - Grundy schilderde een lachend gezicht, en de heks - dus over het algemeen een schedel. Ze kreeg meteen een voorsprong van maar liefst vijf punten, waardoor ze Grundy achter zich liet.
De overige vijf ronden eindigden met de te verwachten resultaten. Opnieuw was de stand tien of vijf in het voordeel van de Sea Witch.
- Golem, ik hou echt van je strategie! - lachte de heks.
- Dus je hebt twee rondes van het spel bekeken, beste kijkers! riep Grundy uit. - Zo scoorde ik tien punten, en mijn rivalen - twintig!
Het publiek, dat ook de punten telde, knikte treurig. Hun aantal was gelijk aan dat van de golem. Alleen een wolk met de naam Frakto leek heel tevreden, hoewel hij natuurlijk ook geen sympathie had voor de heks.
Maar Rapunzelia glimlachte goedkeurend naar de golem - ze bleef in hem geloven. Misschien was ze de enige die hem nu geloofde. Grundy hoopte dat hij dit grenzeloze vertrouwen zou rechtvaardigen.
Nu benaderde Grundy zijn derde rivaal - zijn dubbelganger. Hij zou zijn laatste tegenstander zijn. De golems krasten snel hun potloden op het papier en lieten ze aan het publiek zien. Iedereen zag twee lachende gezichten.
- Let op, beste kijkers, ieder van ons koos ervoor om een vriendelijke celgenoot te zijn! riep Grundy uit. - En daarom kreeg niemand van ons het nodige voordeel ten opzichte van de tegenstander in dit spel. Zo krijgen we allebei drie punten en gaan we door naar de volgende ronde!
De tweede ronde is begonnen. Het resultaat was hetzelfde als de vorige keer. Dan de resterende ronden. En in elke ronde scoorden beide tegenstanders weer drie punten! Het was gewoon ongelooflijk, maar het publiek was klaar om alles te bevestigen wat er gebeurde.

Ten slotte kwam er een einde aan deze rondleiding en begon Grundy, die snel met zijn potlood over het papier streek, het resultaat te berekenen. Ten slotte kondigde hij plechtig aan:
- Achttien tot achttien! In totaal scoorde ik achtentwintig punten en mijn tegenstanders achtendertig!
'Dus je hebt verloren,' kondigde de Zeeheks blij aan. - Zo wordt een van ons de winnaar!
- Misschien! zei Grundy kalm. Nu was er nog een belangrijk punt. Als alles gaat zoals het bedoeld is...
- We moeten het tot het einde zien! - riep de tweede golem uit. 'Ik moet ook tegen twee Zeeheksen vechten! Het spel is nog niet voorbij!
- Ja, natuurlijk, kom op! Zei Grundy. - Maar laat u alleen leiden door de strategie!
- Oh zeker! - verzekerde zijn dubbel.
Deze golem naderde een van de heksen en de tour begon. Het eindigde met hetzelfde resultaat waarmee Grundy zelf uit een soortgelijke ronde kwam - de stand was tien of vijf in het voordeel van de tovenares. De heks straalde ronduit van onuitsprekelijke vreugde en het publiek viel nors stil. De demon Xanth zag er wat vermoeid uit, wat geen goed voorteken was.
Nu was het tijd voor de laatste ronde - een heks moest vechten tegen de tweede. Elk had twintig punten in haar bezit, die ze kon krijgen door met golems te vechten.
- En nu, als je me toestaat om nog een paar extra punten te scoren... - fluisterde de Zeeheks samenzweerder tegen haar dubbelganger.
Grundy probeerde kalm te blijven, althans uiterlijk, hoewel er een orkaan van tegenstrijdige gevoelens in zijn ziel woedde. Zijn geluk hing nu af van hoe correct hij het mogelijke gedrag van beide heksen voorspelde - hun karakter was immers in wezen hetzelfde!
Nu was misschien wel het meest kritieke moment. Maar als hij het mis had!
- Waarom zou ik in vredesnaam aan jou toegeven! Kwam de tweede heks tegen de eerste. - Ik wil zelf meer punten scoren en hier wegwezen!
"Nou, als je je zo brutaal gedraagt," schreeuwde de sollicitant, "dan zal ik je trimmen zodat je niet langer op mij lijkt!"
De heksen wierpen elkaar hatende blikken toe, tekenden hun tekeningen en toonden ze aan het publiek. Natuurlijk kon niets anders, behalve twee schedels, er gewoon niet zijn! Elk van hen scoorde één punt.
De heksen, die elkaar vervloekten, gingen door naar de tweede ronde. Het resultaat is weer hetzelfde - weer twee ruw getekende schedels. Zo behaalden de heksen nog een punt. Het publiek nam alles ijverig op.
Dit zette zich voort in de toekomst. Toen de tour eindigde, ontdekten de vermoeide heksen dat ze elk zes punten hadden gescoord. Weer tekenen!
- Laten we nu de resultaten berekenen en alles vergelijken! zei Grandi triomfantelijk. 'Elk van de heksen scoorde zesentwintig punten en de golems scoorden achtentwintig punten. Dus wat hebben we? En we hebben het resultaat dat golems meer punten hebben!
Een zucht van verbazing ging door de toeschouwers. Opgewonden toeschouwers begonnen kolommen met getallen op hun vel papier te schrijven om de juistheid van de telling te controleren. Velen telden in deze tijd gewoon het aantal gescoorde punten niet, in de veronderstelling dat ze het resultaat van het spel al wisten. Beide heksen begonnen te grommen van verontwaardiging, het is niet duidelijk wie er precies de schuld kreeg van wat er gebeurde. De ogen van de demon Xant lichtten weer op met alert vuur. Zijn vertrouwen was gerechtvaardigd!
'Ik vraag u, beste toehoorders, om aandacht te schenken aan het feit,' stak Grandi zijn hand op en eiste dat het publiek zou kalmeren, 'dat geen van de golems ook maar één ronde heeft gewonnen. Maar de uiteindelijke overwinning zal nog steeds voor een van ons zijn, van de golems. De resultaten zullen veelzeggender zijn als de competitie verder doorgaat! Ik wil zeggen, mijn beste kijkers, dat in een eeuwig duel mijn strategie steevast een winnende zal blijken te zijn!
De demon Xanth luisterde geïnteresseerd naar wat Grundy zei. Ten slotte opende hij zijn mond, terwijl hij een wolkje stoom afstootte.
- Wat is precies uw strategie?
- Ik noem haar "Wees hard maar eerlijk"! - legde Grundy uit. - Ik begin het spel eerlijk, maar dan begin ik te verliezen, omdat ik heel specifieke partners tegenkom. Daarom blijf ik in de eerste ronde, wanneer blijkt dat de Sea Witch tegen mij begint te getuigen, automatisch de verliezer in de tweede ronde - en zo gaat het door tot het einde. Het resultaat kan anders zijn als de heks haar tactiek van het spelen van het spel verandert. Maar omdat ze zoiets niet eens kon bedenken, bleven we spelen volgens het vorige patroon. Toen ik met mijn dubbelganger begon te spelen, behandelde hij me goed, en ik behandelde hem goed in de volgende ronde van het spel. Daarom verliep ons spel ook anders en wat eentonig, aangezien we niet van tactiek wilden veranderen...
- Maar je hebt nog geen enkele ronde gewonnen! De demon protesteerde verbaasd.
- Ja, en deze heksen hebben nog geen enkele ronde verloren! - bevestigde Grundy. - Maar de overwinning gaat niet automatisch naar degene voor wie de tochten zijn overgebleven. De overwinning gaat naar degene die de meeste punten heeft gescoord, wat een heel andere zaak is! Ik slaagde erin om meer punten te scoren toen we met mijn dubbelganger speelden dan toen ik met heksen speelde. Hun egoïstische houding leverde hen een tijdelijke overwinning op, maar op langere termijn bleek dat ze daardoor allebei de wedstrijd volledig verloren. Dit komt vaak voor!

Spel theorie - een set wiskundige methoden voor het oplossen van conflictsituaties (botsingen van belangen). In de speltheorie heet een spel wiskundig model van een conflictsituatie. Het onderwerp van speciale interesse in speltheorie is de studie van besluitvormingsstrategieën van speldeelnemers in onzekere omstandigheden. Onzekerheid wordt geassocieerd met het feit dat twee of meer partijen tegengestelde doelen nastreven, en de resultaten van elke actie van elk van de partijen hangt af van de bewegingen van de partner. Tegelijkertijd streeft elk van de partijen ernaar om optimale beslissingen te nemen die hun doelen maximaal realiseren.

Speltheorie wordt het meest consequent toegepast in de economie, waar conflictsituaties ontstaan, bijvoorbeeld in de relatie tussen een leverancier en een consument, een koper en een verkoper, een bank en een klant. De toepassing van speltheorie is ook te vinden in de politiek, sociologie, biologie en de kunst van het oorlogvoeren.

Uit de geschiedenis van de speltheorie

Geschiedenis van de speltheorie als een onafhankelijke discipline begint in 1944, wanneer John von Neumann en Oskar Morgenstern het boek "Theory of Games and Economic Behaviour" publiceren. Hoewel we eerder voorbeelden van speltheorie tegenkwamen: een verhandeling van de Babylonische Talmoed over de verdeling van het bezit van een overleden echtgenoot tussen zijn vrouwen, kaartspellen in de 18e eeuw, de ontwikkeling van de schaaktheorie in het begin van de 20e eeuw, een bewijs van de minimax-stelling door dezelfde John von Neumann in 1928, zonder welke er geen speltheorie zou zijn.

In de jaren 50 van de 20e eeuw, Melvin Drescher en Meryl Flode uit Rand Corporation John Nash, de eerste die het prisoner's dilemma experimenteel toepaste, ontwikkelde het concept van Nash-evenwicht in zijn werk over de evenwichtstoestand in games voor twee personen.

Reinhard Salten publiceerde in 1965 het boek "Spieltheoretische Behandlung eines Oligomodells mit Nachfrageträgheit" ("Spieltheoretische Behandlung eines Oligomodells mit Nachfrageträgheit"), dat een nieuwe impuls gaf aan de toepassing van de speltheorie in de economie. Een stap voorwaarts in de evolutie van de speltheorie wordt geassocieerd met het werk van John Maynard Smith, "Evolutionary Stable Strategy" (1974). Het prisoner's dilemma werd gepopulariseerd in het boek "The Evolution of Cooperation" uit 1984 van Robert Axelrod. In 1994 kregen John Nash, John Harsagni en Reinhard Salten de Nobelprijs voor hun bijdragen aan de speltheorie.

Speltheorie in het leven en het bedrijfsleven

Laten we dieper ingaan op de essentie van een conflictsituatie (botsing van belangen) in de zin dat het wordt begrepen in de speltheorie voor verdere modellering van verschillende situaties in het leven en het bedrijfsleven. Laat het individu zich in een positie bevinden die leidt tot een van de verschillende mogelijke uitkomsten, en het individu heeft een aantal persoonlijke voorkeuren met betrekking tot deze uitkomsten. Maar hoewel hij de variabelen die de uitkomst tot op zekere hoogte bepalen, kan beheersen, heeft hij er geen volledige controle over. Soms is de controle in handen van meerdere individuen die, net als hij, bepaalde voorkeuren hebben met betrekking tot mogelijke uitkomsten, maar over het algemeen zijn de belangen van deze individuen niet op elkaar afgestemd. In andere gevallen kan het uiteindelijke resultaat afhangen van zowel ongevallen (in de rechtswetenschappen soms natuurrampen genoemd) als andere personen. Speltheorie systematiseert de observatie van dergelijke situaties en formuleert algemene principes om intelligent handelen in dergelijke situaties te leiden.

In sommige opzichten is de titel "speltheorie" ongelukkig, omdat het suggereert dat speltheorie alleen betrekking heeft op niet-sociale botsingen die optreden in gezelschapsspellen, maar deze theorie heeft nog steeds een veel bredere betekenis.

De volgende economische situatie kan een idee geven van de toepassing van speltheorie. Stel dat er meerdere ondernemers zijn, die elk streven naar een maximale winst, terwijl ze slechts een beperkte macht hebben over de variabelen die deze winst bepalen. De ondernemer heeft geen controle over de variabelen die door de andere ondernemer worden gecontroleerd, maar die wel grote invloed kunnen hebben op het inkomen van de eerste. De interpretatie van deze situatie als een spel kan het volgende bezwaar opwerpen. In het spelmodel wordt ervan uitgegaan dat elke ondernemer één keuze maakt uit het gebied van mogelijke keuzes, en deze enkele keuzes bepalen de winst. Het is duidelijk dat dit in werkelijkheid bijna onmogelijk is, aangezien de industrie in dit geval geen ingewikkelde beheersapparatuur nodig zou hebben. Er zijn simpelweg een aantal besluiten en aanpassingen van deze besluiten, die afhankelijk zijn van de keuzes die andere deelnemers aan het economische systeem (spelers) maken. Maar in principe kun je je voorstellen dat een beheerder alle mogelijke ongevallen voorziet en in detail beschrijft welke actie in elk geval moet worden ondernomen, in plaats van elk probleem op te lossen zodra het zich voordoet.

Een militair conflict is per definitie een belangenconflict waarbij geen van beide partijen volledige controle heeft over de variabelen die de uitkomst bepalen, die wordt beslist door een reeks veldslagen. U kunt de uitkomst eenvoudig als een overwinning of een verlies beschouwen en de numerieke waarden 1 en 0 eraan toewijzen.

Een van de eenvoudigste conflictsituaties die in de speltheorie kan worden opgeschreven en opgelost, is een duel, een conflict tussen twee spelers 1 en 2 die respectievelijk P en Q schoten. Voor elke speler is er een functie die de waarschijnlijkheid aangeeft dat een speler heeft geschoten l momenteel t een klap zal geven die fataal blijkt te zijn.

Als gevolg hiervan komt de speltheorie tot een dergelijke formulering van een bepaalde klasse van botsingen van belangen: er zijn N spelers, en elk moet een optie uit een bepaalde set kiezen, en bij het maken van een keuze heeft de speler geen informatie over de keuzes van andere spelers. Het gebied van mogelijke spelerskeuze kan elementen bevatten zoals "schoppenaas", "productie van tanks in plaats van auto's", of meer in het algemeen, een strategie die alle acties definieert die in alle mogelijke omstandigheden moeten worden genomen. Elke speler staat voor de taak: welke keuze moet hij maken om ervoor te zorgen dat zijn persoonlijke invloed op de uitkomst hem de grootst mogelijke winst oplevert?

Wiskundig model in speltheorie en formalisering van problemen

Zoals we al hebben opgemerkt, het spel is een wiskundig model van een conflictsituatie en vereist de volgende componenten:

geïnteresseerde partijen;
mogelijke acties aan elke kant;
belangen van de partijen.

De partijen die geïnteresseerd zijn in het spel worden de spelers genoemd , elk van hen kan minimaal twee acties ondernemen (als de speler maar één actie heeft, dan doet hij eigenlijk niet mee aan het spel, aangezien van tevoren bekend is wat hij gaat doen). De uitkomst van het spel heet een overwinning .

Een echte conflictsituatie is niet altijd, en het spel (in het concept van speltheorie) - altijd - gaat door bepaalde regels die precies definiëren:

opties voor acties van spelers;
de hoeveelheid informatie die elke speler heeft over het gedrag van zijn partner;
de winst waartoe elke reeks acties leidt.

Voorbeelden van geformaliseerde spellen zijn voetbal, kaartspellen en schaken.

Maar in de economie ontstaat een model van spelersgedrag, bijvoorbeeld wanneer verschillende bedrijven een voordeligere plaats op de markt willen innemen, verschillende personen proberen een voordeel (middelen, financiën) onder elkaar te delen, zodat iedereen zoveel mogelijk krijgt . De spelers in conflictsituaties in de economie die als een spel kunnen worden gemodelleerd, zijn bedrijven, banken, individuen en andere economische actoren. Op zijn beurt wordt het spelmodel in oorlogssituaties gebruikt, bijvoorbeeld bij het kiezen van het beste wapen (uit beschikbare of potentieel mogelijke) om de vijand te verslaan of te verdedigen tegen aanvallen.

Het spel wordt gekenmerkt door de onzekerheid van het resultaat ... De redenen voor onzekerheid kunnen in de volgende groepen worden ingedeeld:

combinatorisch (zoals bij schaken);
de invloed van willekeurige factoren (zoals in het spel "kop of munt", dobbelstenen, kaartspellen);
strategisch (de speler weet niet welke actie de vijand zal ondernemen).

Spelersstrategie wordt een reeks regels genoemd die de acties bij elke zet bepalen, afhankelijk van de huidige situatie.

Het doel van speltheorie is het bepalen van de optimale strategie voor elke speler. Het definiëren van een dergelijke strategie is het spel oplossen. Optimaliteit van de strategie wordt bereikt wanneer een van de spelers de maximale uitbetaling moet krijgen, terwijl de andere zich aan zijn strategie houdt. En de tweede speler zou een minimaal verlies moeten hebben als de eerste zich aan zijn strategie houdt.

Spelclassificatie

Classificatie door het aantal spelers (spel van twee of meer personen). Tweepersoonsspellen staan centraal in alle speltheorie. Het basisconcept van speltheorie voor een spel voor twee personen is een generalisatie van het zeer essentiële idee van evenwicht, dat van nature voorkomt in spellen voor twee personen. Wat betreft games N personen, dan is een deel van de speltheorie gewijd aan spellen waarbij samenwerking tussen spelers verboden is. In een ander deel van de speltheorie N personen worden verondersteld dat spelers kunnen samenwerken voor wederzijds voordeel (zie verderop in deze paragraaf over niet-coöperatieve en coöperatieve spellen).
Classificatie op basis van het aantal spelers en hun strategieën (het aantal strategieën is minimaal twee, het kan oneindig zijn).
Classificatie door de hoeveelheid informatie met betrekking tot zetten uit het verleden: partijen met volledige informatie en onvolledige informatie. Laat er speler 1 zijn - de koper en speler 2 - de verkoper. Als speler 1 geen volledige informatie heeft over de acties van speler 2, dan mag speler 1 geen onderscheid maken tussen twee alternatieven waartussen hij een keuze moet maken. Bijvoorbeeld kiezen tussen twee soorten van een bepaald product en niet weten dat het product, volgens sommige kenmerken, EEN slechter product B, Speler 1 ziet mogelijk het verschil tussen de alternatieven niet.
Classificatie volgens de principes van het verdelen van de winst : coöperatief, coalitie-aan de ene kant, en niet-coöperatief, niet-coalitie aan de andere kant. V niet-coöperatief spel , of anders - een coalitie-vrij spel , kiezen de spelers tegelijkertijd strategieën, niet wetende welke strategie de tweede speler zal kiezen. Communicatie tussen spelers is niet mogelijk. V coöperatief spel , of anders - coalitie spel , kunnen spelers coalities vormen en collectieve actie ondernemen om hun winst te maximaliseren.
Ultieme zero-sum game voor twee personen of een antagonistisch spel is een volledig geïnformeerd strategiespel waarbij tegenstanders betrokken zijn. Anatagonistische spellen zijn: matrixspellen .

Een klassiek voorbeeld uit de speltheorie - het prisoner's dilemma

De twee verdachten worden aangehouden en van elkaar geïsoleerd. De officier van justitie is ervan overtuigd dat ze een ernstig misdrijf hebben gepleegd, maar heeft niet voldoende bewijs om ze voor de rechtbank te dagen. Hij vertelt elk van de gevangenen dat hij twee alternatieven heeft: een misdaad bekennen waarvan de politie denkt dat hij die heeft begaan, of niet bekennen. Als beiden niet bekennen, zal de officier van justitie hen aanklagen voor een klein misdrijf, zoals kleine diefstal of illegaal wapenbezit, en krijgen ze allebei een kleine boete. Als ze allebei bekennen, zijn ze onderworpen aan gerechtelijke verantwoordelijkheid, maar hij zal niet de zwaarste straf eisen. Als de een bekent, en de ander niet, dan zal de straf voor de bekende persoon worden verzacht voor het uitleveren van een medeplichtige, terwijl de volharder "met volle teugen" zal ontvangen.

Als dit strategische doel wordt geformuleerd in termen van gevangenisstraf, komt het op het volgende neer:

Dus als beide gevangenen niet worden erkend, krijgen ze elk 1 jaar. Als ze allebei bekennen, krijgen ze elk 8 jaar. En als de ene wordt erkend, wordt de andere niet erkend, dan komt degene die heeft bekend er met drie maanden gevangenisstraf vanaf, en degene die niet wordt erkend krijgt 10 jaar. Bovenstaande matrix geeft correct het prisoner's dilemma weer: iedereen wordt geconfronteerd met de vraag - bekennen of niet bekennen. Het spel dat de officier van justitie aan gevangenen aanbiedt, is: niet-coöperatief spel of anders - een coalitie-vrij spel ... Als beide gevangenen de mogelijkheid hadden om mee te werken (d.w.z. het spel zou coöperatief zijn of anders coalitie spel ), dan zouden beiden niet hebben bekend en elk een jaar gevangenisstraf hebben gekregen.

Voorbeelden van het gebruik van wiskundige hulpmiddelen van speltheorie

We gaan nu over naar oplossingen van voorbeelden van veelvoorkomende klassen van spellen waarvoor er onderzoeks- en oplossingsmethoden zijn in de speltheorie.

Een voorbeeld van het formaliseren van een niet-coöperatief (niet-coöperatief) spel van twee personen

In de vorige paragraaf hebben we al stilgestaan bij een voorbeeld van een niet-coöperatief (niet-coöperatief) spel (prisoner's dilemma). Laten we onze vaardigheden consolideren. Een klassieke verhaallijn geïnspireerd op The Adventures of Sherlock Holmes van Arthur Conan Doyle is hier ook geschikt voor. U kunt natuurlijk bezwaar maken: het voorbeeld komt niet uit het leven, maar uit de literatuur, maar Conan Doyle heeft zich tenslotte niet gevestigd als sciencefictionschrijver! Klassiek ook omdat de taak werd voltooid door Oscar Morgenstern, zoals we al hebben vastgesteld - een van de grondleggers van de speltheorie.

Voorbeeld 1. Er wordt een verkorte presentatie gegeven van een fragment van een van de "Adventures of Sherlock Holmes". Maak volgens de bekende speltheorieën een model van een conflictsituatie en schrijf het spel formeel op.

Sherlock Holmes is van plan om van Londen naar Dover te gaan met een ander doel om het (Europese) continent te bereiken om te ontsnappen aan professor Moriarty, die hem achtervolgt. Toen hij in de trein stapte, zag hij professor Moriarty op het perron. Sherlock Holmes geeft toe dat Moriarty een speciale trein kan kiezen en hem kan inhalen. Sherlock Holmes heeft twee alternatieven: reis verder naar Dover of stap uit bij Canterbury Station, het enige tussenstation op zijn route. We accepteren dat zijn tegenstander intelligent genoeg is om de capaciteiten van Holmes te bepalen, dus hij heeft dezelfde twee alternatieven. Beide tegenstanders moeten een station kiezen om uit de trein te stappen, niet wetende welke beslissing elk van hen zal nemen. Als, als gevolg van de beslissing, beide op hetzelfde station belanden, dan kunnen we er zeker van uitgaan dat Sherlock Holmes zal worden vermoord door professor Moriarty. Als Sherlock Holmes veilig Dover bereikt, wordt hij gered.

Oplossing. De helden van Conan Doyle kunnen worden gezien als deelnemers aan het spel, dat wil zeggen spelers. Ter beschikking van elke speler l (l= 1,2) twee pure strategieën:

uitstappen bij Dover (strategie si1 ( l=1,2) );
uitstappen bij het tussenstation (strategie si2 ( l=1,2) )

Afhankelijk van welke van de twee strategieën elk van de twee spelers kiest, wordt een speciale combinatie van strategieën als een paar gemaakt s = (s1 , s 2 ) .

Elke combinatie kan worden geassocieerd met een gebeurtenis - het resultaat van de poging tot moord op Sherlock Holmes door professor Moriarty. Van dit spel stellen we een matrix samen met mogelijke gebeurtenissen.

Onder elk van de gebeurtenissen is er een index die de verwerving van professor Moriarty aangeeft, en berekend op basis van de redding van Holmes. Beide helden kiezen tegelijkertijd een strategie, niet wetende wat de vijand zal kiezen. Het spel is dus niet-coöperatief, omdat de spelers ten eerste in verschillende treinen zitten en ten tweede tegengestelde belangen hebben.

Een voorbeeld van formalisering en oplossing van een coöperatief (coalitie)spel N personen

Op dit punt zal het praktische deel, dat wil zeggen het verloop van het oplossen van het voorbeeldprobleem, worden voorafgegaan door het theoretische deel, waarin we kennis zullen maken met de concepten van speltheorie voor het oplossen van coöperatieve (niet-coöperatieve) spellen. Voor deze taak suggereert de speltheorie:

een karakteristieke functie (als we het eenvoudig hebben, het weerspiegelt de waarde van de voordelen van het samenvoegen van spelers in een coalitie);
het concept van additiviteit (eigenschappen van hoeveelheden, bestaande in het feit dat de waarde van een hoeveelheid die overeenkomt met een heel object gelijk is aan de som van de waarden van hoeveelheden die overeenkomen met de delen ervan in een bepaalde klasse van deling van een object in delen) en superadditiviteit (de waarde van een hoeveelheid die overeenkomt met een heel object is groter dan de som van de waarden van hoeveelheden, overeenkomend met de delen ervan) van de karakteristieke functie.

De superadditiviteit van de karakteristieke functie suggereert dat deelname aan een coalitie gunstig is voor de spelers, aangezien in dit geval de waarde van de uitbetaling van de coalitie toeneemt met het aantal spelers.

Om het spel te formaliseren, moeten we de formele notatie van de bovenstaande concepten introduceren.

Voor spel N we duiden de verzameling van al zijn spelers aan als N= (1,2, ..., n) Elke niet-lege deelverzameling van de verzameling N aanduiden als t(inclusief zichzelf) N en alle subsets met één element). Er staat een les op de site " Sets en bewerkingen op sets", die, wanneer u op de link klikt, in een nieuw venster wordt geopend.

De karakteristieke functie wordt aangeduid als v en zijn definitiedomein bestaat uit mogelijke deelverzamelingen van de verzameling N. v(t) is de waarde van de karakteristieke functie voor een bepaalde deelverzameling, bijvoorbeeld het inkomen dat wordt ontvangen door een coalitie, eventueel bestaande uit één speler. Dit is belangrijk omdat de speltheorie vereist dat het bestaan van superadditiviteit wordt gecontroleerd op de waarden van de karakteristieke functie van alle onsamenhangende coalities.

Voor twee niet-lege coalities uit deelverzamelingen t1 en t2 de additiviteit van de karakteristieke functie van een coöperatief (coalitie)spel wordt als volgt geschreven:

En superadditiviteit is als volgt:

Voorbeeld 2. Drie leerlingen van de muziekschool werken parttime in verschillende clubs, zij krijgen hun opbrengst van de bezoekers van de clubs. Bepaal of het voor hen voordelig is om de krachten te bundelen (zo ja, onder welke voorwaarden), gebruik de concepten van de speltheorie om coöperatieve spellen op te lossen N personen met de volgende initiële gegevens.

Hun verdiensten per avond waren gemiddeld:

de violist heeft 600 eenheden;
de gitarist heeft 700 eenheden;
de zanger heeft 900 eenheden.

In een poging om de inkomsten te verhogen, vormden de studenten gedurende enkele maanden verschillende groepen. De resultaten toonden aan dat ze, wanneer ze worden gecombineerd, hun omzet in de loop van de avond als volgt kunnen verhogen:

violist + gitarist verdiende 1500 stuks;
violist + zanger verdiende 1800 eenheden;
gitarist + zanger verdiende 1900 eenheden;
violist + gitarist + zanger verdiende 3000 eenheden.

Oplossing. In dit voorbeeld is het aantal deelnemers aan het spel N= 3, daarom bestaat het definitiedomein van de karakteristieke functie van het spel uit 2³ = 8 mogelijke deelverzamelingen van de verzameling van alle spelers. We zetten alle mogelijke coalities op een rij t:

coalities van één element, die elk bestaan uit één speler - een muzikant: t{1} , t{2} , t{3} ;
een coalitie van twee elementen: t{1,2} , t{1,3} , t{2,3} ;
een coalitie van drie elementen: t{1,2,3} .

Laten we een serienummer toewijzen aan elk van de spelers:

violist - 1e speler;
gitarist - 2e speler;
zanger - 3e speler.

Volgens de probleemgegevens definiëren we de karakteristieke functie van het spel v:

v (T (1)) = 600; v (T (2)) = 700; v (T (3)) = 900; deze waarden van de karakteristieke functie worden bepaald op basis van de uitbetalingen van respectievelijk de eerste, tweede en derde speler, wanneer ze niet verenigd zijn in een coalitie;

v (T (1,2)) = 1500; v (T (1,3)) = 1800; v (T (2,3)) = 1900; deze waarden van de karakteristieke functie worden bepaald door de inkomsten van elk paar spelers verenigd in een coalitie;

v (T (1,2,3)) = 3000; deze waarde van de karakteristieke functie wordt bepaald door de gemiddelde opbrengst in het geval dat de spelers in drieën waren verenigd.

Zo hebben we alle mogelijke coalities van spelers op een rij gezet, het zijn er acht, zoals het hoort, aangezien het domein van de definitie van de karakteristieke functie van een spel uit precies acht mogelijke deelverzamelingen van de verzameling van alle spelers bestaat. Dit is precies wat de speltheorie vereist, omdat we het bestaan van superadditiviteit moeten controleren voor de waarden van de karakteristieke functie van alle onsamenhangende coalities.

Hoe wordt in dit voorbeeld aan de superadditiviteitsvoorwaarden voldaan? Laten we definiëren hoe de spelers onsamenhangende coalities vormen t1 en t2 ... Als sommige spelers deel uitmaken van de coalitie t1 , dan worden alle andere spelers in de coalitie opgenomen t2 en, per definitie, wordt deze coalitie gevormd als het verschil tussen de hele set spelers en de set t1 ... dan als t1 - een coalitie van één speler, dan in een coalitie t2 er zullen de tweede en derde speler zijn, als de coalitie t1 zullen de eerste en derde speler zijn, dan de coalitie t2 bestaat alleen uit de tweede speler, enzovoort.

WIT-RUSLANDSE STAATSUNIVERSITEIT

FACULTEIT ECONOMIE

STOEL ...

Speltheorie en de toepassing ervan in de economie

cursus project

2e jaars student

afdeling "Management"

leidinggevende

Minsk, 2010

1. Inleiding. Pagina 3

2. Basisbegrippen van de speltheorie blz. 4

3. Presentatie van spellen blz. 7

4. Soorten spellen p.9

5. Toepassing van speltheorie in economie p.14

6. Problemen met praktische toepassing in de besturing p.21

7. Conclusie p.23

Lijst met gebruikte literatuur p.24

1. INLEIDING

In de praktijk is het vaak nodig om de acties van bedrijven, verenigingen, ministeries en andere projectdeelnemers te coördineren in gevallen waarin hun belangen niet samenvallen. In dergelijke situaties maakt de speltheorie het mogelijk om de beste oplossing te vinden voor het gedrag van deelnemers die verplicht zijn acties te coördineren bij belangenverstrengeling. Speltheorie dringt steeds meer door in de praktijk van economische besluitvorming en onderzoek. Het kan worden gezien als een hulpmiddel om de efficiëntie van plannings- en managementbeslissingen te helpen verbeteren. Dit is van groot belang bij het oplossen van problemen in industrie, landbouw, transport, handel, zeker bij het sluiten van overeenkomsten met buitenlandse partners op alle niveaus. Zo is het mogelijk om wetenschappelijk onderbouwde niveaus van verlaging van de detailhandelsprijzen en het optimale voorraadniveau te bepalen, om de problemen van excursies en de keuze van nieuwe lijnen van stadsvervoer op te lossen, het probleem van het plannen van de procedure voor het organiseren van de exploitatie van minerale afzettingen in het land, enz. Het probleem van het kiezen van percelen voor landbouwgewassen is een klassieker geworden. De speltheoriemethode kan worden gebruikt voor steekproefonderzoeken van eindige populaties, voor het testen van statistische hypothesen.

Speltheorie is een wiskundige methode om optimale strategieën in games te bestuderen. Onder een game wordt verstaan een proces waarbij twee of meer partijen betrokken zijn in de strijd om de verwezenlijking van hun belangen. Elke kant heeft zijn eigen doel en gebruikt een strategie die kan leiden tot winst of verlies, afhankelijk van het gedrag van andere spelers. Speltheorie helpt je bij het kiezen van de beste strategieën, rekening houdend met de percepties van andere deelnemers, hun middelen en hun mogelijke acties.

Speltheorie is een tak van toegepaste wiskunde, meer bepaald operationeel onderzoek. Meestal worden speltheoriemethoden gebruikt in de economie, iets minder vaak in andere sociale wetenschappen - sociologie, politieke wetenschappen, psychologie, ethiek en andere. Sinds de jaren zeventig is het door biologen aangenomen om het gedrag van dieren en de evolutietheorie te bestuderen. Het is erg belangrijk voor kunstmatige intelligentie en cybernetica, vooral met de manifestatie van interesse in intelligente agenten.

Speltheorie heeft zijn wortels in de neoklassieke economie. De wiskundige aspecten en toepassingen van de theorie werden voor het eerst gepresenteerd in het klassieke boek uit 1944 van John von Neumann en Oscar Morgenstern, Theory of Games and Economic Behavior.

Dit gebied van wiskunde heeft enige weerspiegeling gevonden in de sociale cultuur. In 1998 publiceerde de Amerikaanse schrijfster en journaliste Sylvia Nazar een boek over het lot van John Nash, de Nobelprijswinnaar in de economie en wetenschapper op het gebied van speltheorie; en in 2001 werd op basis van het boek de film "A Beautiful Mind" opgenomen. Sommige Amerikaanse televisieprogramma's, zoals Friend or Foe, Alias of NUMB3RS, verwijzen periodiek naar de theorie in hun afleveringen.

Een niet-wiskundige versie van de speltheorie wordt gepresenteerd in de werken van Thomas Schelling, Nobelprijswinnaar voor de economie in 2005.

Nobelprijswinnaars in de economie voor prestaties op het gebied van speltheorie zijn: Robert Aumann, Reinhard Zelten, John Nash, John Harsagni, Thomas Schelling.

2. BASISCONCEPTEN VAN SPELTHEORIE

Laten we kennis maken met de basisconcepten van de speltheorie. Het wiskundige model van een conflictsituatie wordt een spel genoemd, de bij het conflict betrokken partijen worden spelers genoemd en de uitkomst van het conflict wordt een overwinning genoemd. Voor elk geformaliseerd spel worden regels geïntroduceerd, d.w.z. een systeem van voorwaarden dat bepaalt: 1) opties voor acties van spelers; 2) de hoeveelheid informatie die elke speler heeft over het gedrag van partners; 3) de winst waartoe elke reeks acties leidt. Doorgaans kan de winst (of het verlies) worden gekwantificeerd; u kunt bijvoorbeeld een verlies schatten als nul, een winst als één en een gelijkspel als ½.

Een spel wordt een dubbelspel genoemd als er twee spelers aan deelnemen, en meervoudig als het aantal spelers meer dan twee is.

Een spel wordt een nulsomspel of antagonistisch genoemd als de winst van een van de spelers gelijk is aan het verlies van de ander, dwz voor een volledige taak van het spel is het voldoende om de waarde van een van de spelers aan te geven. hen. Als we a aangeven - de uitbetaling van een van de spelers, b - de uitbetaling van de ander, dan is het voor een nulsomspel b = -а dus voldoende om bijvoorbeeld a te beschouwen.

De keuze en uitvoering van een van de acties waarin de regels voorzien, wordt de zet van een speler genoemd. De zetten kunnen persoonlijk of willekeurig zijn. Een persoonlijke zet is een bewuste keuze van een speler voor een van de mogelijke acties (bijvoorbeeld een zet in een schaakspel). Een willekeurige zet is een willekeurig gekozen actie (bijvoorbeeld een kaart kiezen uit een geschud kaartspel). In de toekomst zullen we alleen de persoonlijke zetten van de spelers in overweging nemen.

De strategie van een speler is een reeks regels die de keuze van zijn actie voor elke persoonlijke zet bepalen, afhankelijk van de huidige situatie. Meestal maakt de speler tijdens het spel bij elke persoonlijke zet een keuze afhankelijk van de specifieke situatie. In principe is het echter mogelijk dat alle beslissingen vooraf door de speler worden genomen (in reactie op elke situatie die zich voordoet). Dit betekent dat de speler een bepaalde strategie heeft gekozen, die kan worden ingesteld in de vorm van een lijst met regels of een programma. (Zo speel je het spel met een computer). Een spel wordt eindig genoemd als elke speler een eindig aantal strategieën heeft, en anders oneindig.

Om een spel op te lossen, of een oplossing voor een spel te vinden, moet men voor elke speler een strategie kiezen die voldoet aan de optimale conditie, d.w.z. een van de spelers zou de maximale uitbetaling moeten ontvangen wanneer de ander zich aan zijn strategie houdt. Tegelijkertijd zou de tweede speler een minimaal verlies moeten hebben als de eerste zich aan zijn strategie houdt. Dergelijke strategieën worden optimaal genoemd. Optimale strategieën moeten ook voldoen aan de stabiliteitsvoorwaarde, dat wil zeggen dat het voor geen van de spelers onrendabel moet zijn om hun strategie in dit spel op te geven.

Als het spel vele malen wordt herhaald, zijn de spelers mogelijk niet geïnteresseerd in de winsten en verliezen in elk specifiek spel, maar in de gemiddelde uitbetaling (verlies) in alle spellen.

Het doel van speltheorie is om voor elke speler de optimale strategie te bepalen. Bij het kiezen van de optimale strategie ligt het voor de hand om aan te nemen dat beide spelers zich vanuit hun belangen redelijk gedragen. De belangrijkste beperking van de speltheorie is de natuurlijkheid van de uitbetaling als een indicator van efficiëntie, terwijl er in de meeste reële economische problemen meer dan één indicator van efficiëntie is. Bovendien doen zich in de economie in de regel problemen voor waarbij de belangen van partners niet noodzakelijk tegenstrijdig zijn.

3. Presentatie van spellen

Games zijn strikt gedefinieerde wiskundige objecten. Het spel wordt gevormd door de spelers, een reeks strategieën voor elke speler en een indicatie van de winsten, of betalingen, van de spelers voor elke combinatie van strategieën. De meeste coöperatieve spellen worden gekenmerkt door een karakteristieke functie, terwijl voor de rest van de soorten vaker de normale of uitgebreide vorm wordt gebruikt.

uitgebreide vorm

Het spel "Ultimatum" in uitgebreide vorm

Games in uitgebreide of uitgebreide vorm worden weergegeven als een gerichte boom, waarbij elk hoekpunt overeenkomt met een situatie waarin de speler zijn strategie kiest. Aan elke speler is een heel niveau van pieken gekoppeld. Betalingen worden onderaan de boom geregistreerd, onder elk bladpunt.

De afbeelding links is een spel voor twee spelers. Speler 1 gaat eerst en kiest strategie F of U. Speler 2 analyseert zijn positie en beslist of hij strategie A of R kiest. Hoogstwaarschijnlijk kiest de eerste speler U, en de tweede - A (voor elk van hen zijn dit optimale strategieën ); dan krijgen ze respectievelijk 8 en 2 punten.

De uitgebreide vorm is zeer beschrijvend en maakt het vooral handig om partijen met meer dan twee spelers en partijen met opeenvolgende zetten weer te geven. Als de deelnemers gelijktijdige bewegingen maken, zijn de corresponderende hoekpunten ofwel verbonden door een stippellijn, ofwel omlijnd met een ononderbroken lijn.

Normale vorm

	Speler 2 strategie 1	Speler 2 strategie 2
Speler 1 strategie 1	4 , 3	–1 , –1
Speler 1 strategie 2	0 , 0	3 , 4
Normale vorm voor een spel met 2 spelers, elk met 2 strategieën.

In normale of strategische vorm wordt het spel beschreven door een betalingsmatrix. Elke zijde (meer precies, dimensie) van de matrix is een speler, de rijen definiëren de strategieën van de eerste speler en de kolommen definiëren de strategieën van de tweede. Op het kruispunt van de twee strategieën kun je de winsten zien die de spelers zullen ontvangen. In het voorbeeld rechts, als speler 1 de eerste strategie kiest, en de tweede speler de tweede strategie, dan zien we op de kruising (−1, −1), wat betekent dat als gevolg van de zet beide spelers één punt verloren.

De spelers kozen strategieën met het maximale resultaat voor zichzelf, maar verloren door onwetendheid over de zet van de andere speler. Meestal worden spellen gepresenteerd in normale vorm waarin de zetten tegelijkertijd worden gedaan, of er wordt tenminste aangenomen dat alle spelers zich niet bewust zijn van wat andere deelnemers doen. Dergelijke spellen met onvolledige informatie zullen hieronder worden besproken.

Kenmerkende formule:

In coöperatieve spellen met overdraagbaar nut, dat wil zeggen de mogelijkheid om geld van de ene speler naar de andere over te dragen, is het onmogelijk om het concept van individuele betalingen toe te passen. In plaats daarvan wordt een zogenaamde karakteristieke functie gebruikt, die de uitbetaling van elke coalitie van spelers bepaalt. In dit geval wordt aangenomen dat de uitbetaling van de lege coalitie nul is.

De fundamenten van deze benadering zijn te vinden in het boek van von Neumann en Morgenstern. Bij het bestuderen van de normaalvorm voor coalitiespellen, redeneerden ze dat als coalitie C wordt gevormd in een spel met twee partijen, coalitie N \ C zich daartegen verzet. Het is als een spel voor twee spelers. Maar aangezien er veel opties zijn voor mogelijke coalities (namelijk 2N, waarbij N het aantal spelers is), zal de uitbetaling voor C een karakteristieke waarde hebben, afhankelijk van de samenstelling van de coalitie. Formeel wordt een spel in deze vorm (ook wel TU-spel genoemd) voorgesteld door een paar (N, v), waarbij N de verzameling van alle spelers is en v: 2N → R de karakteristieke functie.

Deze vorm van presentatie kan worden toegepast op alle spellen, ook die zonder overdraagbaar nut. Momenteel zijn er manieren om elk spel van de normale naar de karakteristieke vorm te converteren, maar conversie in de tegenovergestelde richting is niet in alle gevallen mogelijk.

4. Soorten spellen

Coöperatief en niet-coöperatief.

Het spel wordt coöperatief of coalitie genoemd als spelers zich in groepen kunnen verenigen, verplichtingen aangaan met andere spelers en hun acties coördineren. Dit verschilt van niet-coöperatieve spellen waarbij iedereen verplicht is om voor zichzelf te spelen. Recreatieve spellen zijn zelden coöperatief, maar dergelijke mechanismen zijn niet ongewoon in het dagelijks leven.

Van de twee soorten spellen beschrijven niet-coöperatieve spellen situaties zeer gedetailleerd en produceren ze nauwkeurigere resultaten. Coöperaties beschouwen het proces van het spel als een geheel. Pogingen om de twee benaderingen te combineren hebben aanzienlijke resultaten opgeleverd. Het zogenaamde Nash-programma heeft al oplossingen gevonden voor sommige coöperatieve spellen als evenwichtssituaties van niet-coöperatieve spellen.

Spel theorie- de theorie van wiskundige modellen voor het nemen van optimale beslissingen in een conflict. Aangezien de bij de meeste conflicten betrokken partijen er belang bij hebben hun bedoelingen voor de tegenstander verborgen te houden, vindt besluitvorming in conflictsituaties meestal plaats in onzekere omstandigheden. Integendeel, de factor onzekerheid kan worden geïnterpreteerd als de tegenstander van het subject dat de beslissing neemt (dus het nemen van beslissingen in omstandigheden van onzekerheid kan worden opgevat als het nemen van beslissingen in omstandigheden van conflict). In het bijzonder zijn veel uitspraken van wiskundige statistiek natuurlijk geformuleerd als speltheoretisch.

Speltheorie is een tak van toegepaste wiskunde die wordt gebruikt in de sociale wetenschappen (alles in de economie), biologie, politieke wetenschappen, informatica (voornamelijk voor kunstmatige intelligentie) en filosofie. Speltheorie probeert gedrag wiskundig vast te leggen in strategische situaties waarbij het succes van het onderwerp dat de keuze maakt afhangt van de keuze van andere deelnemers. Als eerst de analyse werd ontwikkeld van games waarin een van de tegenstanders wint ten koste van anderen (zero-sum games), later begonnen ze een brede klasse van interacties te overwegen die volgens bepaalde criteria waren geclassificeerd. Tegenwoordig is "speltheorie zoiets als een paraplu of een universele theorie voor de rationele kant van sociale wetenschappen, waar sociaal breed kan worden begrepen, inclusief zowel menselijke als niet-menselijke spelers (computers, dieren, planten)" (Robert Aumann, 1987 )

Deze tak van wiskunde heeft een zekere weerspiegeling gekregen in de populaire cultuur. In 1998 publiceerde de Amerikaanse schrijver en journalist Sylvia Nazar een boek over het leven van John Nash, de Nobelprijswinnaar in de economie voor prestaties in de speltheorie, en in 2001 werd op basis van het boek de film "A Beautiful Mind" gemaakt. (Speltheorie is dus een van de weinige takken van de wiskunde waarin je een Nobelprijs kunt winnen.) Sommige Amerikaanse tv-shows, bijvoorbeeld Vriend of vijand, Alias of NUMMERS gebruiken regelmatig speltheorie in hun releases.

John Nash is een wiskundige, een Nobelprijswinnaar die bij het grote publiek bekend is vanwege de film A Beautiful Mind.

Speltheorie concept

De logische basis van de speltheorie is de formalisering van drie concepten die in de definitie zijn opgenomen en die fundamenteel zijn voor de hele theorie:

Conflict,
Een beslissing nemen in een conflict,
Optimaliteit van de genomen beslissing.

Deze begrippen worden in de speltheorie in de ruimste zin beschouwd. Hun formaliseringen komen overeen met een zinvol idee van de bijbehorende objecten.

Als je de deelnemers aan het conflict noemt coalities van actie(door hun verzameling aan te duiden als D, zijn de mogelijke acties van elk van de actiecoalities hun strategieën(de verzameling van alle strategieën van de coalitie van actie) K aangeduid als S), zijn de resultaten van het conflict situaties(de verzameling van alle situaties wordt aangeduid als S; er wordt aangenomen dat elke situatie zich ontwikkelt als gevolg van de keuze van elk van de actiecoalities van sommige van zijn strategieën, zodat ), betrokken partijen - coalities van belangen(er zijn er veel - ik) en, tot slot, praat over de mogelijke voordelen voor elke coalitie van belangen Kéén situatie s"voor een ander" s"(dit feit wordt aangeduid als), dan kan het conflict als geheel worden beschreven als een systeem

Zo'n systeem, dat een conflict vertegenwoordigt, heet het spel... De concretisering van de componenten die het spel definiëren, leiden tot verschillende klassen van spellen.

Spelclassificatie

Afzonderlijke klassen van niet-coöperatieve spellen zijn:

antagonistische spellen, waaronder matrixspellen en vierkante spellen.
dynamische spellen, inclusief differentiële spellen,
recursieve spellen,
Overlevingsspellen

en anderen verwijzen ook naar coalitievrije spellen.

Wiskundige apparaten

Speltheorie maakt uitgebreid gebruik van verschillende wiskundige methoden en resultaten uit waarschijnlijkheidstheorie, klassieke analyse, functionele analyse (met name vaste-puntstellingen zijn belangrijk), combinatorische topologie, de theorie van differentiaal- en integraalvergelijkingen en andere. De specificiteit van de speltheorie draagt bij aan de ontwikkeling van verschillende wiskundige richtingen (bijvoorbeeld convexe verzamelingenleer, lineaire programmering, enz.).

In de speltheorie wordt besluitvorming beschouwd als de actiekeuze van een coalitie, of in het bijzonder de keuze van een speler voor sommige van zijn strategieën. Deze keuze kan worden voorgesteld als een eenmalige actie en formeel verheven tot de keuze van een element uit een set. Games met dit begrip van de keuze van strategieën worden genoemd spellen in normale vorm... Ze zijn tegen dynamische spellen waarin de keuze voor een strategie een proces is dat zich over een tijdsperiode afspeelt, dat gepaard gaat met het uitbreiden en inkrimpen van kansen, het ontvangen en verliezen van informatie over de huidige stand van zaken, enz. Formeel is een strategie in zo'n spel een functie, gedefinieerd op de verzameling van alle informatietoestanden van de beslisser. Het onkritisch toepassen van "keuzevrijheid"-strategieën kan tot paradoxale verschijnselen leiden.

Optimaliteit en ontkoppeling

De kwestie van het formaliseren van het concept van optimaliteit is erg moeilijk. Er is geen uniform begrip van optimaliteit in de speltheorie; daarom moeten verschillende principes van optimaliteit in overweging worden genomen. Het toepassingsgebied van elk van de optimaliteitsprincipes die in de speltheorie worden gebruikt, is beperkt tot relatief beperkte klassen van het spel, of betreft beperkte aspecten van hun overweging.

De kern van elk van deze principes zijn enkele intuïtieve ideeën over het optimum als iets 'stabiel' of 'redelijk'. De formalisering van deze representaties geeft de eisen aan het optimum en heeft het karakter van axioma's.

Onder deze vereisten kunnen er zijn die elkaar tegenspreken (het is bijvoorbeeld mogelijk om conflicten aan te tonen waarin de partijen worden gedwongen genoegen te nemen met kleine winsten, aangezien grote winsten alleen kunnen worden behaald in onzekere situaties); daarom kan een uniform optimaliteitsprincipe niet worden geformuleerd in de speltheorie.

Situaties (of sets van situaties) die in een bepaald spel aan bepaalde optimaliteitseisen voldoen, worden beslissingen van dit spel. Omdat het idee van optimaliteit niet eenduidig is, had het ontkoppeling van games in verschillende betekenissen. Het creëren van definities van speloplossingen, het tot leven brengen en het ontwikkelen van manieren om er daadwerkelijk naar te zoeken zijn de drie belangrijkste problemen in de moderne speltheorie. Dicht bij hen zijn er vragen over de uniciteit van de oplossingen van games, over het bestaan in bepaalde klassen van games van oplossingen die een aantal vooraf bepaalde eigenschappen hebben.

Geschiedenis

Als een wiskundige discipline ontstond de speltheorie gelijktijdig met waarschijnlijkheid in de 17e eeuw, maar ontwikkelde zich bijna 300 jaar lang niet. Het eerste belangrijke werk over speltheorie moet worden beschouwd als een artikel van J. von Neumann "On the theory of strategische games" (1928), en met de publicatie van de monografie van de Amerikaanse wiskundigen J. von Neumann en O. Morgenstern "Game theory en economisch gedrag" (1944), is de speltheorie naar voren gekomen als een onafhankelijke wiskundige discipline. In tegenstelling tot andere takken van de wiskunde, die een overwegend fysieke, of fysieke en technologische oorsprong hebben, was de speltheorie vanaf het allereerste begin van zijn ontwikkeling gericht op het oplossen van problemen die zich voordoen in de economie (namelijk in een concurrerende economie).

Vervolgens werden de ideeën, methoden en resultaten van de speltheorie toegepast op andere kennisgebieden die te maken hebben met conflicten: in militaire zaken, in morele zaken, in de studie van massagedrag van individuen met verschillende belangen (bijvoorbeeld in zaken van bevolkingsmigratie, of wanneer we kijken naar biologische strijd om het bestaan). Speltheoretische methoden voor het nemen van optimale beslissingen onder onzekere omstandigheden kunnen op grote schaal worden gebruikt in de geneeskunde, in economische en sociale planning en prognoses, in een aantal wetenschappelijke en technologische kwesties. Soms wordt speltheorie het wiskundige apparaat van cybernetica of de theorie van operationeel onderzoek genoemd.

Keer bekeken