Come la strategia della teoria dei giochi migliora il processo decisionale
La teoria dei giochi, lo studio del processo decisionale strategico, riunisce discipline disparate come matematica, psicologia e filosofia. La teoria dei giochi è stata inventata da John von Neumann e Oskar Morgenstern nel 1944 e da allora ha fatto molta strada. L’importanza della teoria dei giochi per l’analisi moderna e il processo decisionale può essere misurata dal fatto che dal 1970 fino a 12 importanti economisti e scienziati hanno ricevuto il Premio Nobel per le scienze economiche per i loro contributi alla teoria dei giochi.
La teoria dei giochi è applicata in numerosi campi, tra cui affari, finanza, economia, scienze politiche e psicologia. Comprendere le strategie della teoria dei giochi, sia quelle popolari che alcuni degli stratagemmi relativamente meno conosciuti, è importante per migliorare le proprie capacità di ragionamento e di decisione in un mondo complesso.
Punti chiave
- La teoria dei giochi è una struttura per comprendere la scelta in situazioni tra giocatori in competizione.
- La teoria dei giochi può aiutare i giocatori a raggiungere un processo decisionale ottimale quando si confrontano con attori indipendenti e concorrenti in un contesto strategico.
- Una forma comune di “gioco” che appare nelle situazioni economiche e aziendali è il dilemma del prigioniero, in cui i singoli decisori hanno sempre un incentivo a scegliere in un modo che crea un risultato non ottimale per gli individui come gruppo.
- Esistono molte altre forme di gioco. L’applicazione pratica di questi giochi può essere uno strumento prezioso per aiutare nell’analisi di industrie, settori, mercati e qualsiasi interazione strategica tra due o più attori.
Il dilemma del prigioniero
Una delle strategie di teoria dei giochi più popolari e basilari è il dilemma del prigioniero. Questo concetto esplora la strategia decisionale adottata da due individui che, agendo nel proprio miglior interesse individuale, finiscono per ottenere risultati peggiori rispetto a se avessero collaborato tra loro in primo luogo.
Nel dilemma del prigioniero, due sospetti arrestati per un crimine sono tenuti in stanze separate e non possono comunicare tra loro. Il pubblico ministero informa individualmente sia il Sospetto 1 che il Sospetto 2 che se confessa e testimonia contro l’altro, può essere liberato, ma se non collabora e l’altro sospettato lo fa, sarà condannato a tre anni di carcere. Se entrambi confessano, riceveranno una condanna a due anni, e se nessuno dei due confesserà, saranno condannati a un anno di prigione.
Mentre la cooperazione è la migliore strategia per i due sospetti, di fronte a un simile dilemma, la ricerca mostra che le persone più razionali preferiscono confessare e testimoniare contro l’altra persona piuttosto che rimanere in silenzio e correre il rischio che l’altra parte confessa.
Si presume che i giocatori all’interno del gioco siano razionali e cercheranno di massimizzare i loro guadagni nel gioco.
Il dilemma del prigioniero pone le basi per strategie avanzate di teoria dei giochi, di cui quelle popolari includono:
Penny corrispondenti
Questo è un gioco a somma zero che coinvolge due giocatori (chiamiamoli Giocatore A e Giocatore B) che piazzano simultaneamente un penny sul tavolo, con la vincita a seconda che i penny corrispondano. Se entrambi i penny sono testa o croce, il giocatore A vince e mantiene il penny del giocatore B. Se non corrispondono, il giocatore B vince e mantiene il penny del giocatore A.
Deadlock
Questo è uno scenario di dilemma sociale come il dilemma del prigioniero in quanto due giocatori possono cooperare o disertare (cioè non cooperare). In una situazione di stallo, se il giocatore A e il giocatore B cooperano entrambi, ottengono ciascuno una vincita di 1 e, se entrambi disertano, ottengono ciascuno una vincita di 2. Ma se il giocatore A collabora e il giocatore B fa un difetto, allora A ottiene una vincita di 0 e B ottiene una vincita di 3. Nel diagramma di vincita sottostante, la prima cifra nelle celle da (a) a (d) rappresenta la vincita del giocatore A, e la seconda cifra è quella del giocatore B:
Deadlock differisce dal dilemma del prigioniero in quanto l’azione di maggior vantaggio reciproco (cioè entrambi i difetti) è anche la strategia dominante. Una strategia dominante per un giocatore è definita come quella che produce la più alta vincita di qualsiasi strategia disponibile, indipendentemente dalle strategie impiegate dagli altri giocatori.
Un esempio di stallo comunemente citato è quello di due potenze nucleari che cercano di raggiungere un accordo per eliminare i loro arsenali di bombe nucleari. In questo caso, la cooperazione implica l’adesione all’accordo, mentre la defezione significa rinnegare segretamente l’accordo e conservare l’arsenale nucleare. Il miglior risultato per entrambe le nazioni, sfortunatamente, è rinnegare l’accordo e mantenere l’opzione nucleare mentre l’altra nazione elimina il suo arsenale poiché questo darà alla prima un enorme vantaggio nascosto rispetto alla seconda se mai scoppierà la guerra tra i due. La seconda opzione migliore è che entrambi disertino o non cooperino poiché ciò mantiene il loro status di potenze nucleari.
Cournot Competition
Questo modello è anche concettualmente simile al dilemma del prigioniero e prende il nome dal matematico francese Augustin Cournot, che lo introdusse nel 1838. L’applicazione più comune del modello di Cournot consiste nel descrivere un duopolio o due principali produttori in un mercato.
Ad esempio, supponiamo che le società A e B producano un prodotto identico e possano produrre quantità elevate o basse. Se entrambi cooperano e accettano di produrre a livelli bassi, un’offerta limitata si tradurrà in un prezzo elevato per il prodotto sul mercato e in profitti sostanziali per entrambe le società. D’altra parte, se difettano e producono a livelli elevati, il mercato sarà sommerso e si tradurrà in un prezzo basso per il prodotto e di conseguenza in profitti inferiori per entrambi. Ma se uno coopera (cioè produce a livelli bassi) e gli altri difetti (cioè produce surrettiziamente ad alti livelli), allora il primo va in pareggio mentre il secondo guadagna un profitto più alto che se entrambi cooperassero.
Viene mostrata la matrice dei payoff per le società A e B (le cifre rappresentano l’utile in milioni di dollari). Pertanto, se A coopera e produce a livelli bassi mentre B difetta e produce a livelli elevati, il guadagno è quello mostrato nella cella (b): pareggio per la società A e 7 milioni di dollari di profitti per la società B.
Gioco di coordinamento
In coordinazione, i giocatori guadagnano maggiori guadagni quando scelgono la stessa linea di condotta.
Ad esempio, si consideri due giganti della tecnologia che stanno decidendo tra l’introduzione di una nuova tecnologia radicale nei chip di memoria che potrebbe far guadagnare loro centinaia di milioni di profitti, o una versione rivista di una tecnologia più vecchia che li guadagnerebbe molto meno. Se solo una società decidesse di procedere con la nuova tecnologia, il tasso di adozione da parte dei consumatori sarebbe notevolmente inferiore e, di conseguenza, guadagnerebbe meno che se entrambe le società decidessero la stessa linea di condotta. La matrice dei payoff è mostrata di seguito (le cifre rappresentano l’utile in milioni di dollari).
Pertanto, se entrambe le società decidessero di introdurre la nuova tecnologia, guadagnerebbero $ 600 milioni ciascuna, mentre l’introduzione di una versione rivista della vecchia tecnologia farebbe guadagnare loro $ 300 milioni ciascuna, come mostrato nella cella (d). Ma se la società A decidesse da sola di introdurre la nuova tecnologia, guadagnerebbe solo $ 150 milioni, anche se la società B guadagnerebbe $ 0 (presumibilmente perché i consumatori potrebbero non essere disposti a pagare per la sua tecnologia ormai obsoleta). In questo caso, ha senso che entrambe le società lavorino insieme piuttosto che da sole.
Centipede Game
Questo è un gioco in forma estesa in cui due giocatori alternativamente hanno la possibilità di prendere la quota maggiore di una scorta di denaro che aumenta lentamente. Il gioco del millepiedi è sequenziale poiché i giocatori fanno le loro mosse uno dopo l’altro invece che simultaneamente; ogni giocatore conosce anche le strategie scelte dai giocatori che hanno giocato prima di loro. Il gioco si conclude non appena un giocatore prende la scorta, con quel giocatore che ottiene la porzione più grande e l’altro giocatore che riceve la porzione più piccola.
Ad esempio, supponiamo che il giocatore A inizi per primo e debba decidere se “prendere” o “passare” la scorta, che attualmente ammonta a $ 2. Se prende, allora A e B prendono $ 1 ciascuno, ma se A passa, la decisione di prendere o passare ora deve essere presa dal giocatore B. Se B prende, lei ottiene $ 3 (cioè la scorta precedente di $ 2 + $ 1) e A ottiene $ 0. Ma se B passa, A ora decide se prendere o passare, e così via. Se entrambi i giocatori scelgono sempre di passare, riceveranno ciascuno una vincita di $ 100 alla fine del gioco.
Il punto del gioco è che se A e B cooperano entrambi e continuano a passare fino alla fine del gioco, ottengono la vincita massima di $ 100 ciascuno. Ma se diffidano dell’altro giocatore e si aspettano che “prendano” alla prima opportunità, l’ equilibrio di Nash prevede che i giocatori accetteranno la richiesta più bassa possibile ($ 1 in questo caso). Studi sperimentali hanno dimostrato, tuttavia, che questo comportamento “razionale” (come previsto dalla teoria dei giochi) è raramente esibito nella vita reale. Ciò non sorprende intuitivamente data la piccola dimensione del pagamento iniziale rispetto a quello finale. Un comportamento simile da parte di soggetti sperimentali è stato anche mostrato nel dilemma del viaggiatore.
Il dilemma del viaggiatore
Questo gioco a somma non zero, in cui entrambi i giocatori tentano di massimizzare la propria vincita indipendentemente dall’altro, è stato ideato dall’economista Kaushik Basu nel 1994. Ad esempio, nel dilemma del viaggiatore, una compagnia aerea accetta di pagare a due viaggiatori un risarcimento per danni a oggetti identici. Tuttavia, i due viaggiatori sono tenuti separatamente a stimare il valore dell’articolo, con un minimo di $ 2 e un massimo di $ 100. Se entrambi annotano lo stesso valore, la compagnia aerea rimborserà a ciascuno di loro tale importo. Ma se i valori differiscono, la compagnia aerea pagherà loro il valore inferiore, con un bonus di $ 2 per il viaggiatore che ha annotato questo valore inferiore e una penale di $ 2 per il viaggiatore che ha annotato il valore più alto.
Il livello di equilibrio di Nash, basato sull’induzione all’indietro, è $ 2 in questo scenario. Ma come nel gioco del millepiedi, gli esperimenti di laboratorio dimostrano costantemente che la maggior parte dei partecipanti, ingenuamente o meno, sceglie un numero molto più alto di $ 2.
Il dilemma del viaggiatore può essere applicato per analizzare una varietà di situazioni di vita reale. Il processo di induzione a ritroso, ad esempio, può aiutare a spiegare come due società impegnate in una concorrenza spietata possano costantemente abbassare i prezzi dei prodotti nel tentativo di guadagnare quote di mercato, il che può comportare perdite sempre maggiori nel processo.
Battaglia dei sessi
Questa è un’altra forma del gioco di coordinazione descritto in precedenza, ma con alcune asimmetrie di guadagno. Si tratta essenzialmente di una coppia che cerca di coordinare la propria serata fuori. Sebbene avessero accettato di incontrarsi o alla partita (la preferenza dell’uomo) oa una partita (la preferenza della donna), hanno dimenticato ciò che avevano deciso e, per aggravare il problema, non possono comunicare tra loro. Dove dovrebbero andare? La matrice del payoff è mostrata di seguito con i numeri nelle celle che rappresentano il grado relativo di godimento dell’evento rispettivamente per la donna e per l’uomo. Ad esempio, la cella (a) rappresenta il guadagno (in termini di livelli di divertimento) per la donna e l’uomo durante lo spettacolo (a lei piace molto più di lui). La cella (d) è la vincita se entrambi arrivano al gioco della palla (a lui piace più di lei). La cella (c) rappresenta l’insoddisfazione se entrambi vanno non solo nel luogo sbagliato, ma anche nell’evento di cui godono di meno: la donna al gioco della palla e l’uomo al gioco.
Gioco del dittatore
Questo è un gioco semplice in cui il giocatore A deve decidere come dividere un premio in denaro con il giocatore B, che non ha alcun input nella decisione del giocatore A. Sebbene questa non sia una strategia di teoria dei giochi di per sé, fornisce alcuni spunti interessanti sul comportamento delle persone. Gli esperimenti rivelano che circa il 50% tiene tutto il denaro per sé, il 5% lo divide equamente e l’altro 45% dà all’altro partecipante una quota minore. Il gioco del dittatore è strettamente correlato al gioco dell’ultimatum, in cui al giocatore A viene data una certa somma di denaro, parte della quale deve essere data al giocatore B, che può accettare o rifiutare la somma data. Il problema è che se il secondo giocatore rifiuta l’importo offerto, sia A che B non ottengono nulla. I giochi del dittatore e dell’ultimatum tengono lezioni importanti per questioni come le donazioni di beneficenza e la filantropia.
Guerra di pace
Questa è una variazione del dilemma del prigioniero in cui le decisioni “cooperare o difettare” sono sostituite da “pace o guerra”. Un’analogia potrebbe essere due società guerra dei prezzi ridurrebbe drasticamente i guadagni (cella d). Tuttavia, se A si impegna a ridurre i prezzi (cioè, “guerra”) ma B no, A avrebbe un guadagno maggiore di 4 poiché potrebbe essere in grado di acquisire una quota di mercato sostanziale e questo volume più elevato compenserebbe i prezzi dei prodotti più bassi.
Il dilemma del volontario
Nel dilemma di un volontario, qualcuno deve intraprendere un compito o un lavoro per il bene comune. Il peggior risultato possibile si ottiene se nessuno si offre volontario. Ad esempio, si consideri un’azienda in cui le frodi contabili sono dilaganti ma il top management non ne è a conoscenza. Alcuni dipendenti junior del reparto contabilità sono a conoscenza della frode, ma esitano a dirlo al top management perché comporterebbe il licenziamento e molto probabilmente il perseguimento dei dipendenti coinvolti nella frode.
Essere etichettato come un informatore può anche avere alcune ripercussioni su tutta la linea. Ma se nessuno si offre volontario, la frode su larga scala può provocare il fallimento finale dell’azienda e la perdita del lavoro di tutti.
Domande frequenti
Quali sono i “giochi” utilizzati nella teoria dei giochi?
Si chiama teoria dei giochi poiché la teoria cerca di comprendere le azioni strategiche di due o più “giocatori” in una data situazione contenente regole e risultati prefissati. Sebbene sia utilizzata in numerose discipline, la teoria dei giochi è particolarmente utilizzata come strumento all’interno dello studio di economia e commercio. I “giochi” possono quindi riguardare il modo in cui due imprese concorrenti reagiranno alle riduzioni di prezzo dell’altra, se un’impresa dovesse acquisirne un’altra, o come gli operatori in un mercato azionario potrebbero reagire alle variazioni di prezzo. In termini teorici, questi giochi possono essere classificati come simili ai dilemmi del prigioniero, al gioco del dittatore, al falco e alla colomba e alla battaglia dei sessi, tra molte altre varianti.
Cosa ci insegna il dilemma del prigioniero?
Il dilemma del prigioniero mostra che la semplice cooperazione non è sempre nel migliore interesse. In effetti, quando si acquista un articolo costoso come un’auto, la contrattazione è la linea di condotta preferita dal punto di vista dei consumatori. In caso contrario, la concessionaria di automobili potrebbe adottare una politica di rigidità nella negoziazione dei prezzi, massimizzando i suoi profitti ma con il risultato che i consumatori pagherebbero più del dovuto per i loro veicoli. Comprendere i vantaggi relativi della cooperazione rispetto al disertare può stimolarti a impegnarti in significative negoziazioni sui prezzi prima di effettuare un grosso acquisto.
Cos’è un equilibrio di Nash nella teoria dei giochi?
L’equilibrio di Nash nella teoria dei giochi è una situazione in cui un giocatore continuerà con la strategia scelta, senza alcun incentivo a deviarla, dopo aver preso in considerazione la strategia dell’avversario.
In che modo le aziende possono utilizzare la teoria dei giochi mentre competono tra loro?
La concorrenza di Cournot, ad esempio, è un modello economico che descrive una struttura industriale in cui aziende concorrenti che offrono un prodotto identico competono sulla quantità di output che producono, in modo indipendente e allo stesso tempo. È effettivamente il gioco del dilemma del prigioniero.
La linea di fondo
La teoria dei giochi può essere utilizzata in modo molto efficace come strumento per il processo decisionale sia in un contesto contraddittorio, aziendale o personale.