Induzione all’indietro
Cos’è l’induzione all’indietro?
L’induzione all’indietro nella teoria dei giochi è un processo iterativo di ragionamento all’indietro nel tempo, dalla fine di un problema o di una situazione, per risolvere forme estese finite e giochi sequenziali e inferire una sequenza di azioni ottimali.
Spiegazione dell’induzione all’indietro
L’induzione all’indietro è stata utilizzata per risolvere i giochi da quando John von Neumann e Oskar Morgenstern hanno stabilito la teoria dei giochi come materia accademica quando hanno pubblicato il loro libro, Theory of Games and Economic Behaviour nel 1944.
In ogni fase del gioco l’induzione all’indietro determina la strategia ottimale del giocatore che esegue l’ultima mossa nel gioco. Quindi, viene determinata l’azione ottimale del penultimo giocatore in movimento, considerando l’azione dell’ultimo giocatore come data. Questo processo continua all’indietro fino a quando non è stata determinata l’azione migliore per ogni momento. In effetti, si sta determinando l’ equilibrio di Nash di ogni sottopartita del gioco originale.
Tuttavia, i risultati dedotti dall’induzione all’indietro spesso non riescono a prevedere il gioco umano effettivo. Studi sperimentali hanno dimostrato che il comportamento “razionale” (come previsto dalla teoria dei giochi) è raramente esibito nella vita reale. I giocatori irrazionali possono effettivamente finire per ottenere vincite più alte di quanto previsto dall’induzione all’indietro, come illustrato nel gioco del millepiedi.
Nel gioco del millepiedi, due giocatori alternativamente hanno la possibilità di prendere una quota maggiore di un piatto di denaro crescente, o di passare il piatto all’altro giocatore. Le vincite sono organizzate in modo tale che se il piatto viene passato al proprio avversario e l’avversario prende il piatto nel round successivo, si riceve un po ‘meno che se si avesse preso il piatto in questo round. Il gioco si conclude non appena un giocatore prende la scorta, con quel giocatore che ottiene la porzione più grande e l’altro giocatore che riceve la porzione più piccola.
Esempio di induzione all’indietro
Ad esempio, supponiamo che il giocatore A inizi per primo e debba decidere se “prendere” o “passare” la scorta, che attualmente ammonta a $ 2. Se prende, allora A e B prendono $ 1 ciascuno, ma se A passa, la decisione di prendere o passare ora deve essere presa dal giocatore B. Se B prende, lei riceve $ 3 (cioè, la scorta precedente di $ 2 + $ 1) e A ottiene $ 0. Ma se B passa, A ora decide se prendere o passare, e così via. Se entrambi i giocatori scelgono sempre di passare, riceveranno ciascuno una vincita di $ 100 alla fine del gioco.
Il punto del gioco è che se A e B cooperano entrambi e continuano a passare fino alla fine del gioco, ottengono la vincita massima di $ 100 ciascuno. Ma se diffidano dell’altro giocatore e si aspettano che “prendano” alla prima opportunità, l’equilibrio di Nash prevede che i giocatori accetteranno la richiesta più bassa possibile ($ 1 in questo caso).
L’equilibrio di Nash di questo gioco, in cui nessun giocatore ha un incentivo a deviare dalla strategia scelta dopo aver considerato la scelta di un avversario, suggerisce che il primo giocatore prenderebbe il piatto nel primo round del gioco. Tuttavia, in realtà, relativamente pochi giocatori lo fanno. Di conseguenza, ottengono un payoff maggiore rispetto al payoff previsto dall’analisi degli equilibri.
Risoluzione di giochi sequenziali utilizzando l’induzione all’indietro
Di seguito è riportato un semplice gioco sequenziale tra due giocatori. Le etichette con il giocatore 1 e il giocatore 2 al loro interno sono rispettivamente i set di informazioni per i giocatori uno o due. I numeri tra parentesi nella parte inferiore dell’albero sono i guadagni in ogni punto rispettivo. Il gioco è anche sequenziale, quindi il giocatore 1 prende la prima decisione (sinistra o destra) e il giocatore 2 prende la sua decisione dopo il giocatore 1 (su o giù).
L’induzione all’indietro, come tutta la teoria dei giochi, utilizza i presupposti di razionalità e massimizzazione, il che significa che il giocatore 2 massimizzerà il suo guadagno in una data situazione. In entrambi i set di informazioni abbiamo due scelte, quattro in tutto. Eliminando le scelte che il giocatore 2 non sceglierà, possiamo restringere il nostro albero. In questo modo, contrassegneremo le linee in blu che massimizzano la vincita del giocatore al set di informazioni fornito.
Dopo questa riduzione, il giocatore 1 può massimizzare i suoi guadagni ora che le scelte del giocatore 2 sono note. Il risultato è un equilibrio trovato inducendo all’indietro il giocatore 1 che sceglie “giusto” e il giocatore 2 che sceglie “su”. Di seguito è riportata la soluzione al gioco con il percorso di equilibrio in grassetto.
Ad esempio, si potrebbe facilmente impostare un gioco simile a quello sopra utilizzando le società come giocatori. Questo gioco potrebbe includere scenari di rilascio del prodotto. Se l’Azienda 1 volesse rilasciare un prodotto, cosa potrebbe fare l’Azienda 2 in risposta? L’azienda 2 rilascerà un prodotto concorrente simile? In previsione delle vendite di questo nuovo prodotto in diversi scenari, possiamo impostare un gioco per predire come eventi potrebbero svolgersi. Di seguito è riportato un esempio di come si potrebbe modellare un gioco del genere.