Previsioni elettorali, queste sconosciute!

Da quando esistono le elezioni, è nota la volontà di poter prevedere i risultati in anticipo. Considerando le scienze sociali una materia di difficile prevedibilità a causa del “fattore umano“, è sempre stato difficile avere previsioni chiare ed esaustive che si traducano poi nel risultato reale. Difficile ma non impossibile!

L’importanza della previsione è necessaria a tutti i livelli elettorali, per diversi motivi. In un paese come gli Stati Uniti, ad esempio a livello di primarie, è importante il polling e l’interesse espresso dall’opinione pubblica nei vari candidati perché può spingere a ritirarsi i candidati minori, aumentare il fundraising di altri e modificare così i rapporti di forza delle varie campagne elettorali.

A livello tecnico, al fine di prevedere il risultato di un’elezione è necessario mettere insieme le varie componenti che formano e guidano l’opinione pubblica: il risultato finale infatti è dato dalle singole espressioni di voto degli individui che si presentano al seggio al giorno delle elezioni. Naturalmente, la fonte primaria di informazioni è il sondaggio, che viene poi ad aggiungersi ad altre informazioni, i non-polling factors, che provengono dal mondo esterno (come gli endorsement ricevuti, l’etnia del candidato ed altre situazioni particolari).

Come tutte le previsioni su eventi futuri, la possibilità di sbagliare è inversamente proporzionale all’accuratezza che si presta alle informazioni disponibili, ma bisogna sempre fare i conti con le costanti di casualità e incertezza. In ogni caso, nonostante la materia sembri ricca di possibilità di errore, in passato diverse agenzie e individui hanno correttamente previsto i risultati di elezioni ed eventi incerti.

Uno tra gli esempi più interessanti è il forecasting promosso da FiveThirtyEight, creato dal famoso statistico e analista Nate Silver negli anni 2000. Nel 2008 infatti, con il modello statistico creato, Silver predisse correttamente il vincitore in 49 dei 50 stati degli USA, diventando così una superstar dell’analisi statistica. Attualmente l’attenzione è tutta sulle primarie americane, che presentano alcune difficoltà ulteriori rispetto alle elezioni generali, ma il lavoro che il team di Silver sta svolgendo sembra essere interessante e potrebbe presentare delle sorprese.

Chiaramente, come riportato dallo stesso team del 538, i modelli presentati non puntano alla precisione assoluta della previsione, ma a mostrare dei trend di voto probabili sulla base delle informazioni disponibili. A distanza di pochi giorni dalle elezioni, andiamo ad analizzare come funziona questo sistema.

Dall’inizio del 2016, sono stati condotti due studi separati che sono però strettamente interconnessi tra loro: Polls-Only e Polls-Plus.

Il Polls-Only (PO) è un modello statistico basato sui sondaggi di un solo, specifico stato. Quindi, nello stato del New Hampshire per la previsione vengono utilizzati sondaggi che hanno ad oggetto la sola popolazione di quello stato. Il punto di forza di questo tipo di approccio è la specificità delle informazioni, che hanno un maggiore tasso di verità relativa. Lo svantaggio è chiaramente il fatto che non sono inclusi i non-polling factors che potrebbero influenzare i cittadini votanti, come il trend nazionale, gli endorsements della classe dirigente per i singoli candidati, e così via.

Il Polls-Plus (PP) invece è un modello più completo, che si basa su tutte le diverse informazioni e potenziali indicatori di trend, sia specifici dello stato in questione che a livello nazionale.

Come riportato dallo stesso Silver, in teoria il modello Polls-Plus dovrebbe essere più preciso perché tiene conto di tutti i fattori di “inquinamento”, ed in passato il tasso di accuratezza era leggermente più alto rispetto all’altro modello (57% del PP contro il 42% del PO). Talvolta però la situazione si è ribaltata. Per questo motivo è essenziale considerare i due modelli come complementari.

Come abbiamo imparato da articoli precedenti, alcuni sondaggi sono buoni ed altri meno buoni; alcuni hanno un alto tasso di incertezza, altri non includono gli indecisi ed altri ancora sono invece particolarmente efficaci nel rilevare le preferenze verso i candidati. Al fine di costruire il modello statistico, il team deve necessariamente operare una scelta stilistica su quali siano i sondaggi meritevoli di considerazione e quali invece vengano ritenuti fuorvianti. Una scelta di questo tipo è arbitraria e senza ombra di dubbio opinabile, e studi diversi, con alla base scelte diverse, potrebbero portare a risultati diversi, anche migliori. Tuttavia, Nate Silver risulta attualmente essere lo statistico con il più alto tasso di precisione nella previsione elettorale, e per questo il suo studio è particolarmente interessante.

Il primo step dell’analisi è il calcolo della media dei sondaggi.

“Calculation of polling averages”, significa che viene calcolata per ciascun singolo candidato di uno stato una media pesata dei sondaggi disponibili. La componente essenziale da comprendere è proprio la pesatura dei casi, determinata in base a diversi parametri. Il primo è il livello di accuratezza ed utilizzo di una corretta metodologia da parte dell’istituto realizzatore del sondaggio. Il secondo ma non meno importante aspetto è quanto un sondaggio è recente: i sondaggi più vicini nel tempo alla data delle elezioni vengono valutati maggiormente rispetto a sondaggi che potrebbero rappresentare preferenze superate nel tempo. Un altro importante aspetto riguarda il “sample size“, cioè la dimensione del campione ed il margine di errore del sondaggio. In generale, tutti i sondaggi sono inclusi nell’analisi, con diversi pesi. Vengono esclusi a priori i sondaggi commissionati o prodotti dai singoli candidati o associazioni a loro correlate (Super PACs) o i sondaggi ritenuti fallaci in metodologia, di dubbia completezza o se vi sono dubbi sull’etica di conduzione.

Una caratteristica particolare del primary forecasting è il fatto che l’opinione pubblica cambia molto più rapidamente che in occasione delle elezioni generali, in cui di norma vi sono solo due candidati contrapposti. Per questo motivo, un sondaggio recente di media qualità potrebbe essere valutato di più di un sondaggio di migliore qualità ma meno recente. “Newer polling data is the priority“.

Una differenza essenziale tra i due modelli è l’allocazione degli indecisi ai candidati. Nel modello PO, infatti, gli indecisi sono allocati con statistica proporzionale ai risultati della media dei sondaggi al singolo candidato. Questo significa che un candidato al 50% si vedrà attribuire una quota di indecisi doppia rispetto ad un candidato che si posiziona in media sul 25%. Una seconda caratteristica essenziale è il livello di probabilità che un candidato rinunci (drop out) alla corsa alla nomination prima del giorno del voto (spostando così le percentuali di probabilità dei candidati che restano in lizza).Il PP invece, come detto, tiene conto di un numero maggiore di informazioni.

Per quanto riguarda gli endorsement, è risaputo che le élite del partito giocano un ruolo importante nello spostamento dei voti. Gli endorsement sono misurati attribuendo dei punti in base alla provenienza dell’endorsement stesso. Se il sostegno viene espresso da parte di un attuale governatore vengono assegnati 10 punti al candidato, 5 se è il caso di un senatore, 1 nel caso di un membro della Camera dei rappresentanti. Come nel caso dei sondaggi, più un endorsement è recente, più viene valutato (per i principi di prossimità e visibilità). Per fare un esempio concreto: anche se Jeb Bush guida per numero di endorsement da parte della classe dirigente partito repubblicano, Marco Rubio ha un punteggio relativo più alto poiché ne ha ricevuti in numero maggiore in tempi più recenti.

Entrambi i modelli tengono conto della possibilità di ritiro dalla corsa dei candidati “bassi” nei sondaggi. Il tutto è basato su uno studio di tipo cronologico: difficilmente i candidati di un qualunque schieramento rinunciano alla corsa appena prima di un appuntamento importante (primaria o caucus). Nel caso in cui a due-tre giorni dall’evento siano ancora in corsa, generalmente testano le urne, anche quando partono in posizioni svantaggiate. Dopo Iowa e New Hampshire, primi due eventi elettorali della stagione, generalmente il numero di candidati si assottiglia di molto (probabilità molto alte in un caso come quello del 2016, con il numero impressionante di figure dalla parte repubblicana). Naturalmente, il principio è che i candidati con le minori chances nei sondaggi sono ‘potenziali ritirati’ mentre quelli che vedono crescere il proprio consenso non lo sono. Diversi studi inoltre riportano che endorsement e sondaggi nazionali hanno scarso impatto sulla possibilità di ritiro da parte dei candidati; invece, di maggiore importanza è quanto il candidato che rivede la sua posizione sia apprezzato negli stati prossimi al voto. Come è ovvio, in un evento elettorale più sono alte le probabilità che un candidato abbandoni la corsa, più sono alte le possibilità di successo degli altri candidati il cui ritiro è considerato meno probabile. Anche questo contribuisce a determinare le chances dei candidati più competitivi di risultare primi a livello di numero di voti al giorno delle elezioni.

Chiaramente tutto ciò è necessario per arrivare ai projected results, alla previsione dei risultati. Il modello non presenta un dato chiaro e finito, non solo almeno. Ad un occhio poco attento, una previsione che vede Trump al 21,1% e ‘sbaglia’ di un 5% è poco credibile e da non considerare. In realtà il numero finito, o punto di stima, è per l’appunto il punto di interesse di una curva più ampia, che rappresenta uno specchio di possibilità. Le parabole sono poi asimetriche, a significare che le probabilità di distribuzione sono differenti. Infatti un candidato che si trova al 5% ha possibilità di guadagnare 10 punti percentuali e trovarsi così ad un 15%, ma non ha la possibilitàinversa (perdere 10 punti percentuali ed andare a -5%). Il discorso della possibilità di fuoriuscita dalla competizione del candidato aumenta la forzatura della curva verso destra o verso sinistra.

Diversi sono i fattori di essenziale considerazione:

All’aumentare della prossimità dell’elezione, il livello di incertezza diminuisce.
L’incertezza è tanto più grande quanto più un candidato è ben posizionato nei sondaggi (in altre parole, è difficile che un candidato al 2% si ritrovi drasticamente al 20%).
Al maggior numero di informazioni rintracciabili, l’incertezza diminuisce.
L’incertezza è maggiore al crescere del numero di candidati in lizza.
L’incertezza aumenta all’aumentare della differenza relativa tra i due modelli (PO vs. PP)

Tutti questi elementi producono una previsione che è ben lontana dall’essere precisa: molti sono ancora i candidati, la distanza dagli eventi elettorali centrali è ancora elevata, il numero di endorsement non è significativo ed i sondaggi nazionali e statali non sono poi così allineati. Inoltre vi sono molti fattori che non vengono considerati in questa analisi, come la possibilità di voti che si traferiscano da un candidato all’altro (un moderato per Bush difficilmente si sposterà verso Trump, ma potrebbe sostenere Rubio in determinate circostanze).

In ogni caso, come detto in precedenza, lo stesso modello è riuscito a prevedere ben 49 su 50 stati alle elezioni generali del 2008, ed ha una robusta teoria alle spalle. Al momento risulta essere il più accurato metodo di previsione elettorale, anche se questa turnata elettorale così peculiare servirà da banco di prova per gli studi futuri nel settore.

Good luck, 538, and good job!

Previsioni elettorali, queste sconosciute!

Alessandro Da Rold

Commenta

Cancella la risposta

I nostri canali social

Contatti

Vuoi partecipare ai nostri sondaggi?