La scienza dei goal

Perché mai un economista e un filosofo scrivono un libro sul calcio? In particolare, su statistica, metodi quantitativi e sports analytics?

Un economista e un filosofo scrivono un libro sul calcio. Perché mai? La domanda è lecita e questa strana combinazione speriamo sia riuscita a produrre un libro godibile e allo stesso tempo rigoroso nel percorrere, lungo gli undici capitoli che lo compongono, la letteratura scientifica che è dedicata a questo sport. Le presentazioni: Carlo Canepa è un giovane filosofo, laureato in filosofia e scienze cognitive all’Università degli Studi di Genova, mentre Luciano Canova è un PhD in Economia e insegna alla Scuola Enrico Mattei di Eni Corporate University. Entrambi siamo studiosi di scienze comportamentali e proprio questo ambito ci ha portati a conoscere e a lavorare insieme, nel corso degli anni. Nel variegato mondo delle scienze sociali, di fatto quello che ci accomuna è la curiosità e il desiderio di approfondire o studiare tutto ciò che concerne la teoria delle decisioni: come e perché le persone decidono di compiere una specifica azione? Ma, oltre a questo, siamo appassionati di calcio. Juventino il primo, interista il secondo, questo derby d’Italia e di sfottò ci ha portati a curiosare, all’interno del mondo accademico, come la statistica e in generale l’uso dei dati nel calcio arricchisca anche il mondo delle scienze sociali. Luciano è stato abbonato all’Inter per diversi anni, ma fino a ora l’unica correlazione spuria robusta vuole che, quanto più lui sta lontano da San Siro, tanto più aumentano le chances dell’Inter di fare una buona stagione (quest’anno, infatti, non è abbonato). Carlo è un lettore letteralmente onnivoro e ha raccolto nel corso del tempo una mole di libri e articoli scientifici che si occupano di pallone.

cover

In realtà, di libri dedicati a calcio e statistica ne esistono diversi. Stefan Szymanski è professore di Sport Management alla University of Michigan e insieme al giornalista Simon Kuper ha scritto Soccernomics, il primo tentativo di spiegare diversi fenomeni calcistici attraverso i metodi dell’economia e dell’econometria. Concentrati su temi più di carattere finanziario sono invece volumi come Goal Economy di Marco Bellinazzo, che descrive come la finanza globale ha trasformato il calcio attuale. Chris Anderson, ex giocatore di una squadra di quarta divisione nella Germania Ovest, e David Sally, ex lanciatore di baseball, ora entrambi professori, hanno pubblicato del 2013 The Numbers Game, che attraverso l’analisi delle statistiche sfata numerosi miti del gioco del pallone. Dedicati a un unico argomento sono Twelve yards di Ben Lyttleton e Inverting the Pyramid di Jonathan Wilson. Il primo, pubblicato nel 2014, è interamente focalizzato sullo studio dei calci di rigore, mentre il secondo racconta l’evoluzione della tattica nel calcio e di come si sia arrivati alla diffusione di moduli come il sempre più in voga 3-5-2. Accanto a questa letteratura, ormai da anni è condotta parallelamente una grande mole di studi scientifici. Working paper e ricerche sono quotidianamente pubblicati su riviste scientifiche come il Journal of Sports Economics, Journal of Sports Analytics, e il Journal of Quantitative Analysis in Sports. E non mancano eventi e conferenze, dove i ricercatori presentano i risultati del proprio lavoro. Dal 2006, l’MIT Sloan Sports Analytics Conference, fondato da Daryl Morey, general manager degli Houston Rockets dell’NBA, è la rassegna più importante in questo settore. La spinta a questo approccio quantitativo al calcio è dovuta, tra i diversi fattori, al successo del termine Moneyball, titolo di un libro di Michael Lewis del 2003 e del fortunato film con Brad Pitt, dedicato alla storia di Billy Beane, manager del baseball americano che, per primo, usò la statistica per assemblare la sua squadra degli Oakland Athletics e portarla alle finali della Major League.

9th January 1933: Former Arsenal Captain, Tom Parker demonstrating positional play to members of the Nunhead team in the changing room. (Photo by J. A. Hampton/Topical Press Agency/Getty Images)

“Moneyball”, oggi, è un’espressione costantemente usata da chi si occupa di numeri e sport: nel calcio è stato recentemente accostata a Matthew Benham, proprietario della società inglese Brentford e del Midtjylland, vincitrice del campionato danese nel 2015. La particolarità di queste due società è quella di essere gestite attraverso un rigoroso metodo che fa fortemente affidamento su modelli statistici e algoritmi, che elaborano i numeri raccolti sul campo per migliorare le decisioni societarie. Il continuo riferimento a Moneyball, però, è calzante soltanto in parte. Da un lato, è vero che Beane è stato il primo nel mondo del baseball a usare le statistiche in modo scientifico, cioè dotandosi di un metodo che permettesse di utilizzare i dati per uno scopo preciso. Lo scopo: individuare giocatori sottovalutati dal mercato per comprarli, spendendo poco, ma con un grande ritorno in termini di risultati. Dall’altro lato, questa è solo una delle innumerevoli strategie con cui possono essere utilizzate le statistiche. Un esempio nel basket statunitense riguarda i San Antonio Spurs e i Dallas Mavericks. I primi, sulla scia di Beane, hanno puntato sulle statistiche soprattutto per efficientare i propri acquisti in sede di mercato. I secondi, invece, hanno investito sulla raccolta dati per migliorare in particolare le prestazioni durante la partita. Due strategie diverse, complementari tra loro, che sfruttano un unico metodo: l’uso dei dati. Moneyball è solo un modo per servirsi della metodologia scientifico-statistica, la quale a sua volta è costituita da strumenti diversi, raccolti dall’espressione sports analytics.

Quest’ultimo termine sottende numerose applicazioni, a volte lontane tra loro, altre volte accumunate da numerose sfumature. Innanzitutto, con “analytics” si intende la ricerca di pattern significativi all’interno di una enorme quantità di numeri, quelli che oggi prendono il nome di “big data” e sono raccolti tramite sensori, telecamere e strumenti tecnologici di vario genere. Con riferimento specifico allo sport, Ben Alamar, direttore della Production Analytics di Espn, spiega nel suo libro omonimo come la sports analytics, applicata alle società sportive, consista di tre componenti fondamentali. La prima riguarda la raccolta dei dati; la seconda l’elaborazione degli algoritmi in formule e algoritmi che permettano di prevedere le prestazioni in campo; la terza nei sistemi informativi che consentono a chi deve prendere le decisioni di capire cosa le statistiche ci comunichino. Con particolare riferimento al calcio, la sports analytics ha fatto passi da giganti negli ultimi anni. Il problema, come evidenziato da Mike Goodman in un articolo del 2014 su Grantland, è che siamo solo nella sua fase “adolescenziale”: si sta facendo molto per quanto riguarda le statistiche descrittive, quelle che arricchiscono i numeri tradizionali che troviamo nei tabellini a fine partita. Queste però aiutano a descrivere, appunto, quello che è accaduto su un campo da calcio. Il prossimo passo è passare al lato analitico e predittivo della statistica, quello che permette di spiegare il perché di quello che è accaduto e di prevedere se potrà riaccadere in futuro. Spiegazione e previsione sono due degli obiettivi fondamentali di questo approccio innovativo, che coinvolge allenatori, dirigenti, giornalisti e tifosi.

Arsenal manager Tom Whittaker demonstrating a plan on the tactics table during a meeting with the team in the dressing room at Highbury Stadium, North London, 31st January 1947. From left to right Jimmy Logie, Reginald Lewis, Ernest Collett, Laurie Scott and Joshua Sloan.(Photo by Central Press/Getty Images)

I primi prototipi di statistiche che mirano a questi scopi esistono già, e sono utilizzati, oltre che dalle società calcistiche e dai provider di servizi, anche su siti come FiveThirtyEight, Stats Bomb, 11tegen11 e 2plus2equals11. Prendiamo l’esempio degli expected goals (ExpG). Questa categoria di formule, a oggi il sacro Graal dell’analytics calcistica, tenta di andare oltre la semplice statistica dei goal segnati. Si parte dal presupposto che la parte più consistente della performance di un giocatore e di una squadra non sono i goal, ma i tiri effettuati. Gli ExpG calcolano, quindi, non quanti goal ha segnato una squadra, ma quanti goal una squadra in media avrebbe segnato con la quantità e la qualità di tiri creati. A ogni tentativo di segnare è assegnato un numero, basato sulla possibilità che quel tentativo produca una rete. A seconda delle diverse formule, la possibilità è calcolata in maniera diversa. Generalmente si prendono in considerazione diversi fattori, come la distanza dalla porta, il tipo di passaggio che permette il tiro (un cross, per esempio), il tipo di tiro (se effettuato col piede, di testa o con un’altra parte del corpo) e il tipo di giocata che ha portato al tiro (contropiede, azione manovrata e altro). Sulla base delle frequenze con cui sono calciati storicamente i palloni dalle diverse zone del campo e con questi diversi fattori, si può calcolare quanti goal dovrebbe segnare e subire una squadra in termini di probabilità. Ricerche mostrano che gli ExpG spiegano meglio le posizioni in classifica, rispetto alla classica differenza reti tra goal fatti e goal subiti. Come si inserisce in questo contesto di ricerca La scienza dei goal? Innanzitutto, il libro spera di mettere insieme e collegare pezzi di letteratura che, fino ad adesso, hanno dato luogo a libri e a ricerche separati. E, inoltre, lo fa dedicando molto spazio all’analisi del comportamento e delle decisioni di chi a calcio gioca. La scienza dei goal ha un approccio multidisciplinare in cui statistica, economia, psicologia e scienze cognitive si fondono insieme come perfetti strumenti di analisi di quel laboratorio naturale che è il campo da calcio.

Arsenal football club manager George Allison rehearsing tactics with the team, November 1938. (Photo by H F Davis/Topical Press Agency/Getty Images)

Ogni capitolo è strutturato con un primo e un secondo tempo, come fosse una partita. Questo perché da un lato dati, statistiche e studi scientifici sono usati dalle stesse squadre di calcio per migliorare le proprie prestazioni, spiegare come funzionano le componenti nel calcio e smentire, o confermare, le intuizioni degli addetti ai lavori. Quanto conta un allenatore? Che vantaggio dà giocare in casa? Qual è il modo migliore di tirare un calcio di rigore? Dall’altro, però, le partite di calcio e quello che vi succede sono spesso analizzate con la lente di ingrandimento da ricercatori e studiosi per provare a capire qualcosa di fatti e fenomeni che, in realtà, avvengono molto al di fuori del terreno di gioco. Qual è l’impatto della disuguaglianza dei salari sulla produttività? Una società multiculturale è più coesa di una con una sola etnia dominante? Conviene pagare ricchi bonus ai top manager?Naturalmente, queste sono domande che escono dall’ambito calcistico e di stretta competenza delle scienze sociali. Il bello di usare i dati del calcio, tuttavia, è che i campionati sono un laboratorio privilegiato di analisi. Le regole, in questo sport, sono uguali per tutti. Le prestazioni sono misurabili in modo più oggettivo che altrove. Insomma, sono le condizioni perfette per uno studio sperimentale. Se voglio sapere quanto la disuguaglianza nel reddito impatti sulla produttività, cosa di meglio che cercare i salari della Serie A o degli altri campionati e verificare quanto la differenza di ingaggi in una squadra produca conseguenze sui risultati? La scienza dei goal viaggia su questa lunghezza d’onda, con continui rimandi alla letteratura scientifica che, appunto, ha fatto del calcio un laboratorio di investigazione scientifica per eccellenza.

1938: Ipswich Town (Suffolk) football club players have a meeting to discuss tactics. (Photo by London Express/Getty Images)

In conclusione, è importante fare due osservazioni. La prima riguarda l’uso che della statistica si fa per comprendere il calcio. I dati, se presi da soli, non sono informazione, e l’informazione di per sé non è conoscenza. I numeri sono vuoti se non sono contestualizzati e supportati da ipotesi verificabili e falsificabili. Come in ogni ricerca scientifica, la metodologia utilizzata per interrogare i numeri è fondamentale per comprendere la risposta che si ottiene. La seconda osservazione fa riferimento a un gruppo di critiche, che vedono negli approcci quantitativi una perdita di poesia per lo sport. Una squadra di calcio resta un sistema complesso e, come tale, i fattori che possono spiegarne i risultati sono molteplici e difficilmente controllabili. Basti pensare all’effetto del tempo meteorologico: chi non ricorda il Perugia-Juventus che impaludò lo scudetto dei bianconeri? Lo spazio per il talento e l’estro c’è tutto e, forse, è ciò che rende questo sport così bello e allo stesso tempo la ricerca scientifica così seria e rigorosa. Non c’è una scienza dei miracoli, non ci sono software magici che trasformino undici brocchi in una squadra di campioni. C’è solo passione, “cuore” e competenze messe al servizio di uno sport. Come diceva Osvaldo Soriano, «perfino in Vaticano parlano solo di calcio. Stamattina ho sentito che pregavano perché non crolli l’Olimpico».