La modellizzazione matematica dell’epidemia: usi e abusi

Un’intervista a Giuseppe De Nicolao e Tommaso Dorigo

[Illustrazione di Andrea De Franco]

All’edizione di Festivaletteratura a cui avevate partecipato grossa parte della programmazione scientifica era dedicata all’uso e abuso della statistica, dentro e fuori le scienze. Con l’insorgenza dell’epidemia, varie comunità accademiche (fisici, computer scientists, etc.) si sono mobilitate per fare analisi dati, che vengono aggiornate giorno per giorno.

Giuseppe De Nicolao: Personalmente mi sono mosso malvolentieri quando ho capito che c’era un TIR in arrivo e che il Governo pensava di aver fatto abbastanza, ritenendo di non dover introdurre correttivi per altri 4-5 giorni. In quel momento mi era già chiaro che l’epidemia avrebbe portato le terapie intensive al collasso e che i medici avrebbero finito per essere costretti a decidere chi salvare e chi no in base all’età e al quadro clinico. Ero atterrito e angosciato. A quel punto, ho visto che Bucci, Marinari e Parisi avevano già pubblicato una prima analisi e mi sono unito a loro nel lanciare l’allarme.

Questa sovrabbondanza di analisi però rischia di creare più confusione di quanta ne risolva: se per ogni scenario futuro possibile c’è un’andamento che l’aveva predetto, rischiamo di poter fare solo considerazioni a posteriori…

Giuseppe De Nicolao: è vero, se ne vedono di tutti i colori. Io stesso sono stato accusato di inutile allarmismo.

Tommaso Dorigo: Con i dati a disposizione, la moltitudine di fonti da cui attingere, e la loro farraginosità, si può “dimostrare” qualunque cosa e il suo esatto contrario. La mancanza di rigore metodologico e il pressapochismo sono disarmanti e mi hanno spinto a fare un appello sul gruppo Facebook physicists against sars-covid-19 e a scrivere un post sul mio blog, entrambi molto apprezzati ma che non hanno avuto ripercussioni.

Quali dovrebbero essere allora dei buoni principi di riferimento?

Tommaso Dorigo: Penso che non si possa prescindere dal tenere saldo e ben visibile sulla nostra “scrivania virtuale” il metodo scientifico. A prescindere dalla nostra disciplina di principale expertise, sia questa fisica, statistica, epidemiologia, o altro, non possiamo dimenticarci che c’è una differenza fondamentale fra osservazioni qualitative e stime quantitative. Mentre le prime possono essere utili a dispetto della loro imprecisione, le seconde corrono il rischio di creare grossi danni se non sono condotte con cautela e rigore. Ora, il metodo scientifico passa attraverso, appunto, il rigore metodologico, e quest’ultimo ci richiede di conoscere il lavoro dei nostri colleghi prima di avventurarci nell’analisi statistica dei dati. Vedo ahimé giornalmente colleghi altrimenti abili e rispettati intrattenersi in stime del numero asintotico totale di morti in Italia, della data del picco dei contagi, ed altro, basandosi su interpolazioni mono-dimensionali a dati di dubbia veridicità, affetti da errori sistematici difficili da controllare e correlati punto a punto. Questi colleghi conoscono tutti questi problemi, e tuttavia decidono di ignorarli, perché i social media ci premiano con un kick emozionale se partecipiamo, riceviamo likes, contribuiamo, a dispetto dal valore effettivo dei nostri contributi. Il metodo scientifico invece ci dovrebbe spingere a maggiore cautela, e ad un faticoso studio della famosa “domain knowledge” [NdR: le conoscenze specifiche di un settore, distinta dalla “general knowledge”] in questo caso modelli di diffusione e epidemiologia. E’ disarmante vedere che i fisici invece pensano che la loro alta conoscenza della loro materia sia sufficiente a conoscere i dettagli di qualunque altra disciplina. Non è così e i risultati si vedono: pressapochismo, dilettantismo, crackpot-like behaviour insomma.

In questo frangente, è possibile fare diversamente dal tentare qualcosa, purchessia? Molte delle tecniche statistiche usate soprattutto dai fisici prevedono una situazione controllata di laboratorio, per cui è possibile separare la fase di “playground”, in cui si gioca con i dati, e l’esperimento vero e proprio, soggetto ad un protocollo. Qui invece, come nel film Funny Games di Haneke, dal momento in cui la disgrazia si presenta alla porta – dopo aver visitato i vicini, e senza che ci si accorgesse della gravità della situazione – ci si trova scaraventati nella situazione senza un momento fiato per fermarsi a riflettere e pianificare. Bisogna fare con quello che si ha.

Giuseppe De Nicolao: Infatti all’inizio dell’epidemia per una settimana ho prodotto grafici cercando di sottolineare come nelle altre regioni si stesse replicando il profilo di crescita lombardo. Niente di sofisticato, poco più di un data visualization. Mi sono limitato a estrapolare linearmente i dati in scala logaritmica per anticipare cosa sarebbe successo nell’arco di pochi giorni. Tutto sull’onda dell’emergenza e della necessità di lanciare messaggi facilmente comprensibili perché ogni giorno perso avrebbe pesato nel bilancio dei morti. Le mie analisi sui confronti regionali sono state richieste e usate da un’unità di crisi regionale e forse hanno contribuito a far maturare la consapevolezza della necessità di un lockdown nazionale. Sono rimasto attivo per poco più di dieci giorni, perché mi sembrava utile sensibilizzare sul pericolo, e sulla necessità di un forte distanziamento sociale.

Tommaso Dorigo: L’approccio qualitativo rimane accettabile, perché nella sua imprecisione è meno criticabile. Chi ha sovrapposto “alla membro di molosso” (simpatica espressione trovata sul già citato gruppo Facebook) i contagi di Cina e Italia spostando la data di inizio delle due curve alla buona ha certamente permesso di capire dove eravamo diretti nel breve periodo, e questo aiuta (raccolgo questo commento dal mio blog da un collega brillante ma non nuovo ad analisi qualitative anche controverse). Ma avere la presunzione di poter capire l’evoluzione di un contagio in maniera quantitativa è un altro paio di maniche. Si può fare, ma richiede l’approccio rigoroso che qui ci può insegnare un epidemiologo, non un fisico – per quanto astuto.

Da un lato sembra mancare un’ipotesi, e le assunzioni del modello SIR che è la base della modellizzazione paiono molto semplificative. Inoltre ci sono problemi sistematici di stima: non è chiara l’uniformità e la completezza dei dati, ed esiste un’acceso dibattito per esempio su come vadano eseguiti i tamponi. Ai sani, ai guariti, ai malati? A campione, a tappeto? Insomma la “matematica del contagio” quando viene applicata non è affatto così semplice.

Tommaso Dorigo: Non è per nulla semplice! Anzi oserei dire che l’imprecisione di fondo, dovuta alla combinazione di disomogeneità dei dati e metodologia della loro raccolta (ogni paese ha un protocollo diverso per decidere la causa della morte, e.g., o se fare il tampone ai deceduti, ai deceduti in ospedale o a nessuno; ogni paese fa tamponi in quantità e modalità diverse; ogni paese diverso ha diversi protocolli per l’ammissione in ospedale; molti dati sono incompleti, corrotti, mancanti). In queste condizioni un’interpolazione monodimensionale è una cosa abbastanza sciocca. I fisici poi sono particolarmente “spoiled” da questo punto di vista: non hanno quasi mai a che fare con dati incompleti o raccolti con tecniche diverse, proprio perché progettano con cura i loro esperimenti per evitare di trovarsi in queste situazioni. Nel mondo reale invece i data analysts sono più avvezzi a dati mancanti e biased.

Giuseppe De Nicolao: Infatti dal 13 marzo non intervengo più. I dati lombardi (che rappresentano una parte considerevole dell’epidemia nazionale) sono biased. Fare previsioni sulla base di modelli fittati su dati inaffidabili mi sembra alquanto azzardato. Tanto più se fatto da chi non ha la domain kowledge necessaria per cautelarsi e finisce per prendere come oro colato numeri abbastanza problematici.

Inoltre è partita la corsa alla pubblicazione di risultati su arXiv [un archivio pubblico di manoscritti scientifici], il che da una parte può essere indicativo di una sincera volontà di aiutare, dall’altra può passare per una forma di sciacallaggio scientifico (alcuni esempi sono plateali; proprio ieri è uscito un articolo di tre pagine che prevedeva “the number of fatalities in Italy is expected to be 6000, and the crisis ends before April 15, 2020” – praticamente come puntare un terno al lotto, se vince vince e se perde pazienza, l’autore non ci avrà rimesso che qualche ora di lavoro).

Tommaso Dorigo: So da fonti interne di alto livello che arXiv sta rifiutando frotte di articoli, molti dei quali scritti da fisici che non si rendono neppure conto di quanto crackpottish è il loro approccio. Questo fa male al cuore.

Insomma sembra che la comunità scientifica sia partita molto volenterosa ma disarticolata, senza una chiara direzione o coordinamento istituzionale.

Giuseppe De Nicolao: Mi stupisco ancora oggi che siano stati degli outsider a lanciare l’allarme. Mi domando a cosa serva tutta la nostra competenza scientifica (con tutto il contorno di Big Data, Machine Learning, AI e Deep Learning) se non siamo capaci di riconoscere una valanga in arrivo, visibile a occhio nudo (bastava un grafico in scala logaritmica). Chissà se un giorno qualcuno formulerà l’equivalente della domanda della regina relativa alla crisi economica del 2008: “Why did no one see it coming?”.

Anche stimolati dal taglio dei bandi di concorso internazionali, tanti fisici si sono spostati ad applicazioni di stampo biologico, e la cooperazione e l’interdisciplinarietà sono molto incentivate. Questo però rischia di creare una letteratura scientifica “né carne né pesce”, poco rispettosa dei fondamenti epistemologici delle altre discipline.

Tommaso Dorigo: Come dicevo, la curva di apprendimento della domain knowledge in altri campi di ricerca è sempre molto lunga e difficile da seguire. L’approccio giusto è la collaborazione fra ricercatori di diverse discipline, e lo sforzo di trovare un linguaggio comune (primo ostacolo molto duro). Poi bisognerebbe capire che si può contribuire anche in maniera gregaria, invece di voler essere quello che dà la risposta definitiva. Ma noi fisici siamo sempre tutti convinti di essere i primi della classe, si sa. Questo rende difficile raggiungere una sinergia completa. Secondo me l’approccio giusto è quello di mettere a disposizione le proprie competenze. Se il campo di ricerca è uno in cui non si possiedono i fondamentali, non c’è un’altra via.

Che fare?

Tommaso Dorigo: È una domanda difficile. Come ho scritto nel blog, l’intrattenimento che fittare qualche punto con una curva offre al fisico confinato a casa sembra essere irresistibile. Non che sia nocivo, ma lo trovo un po’ deprimente e una rincorsa al ribasso delle competenze. D’altra parte è troppo facile per me stare in balconata a fare il tiro al piccione, deridendo chi si intrattiene in queste attività che almeno esorcizzano un po’ la propria paura del contagio. Vorrei che ci fosse un modo per convogliare le enormi potenzialità dei nostri validi ricercatori in fisica verso un obiettivo più costruttivo della previsione del picco dei contagi (che fra l’altro è affetto da un incognito errore del terzo tipo, di cui si parla molto poco – è la cattiva definizione della quantità soggetta a misura). Tuttavia vedo poche possibilità per gli analisti di dati di contribuire in questo momento, per due motivi. Uno, i dati sono comprensibili solo con una domain knowledge che non abbiamo, e che serve molto tempo ad ottenere. Due, collaborare con epidemiologi e virologi in questo momento appare difficile – sono abituati a lavorare in piccoli gruppi e in piu’ in questo momento sono travolti, mentre in questo genere di collaborazioni serve molto aiuto a chi non ha la domain knowledge nel primo periodo. L’INFN, l’ente di ricerca in fisica cui appartengo, ha però un enorme bagaglio di competenze anche nella costruzione di strumenti, e infatti so di diverse iniziative lodevoli che stanno prendendo piede, indirizzate al comprendere la dinamica della diffusione del virus in aria, al tracciamento dei contagi, e alla produzione di ventilatori ad hoc. Speriamo che queste iniziative abbiano successo!

Giuseppe De Nicolao: Vorrei vivere in un paese in cui non sia necessario fare quello che ho fatto, ma se torno al 2 marzo penso che fosse doveroso farlo. Non ti nascondo che di fronte alla dimensione della catastrofe che giorno dopo giorno tocca sempre più da vicino tutti, colpendo i parenti dei conoscenti se non i tuoi amici (e preghi che non arrivi più vicino) faccio fatica a impegnarmi in discussioni accademiche mentre la sanità della mia regione va a pezzi.

Giuseppe De Nicolao è professore presso il Dipartimento di Computer and System Science dell’Università di Pavia, e tra i fondatori della comunità ROARS. Tommaso Dorigo è fisico sperimentale, primo ricercatore INFN, autore del blog A quantum diaries survivor e della monografia Anomaly! Collider Physics and the Quest for New Phenomena at Fermilab (World Scientific, 2016).

2 pensieri riguardo “La modellizzazione matematica dell’epidemia: usi e abusi”

  1. Un po’ lungo ma interessante perché focalizza molto bene alcune problematiche scaturite dal proliferare di scritti e analisi “di non addetti ai lavori”.

  2. grazie giuseppe e tommaso. forse una cosa da fare nelle lunghe settimane che abbiamo davanti e’ mettersi a studiare sul serio nuove materie, con passione e umiltà. poi, forse, potremmo cominciare a parlare di cose che oggi, noi fisici, non sappiamo tanto bene. in fondo, quante volte diciamo che il problema del dibattito pubblico e’ l’ignoranza?

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.