## Warning in sqrt(deltas): NaNs produced

In data 18 Marzo, abbiamo lanciato la nostra applicazione che permette di monitorare la diffusione del Coronavirus in Italia tramite rappresentazioni geografiche, andamenti temporali e occupazione di posti in terapia intensiva. Oltre tutto questo, ci sono anche previsioni (il corsivo è d’obbligo, approfondiremo questo punto più avanti) sul totale dei casi, i deceduti e le altre quantità monitorate dalla Protezione Civile.

Come sono andate le nostre previsioni in questi primi giorni? Quanto buone sarebbero dovute essere? La risposta breve è: meglio di quanto sarebbe stato lecito attendersi (e meglio di quanto sia facile spiegare).

Prima di esaminare i risultati dal punto di vista tecnico, occorre fare un paio di premesse. Quando, di qui in poi, parleremo di previsioni buone o cattive, intenderemo esclusivamente del loro valore in relazione al dato reale. In nessun altro contesto infatti si potrebbe definire buona una previsione che contempla la morte di centinaia di persone (come del resto fa il nostro modello e continuerà a fare per giorni). Ma al modello matematico che giace al di sotto della realtà e la astrae non interessa affatto di cosa si stia parlando.

La seconda premessa è più sottile, forse filosofica, e riguarda proprio il significato di previsione (ed è anche il motivo per cui abbiamo usato il corsivo fin dall’inizio). Una previsione scientifica si deve basare su un modello robusto, con solide basi logiche e capace di spiegare il meccanismo che c’è sotto al fenomeno e anticiparlo. Quanto c’è di questo nel nostro modello? Francamente poco. Abbiamo semplicemente verificato che l’andamento dei dati potesse essere di una qualche forma funzionale, che prende spunto da letteratura di fenomeni simili, ma di per sé non è totalmente giustificata. In più, ha evidenti problemi di coerenza logica che il lettore più matematicamente smaliziato può individuare facilmente alla prima occhiata (come ad esempio l’andamento asintotico). Ecco perché al termine previsione preferiamo quello di estrapolazione, che è poco più di un continuare a tracciare un andamento anche al di là di dove sia corretto che esso funzioni, senza porsi grossi problemi. Cionostante, tali previsioni hanno assolutamente diritto di esistere e una propria (e in questo caso oserei dire grossa) utilità.

In casi come questi, occorre avere idea di quello che sta succedendo per poter interpretare la realtà e, conseguentemente, prendere decisioni logiche e razionali. Occorre, decisamente, saper leggere il dato. Le domande principali di fronte al fenomeno che stiamo vivendo sono infatti legate alla velocità con la quale il Coronavirus si sta diffondendo e l’efficacia delle misure restrittive. Un numero di contagi giornaliero, se non accompagnato da un benchmark che abbia un qualche tipo di senso, non può essere interpretato per rispondere alle domande più cruciali. È proprio in ottica di fornire un benchmark sensato che abbiamo scelto il nostro modello.

Come spiegato nella sezione della descrizione dei modelli, la diffusione incontrollata di un virus ha un primo andamento di tipo esponenziale. Ed infatti, come verificheremo anche tra poco, le grandezze principali monitorate (decessi e casi totali) nei primi giorni della diffusione erano ben descritte da un andamento di quel tipo. Ci sono motivi solidi e scientifici per poter affermare che una diffusione non può essere più veloce che esponenziale, con un esponente lineare con il tempo (che di per sé è già un ritmo maledettamente veloce); di conseguenza il benchmark esponenziale rappresenta il peggiore dei casi possibili. Se infatti la diffusione procede a quel ritmo, vuol dire che le cose non potrebbero andare peggio.

Fortunatamente, la diffusione ad oggi ha rallentato un po’ da quel ritmo infernale. Ma questo di per sé vuol dire poco. Immaginate di essere in auto. Un ritmo esponenziale sarebbe come se voi raddoppiaste la velocità ogni secondo. Siete a 100km all’ora. Dopo un secondo a 200, poi a 400. Rallentare questo ritmo vuol dire, ad esempio, che il secondo successivo non arrivate a 800, ma magari a 700 all’ora. La vostra accelerazione rimane però elevatissima.

Il rallentamento dal benchmark esponenziale può essere dovuto a vari fattori. Quello più sperabile, chiaramente, è che sia l’effetto delle misure contenitive. Non dobbiamo però sottovalutare altre cause. Anche in una situazione incontrollata, la diffusione ad un certo punto rallenta perché il virus trova meno persone da contagiare e perché la popolazione potrebbe immunizzarsi. C’è poi tutto il capitolo dell’affidabilità del dato. Ricordiamoci che questo non è un esperimento e il dato è molto spesso non pulito e dipendente anche da scelte dovute a contingenze, come ad esempio la scarsità di tamponi somministrati che impedisce di individuare con accuratezza tutti gli infetti.

Sia come sia, abbiamo modellizzato questo rallentamento con un termine quadratico al modello esponenziale. Tale modello ipotizza un andamento della diffusione che parte come esponenziale, ma con un ritmo che rallenta linearmente nel tempo. Come si può vedere nel diario che pubblichiamo quotidianamente, il modello esponente quadratico regolarmente offre estrapolazioni più accurate della sua controparte esponenziale. Ci sono due aspetti per l’elaborazione dei modelli di cui non abbiamo diffusamente parlato. Il primo è che, nel ricercare il miglior fit, i dati più recenti sono tenuti in considerazione maggiormente. Il peso dei dati aumenta linearmente dal più vecchio (che non conta nulla) al più recente. Questo effetto è bene visibile nei grafici: i primissimi punti sono solitamente molto distanti dalle curve del modello. Il secondo aspetto riguarda il fatto che il modello viene aggiornato ogni giorno. Questa sua evoluzione permette di essere più accurato per la previsione al giorno successivo. Diventa però interessante come tali modelli evolvano nel tempo.

Il modello esponenziale quadratico ha due parametri significativi. Il primo riguarda il ritmo di diffusione iniziale. Abbiamo chiamato \(K\) questo valore. Il secondo, \(M\), indica quanto tale ritmo rallenta o accelera ogni giorno. Il caso in cui \(M\) risulta vicino a zero corrisponde ad una crescita esponenziale pura. In tutti i modelli, \(M\) risulta negativo, segno di un rallentamento.

Anche il modo in cui abbiamo ipotizzato il rallentamento è tutt’altro che sicuro. In realtà, onestamente pensiamo che non ci possa essere un modo “corretto” di modellizzare la diffusione quando nel fenomento entrano così tanti fattori sociali, psicologici, culturali e umani. La reazione dei popoli e la loro disciplina può fare un’enorme differenza (e in un certo senso probabilmente già la sta facendo, se si confrontano gli andamenti tra Italia e Cina ad esempio). Possiamo quindi ipotizzare (e sperare) decise inversioni di tendenza nei prossimi giorni o settimane.

Come variano i valori di \(K\) e \(M\) ogni giorno dopo che il modello viene aggiornato per tenere conto dell’ultimo dato? Mostriamo la tabella per il caso dei deceduti.

Valore dei coefficienti \(K\) e \(M\) in funzione dell’aggiornamento del modello
Data K M
2020-03-10 0.3170766 -0.0004485
2020-03-11 0.3248669 -0.0008813
2020-03-12 0.3428486 -0.0018277
2020-03-13 0.3591244 -0.0026415
2020-03-14 0.3839384 -0.0038231
2020-03-15 0.3958855 -0.0043662
2020-03-16 0.4054713 -0.0047829
2020-03-17 0.4148046 -0.0051718
2020-03-18 0.4195824 -0.0053629
2020-03-19 0.4242258 -0.0055415
2020-03-20 0.4245735 -0.0055544
2020-03-21 0.4209911 -0.0054264
2020-03-22 0.4186014 -0.0053440
2020-03-23 0.4178293 -0.0053183
2020-03-24 0.4166525 -0.0052803
2020-03-25 0.4158708 -0.0052559
2020-03-26 0.4153893 -0.0052413
2020-03-27 0.4131364 -0.0051751

Se l’andamento fosse davvero quello ipotizzato dal modello, i valori che leggete nella tabella sopra dovrebbero rimanere più o meno costanti (a parte naturali oscillazioni statistiche). Il fatto che essi varino, e mostrino anche un andamento nel variare, è ancora una prova che il nostro semplice modello non riesce a catturare del tutto il vero andamento della diffusione. Ogni giorno, per adattarsi al nuovo dato il modello deve scegliere valori dei parametri diversi da quelli che aveva scelto il giorno precedente.

Come vediamo, il parametro \(M\) nei primi giorni assumeva un valore molto vicino a zero, segno di una crescita esponenziale. Tale valore è aumentato (in valore assoluto) con il passare dei giorni, fino ad assestarsi negli ultimi. Ne evinciamo che registriamo un rallentamento, che tale rallentamento prosegue, ma la stabilità di questi valori non ci permette di individuare una chiara inversione di tendenza. Fino infatti al 20 marzo, la previsione quadratica era stabilmente superiore al dato reale. Non è stato più così negli ultimi giorni, sebbene il dato rientrasse sempre nel range di incertezza statistica standard.

Il modello quadratico costituisce un secondo benchmark. Un numero di deceduti inferiore alle attese è segno che la decrescita prosegue ancora più rapida di quanto il modello possa rappresentare. Osserveremo la famosa inversione di tendenza quando la previsione sarà molto maggiore del dato reale.

Se continuiamo ad estrapolare i risultati del modello, ci dobbiamo aspettare un numero di morti dell’ordine di 600 ancora per qualche giorno, fino a quando, all’incirca dal 27 marzo, il numero di deceduti giornalieri comincia a diminuire. Da lì in poi, con ogni probabalità e con tutta la nostra speranza, il nostro modello non sarà più in grado di seguire fedelmente la diffusione e dovremo definire un nuovo benchmark allo scopo.

Tuttavia, qui entra un punto già aperto, ma che non possiamo più ignorare: l’andamento asintotico del modello. Se continuiamo imperterriti ad estrapolare dal modello, otterremmo un numero decrescente di deceduti complessivi, mentre tale numero non può che aumentare (o rimanere costante, quando il virus sarà totalmente debellato), evidentemente. In sostanza, è molto probabile che, se le condizioni rimangono invariate, il modello in questione sia troppo ottimista nel prevedere il picco. È possibile che per qualche giorno il dato si attesti sopra le previsioni prima ancora di stabilizzarsi.

D’altro lato però l’effetto delle misure più restrittive potrebbe non essere totalmente preso in considerazione. Forse quello di ieri rimarrà davvero il giorno peggiore di questa epidemia. Purtroppo però, non c’è da scommettere su una decisa diminuzione dei prossimi giorni.