SPECIALE CORONAVIRUS

CovIndex, predizioni pandemiche

Rilasciato un nuovo indicatore epidemiologico per il COVID, il CovIndex. Una chiacchierata su dati, predizioni e socialità al tempo della pandemia con Maurizio de Gregorio, l’inventore dell’indice

Oggi intervistiamo Maurizio de Gregorio, ideatore di “CovidTrends”, un portale di analisi indipendente dei dati ufficiali sulla pandemia e dell’indice CovIndex.

Maurizio di formazione è un ingegnere elettronico. Oggi, dopo un’esperienza ventennale tra Telco, IT e Fintech a sviluppare piattaforme digitali centrate sull’elaborazione dati e il machine learning, è il CTO/CPO di Mamacrowd.

Ciao Maurizio e grazie per avermi concesso quest’intervista. Pochi giorni fa hai reso pubblico questo nuovo indicatore, il CovIndex. Da quello che ho letto sul comunicato stampa è un nuovo indice sviluppato per mostrare il trend del contagio evidenziando in modo semplice e immediato se la diffusione dei contagi sta peggiorando o migliorando. Oggi, a livello ufficiale, si usa l’indice RT per monitorare la pandemia. In che modo CovIndex migliora le cose?

Dal 15 novembre sul sito è disponibile il CovIndex, una curva che mostra il trend del contagio evidenziando in modo semplice se la situazione sta peggiorando o migliorando. Come è noto l’indice ufficiale per avere l’andamento del contagio è il cosiddetto indice Rt. Tale indice ad oggi viene pubblicato settimanalmente dall’istituto superiore di sanita (ISS), e si riferisce ai dati di circa 10 giorni indietro. Infatti il report del 9 novembre fa riferimento ai dati dal 26/10 al 01/11. Inoltre come ha spiegato il Dott. Nino Cartabellotta, presidente della Fondazione GIMBE, in un intervento alla Camera dei Deputati, i dati di positività si riferiscono ad un contagio avvenuto circa 15 giorni prima, e in generale l’indice Rt riflette contagi avvenuti addirittura un mese prima.

Il nuovo CovIndex utilizzato nel sito, viene calcolato sul rapporto positivi per tampone, il cosiddetto tasso di positività Rpt. Il tasso Rpt è molto attendibile ed ha molti benefici come dichiarato dal Prof. Enzo Marinari sul Corriere della sera. Rpt è un dato che non risente delle oscillazioni continue sul numero dei controlli. 

Il CovIndex misura il rapporto tra due valori Rpt a distanza di 10 giorni. Tanto più il CovIndex è maggiore di 1, tanto maggiore è la crescita di Rpt, tanto il valore è minore di 1 e tanto più forte sarà la descrescita di Rpt.

Per dimostrare l’attendibilità della curva di CovIndex, è stato usato come riferimento la curva dell’indice Rt con i dati fino al 02 dicembre, pubblicati il 4 dicembre 2020 (Figura 1), il più recente oggi disponibile. 

Figura 1. Curva Rt Bollettino ISS del 2/12/2020

Le due curve vengono sovrapposte nello stesso periodo temporale per verificarne la correlazione (figura 2).

Figura 2. Curva Covindex e Rt a confronto

Come si può vedere entrambe le curve risultano molto correlate tranne in un picco ad inizio di Agosto in cui CovIndex mostrava un aumento di contagio che Rt non ha mostrato. Ma il dato più interessante è la parte della curva più vicina ai nostri giorni. La curva Rt si ferma al 19/11 mentre il Convindex mostra il trend fino al 31/11, quasi due settimane in più di visibilità.

Il CovIndex è calcolato sulla serie temporale di Rpt filtrata per rimuovere le oscillazioni settimanali. Per il filtraggio di Rpt non viene usata una comune media mobile a 7 giorni, in quanto il calcolo della media mobile introduce un ritardo pari a 3 giorni.

Ritardo media mobile 7gg = 0.5*(finestra-1) =  3 giorni

Per il filtraggio della curva Rpt è stato usato un filtro passa basso con Infinite Impulse Response (IIR) con trasformata Zeta. Anche i filtri IIR introducono un ritardo (phase-shift), per eliminare questo ritardo è stato implementato il seguente modello. 

Con X() e H() che sono rispettivamente la trasformata Z di x() e h() rispettivamente. Si applica una inversione temporale rimpiazzando con nel dominio della frequenza, così da ottenere

Il secondo filtro applica una successiva moltiplicazione con 𝐻(𝑒j):

Che porta alla sequenza finale

L’equazione del filtro così ottenuta è un numero reale, e pertanto la sua fase è zero, e non introduce ritardo.

La sequenza temporale filtrata LPRpt(t) è quindi ottenuta dalla serie Rpt(n) a cui viene applicato il suddetto filtro IIR. 

Grazie, molto esauriente a livello tecnico e sono certo che abbia soddisfatto ogni curiosità dei nostri lettori! Questo lavoro di analisi dei dati è molto importante, sia per i decisori che per i semplici cittadini. Pone però un problema a monte: la disponibilità di dati ufficiali di alta qualità. E magari anche in formato machine readable…

La diffusione pubblica dei dati è una necessità.
Se i dati sono disponibili pubblicamente è possibile che un gran numero di persone ed istituzioni li analizzino e possano contribuire a trovare soluzioni o osservare comportamenti che altrimenti sarebbero sfuggiti.
I dati devono essere distribuiti anche in modo che possano essere letti da algoritmi, e quindi non in un documento PDF.
Inoltre i dati devono essere disaggregati. Ad esempio noi oggi vediamo nei bollettini PDF dell’ISS statistiche di contagio per sesso e fascia di età, ma tali informazioni non sono rese pubbliche in modo puntuale. Non ci sono informazioni di dettaglio per provincia e comune, e non ci sono ancora informazioni su chi è la persona che oggi si infetta: che lavoro fa, fascia di età, se ha figli, ecc. 

Il dato ufficiale Rt, il dato più importante ed ufficiale per prendere le decisioni sul territorio, come abbiamo detto, è un dato piuttosto vecchio al momento in cui viene pubblicato.  

C’è una petizione in atto, #datibenecomune,  per richiedere che le informazioni della pubblica amministrazione, e in particolare del COVID-19, siano rese disponibili in modo pubblico, disaggregato e “machine readable”. Noi abbiamo chiaramente subito aderito. 

Andando oltre, ci vuoi raccontare il percorso che ti ha portato dall’ingegneria e il Fintech a iniziare un progetto come Covid Trends? Che poi, in parte, è anche la storia di come ci siamo incontrati e siamo arrivati a quest’intervista!

Sono un ingegnere ed ho la passione per gli algoritmi, ho lavorato per molti anni in grandi aziende di telecomunicazione e poi da una decina di anni ho iniziato a lavorare nel mondo delle startup tecnologiche basate su gestione di dati e intelligenza artificiale. Da qualche anno mi occupo di fintech, con esperienza sia in Italia che in Germania. Guido team di sviluppatori e esperti di prodotto nel disegnare e realizzare nuove piattaforme tecnologiche per la creazione di aziende native digitali. 

Da marzo ho iniziato l’analisi dei dati del COVID, per chiarire a me stesso ciò che accadeva. Ho trovato da subito che i dati pubblicati ed osservati dai media non aiutavano a chiarire la reale situazione. Poi mi hanno parlato di HackingCovid, un gruppo su Whatsapp di professionisti, su vari settori, che si stavano dedicando al tema Covid durante il primo lockdown. Sono entrato ed è stata una bellissima esperienza, ci sentiamo spesso, e si sono create anche delle amicizie reali. Dai social digitali ad aperitivi reali nelle città in cui mi trovavo durante le pur dure restrizioni da pandemia. Ciascuno nel gruppo da una mano come può per chiarire o per aiutare a portare a compimento qualche progetto o idea. Ed anche noi ci troviamo qui a parlarne grazie al gruppo.

Grazie Maurizio (e ad Hacking Covid!) per quest’ottima chiacchierata e grazie ai lettori di infosec.news. Lasciate il vostro commento!

Back to top button