Covid19-ita: un sito per orientarsi nelle statistiche tra tamponi, ricoveri e previsioni
Se oggi abbiamo 100 test positivi per Covid, quanti ricoveri in ospedale dobbiamo aspettarci tra una settimana? E cosa ci possono dire sul prossimo futuro gli andamenti di contagi e ricoveri già registrati? I modelli statistici applicati all'epidemiologia ci aiutano a stimare l'incertezza, stabilire priorità e persino capire quali dati raccogliere. Sul sito Covid19-ita lavoriamo sui numeri dell'epidemia in maniera critica utilizzando i dati pubblicamente disponibili, pur con le loro limitazioni, per valutare le misure di contenimento.
Negli ultimi due mesi un'inarrestabile epidemia di statistiche si è diffusa, tanto da fare pensare che l'incertezza sia l'unica certezza. In un recentissimo libro dall'emblematico titolo Radical Uncertainty, gli autori, due economisti inglesi, sostengono che il modo in cui affrontiamo il mondo si basa sulla costruzione di una narrativa della quale fanno parte le nostre aspettative. Quando l'incertezza invade questa narrativa, essa può essere buona o cattiva.
L'analisi dei dati epidemiologici Covid-19 ci ha posto davanti una serie di sfide. Come statistici e clinici abituati al ragionamento in condizioni di incertezza, ci siamo trovati di fronte a un tipo di incertezza insidiosa che deriva dalle molte incognite alla base dei modelli e dei dati che ci sono stati messi a disposizione. Non è facile quantificare facilmente questo parametro, ma sul sito Covid19-ita cerchiamo di lavorare sui numeri dell'epidemia in maniera critica. Il progetto è stato sviluppato dall'Unità di Biostatistica, Epidemiologia e Sanità Pubblica del Dipartimento di Scienze Cardio-Toraco-Vascolari e Sanità Pubblica dell'Università di Padova, in collaborazione con il Dipartimento di Scienze Cliniche e Biologiche dell'Università di Torino e del Dipartimento di Medicina Traslazionale dell'Università del Piemonte Orientale.
Una prima forma di incertezza deriva dalla nostra limitata capacità di valutare l'affidabilità dei dati. Per esempio, il numero dei casi positivi non è necessariamente indicativo di un rischio di contagio più elevato, ma può dipendere da altri fattori come il numero di test diagnostici effettuati, soprattutto se tali test sono pochi. In questo senso è utile conoscere quante persone vengono effettivamente testate, per valutare come varia il rapporto tra il numero di casi positivi e quello di casi negativi. Considerata infatti la necessità di fare due tamponi ciascuno per avere certezza della diagnosi, 1000 test effettuati significa che sono state testate un numero variabile tra 400-600 persone, ben diverso dal testare 1000 persone.
I dati sui ricoveri per Covid-19 probabilmente sono più affidabili, ma raccontano in parte una storia diversa. Noi per esempio, abbiamo osservato che l'incertezza previsiva sul dato del ricovero si riduce dal 70 al 15% nel momento in cui, nei modelli, si tiene conto del numero di test. In particolare, una strategia di test diffusa anche a soggetti con lieve sintomatologia o asintomatici, entrati in contatto con casi positivi, nella prima fase dell'epidemia ha aiutato a interrompere la catena infettiva, con conseguente contenimento del numero di ricoveri.
Una seconda forma di incertezza deriva dal fatto che i modelli utilizzati per prevedere l'andamento del contagio di Covid-19 sono necessariamente delle semplificazioni, a volte grossolane, della realtà. I modelli variano, e dunque fanno previsioni diverse, in base alle assunzioni da cui si parte per costruirli. Alcuni approcci si concentrano sull'adattamento delle curve previsive stabilite a partire dai dati disponibili, e dunque nelle loro proiezioni future sono fortemente influenzati dalla tendenza già osservata (noi, per esempio, li abbiamo utilizzati per valutare l’impatto del lockdown nella prima fase dell’epidemia); altri invece si basano sul meccanismo di trasmissione della malattia e richiedono che vengano fatte assunzioni su alcune grandezze come per esempio il numero di persone suscettibili, il periodo di incubazione, l'immunità dopo l'infezione, e come questi fattori interagiscono tra loro. Non è semplice individuare il giusto grado di complessità. Per stimare la diffusione del virus che provoca l'AIDS, per esempio, l’Organizzazione mondiale della sanità elaborò un modello molto complesso che però tendenzialmente sottostimò l'estensione della malattia. Un modello molto più semplice fu invece elaborato dagli inglesi Robert May e Roy Anderson che ebbero l'intuizione di considerare il dato relativo al numero dei partner. Questa semplice intuizione si rivelò vincente per capire la diffusione dell'AIDS.
Tutti i modelli sono sbagliati, ma alcuni sono utili, sosteneva George Box, uno statistico del passato, per mettere in guardia dal fatto che i modelli non sono degli oracoli. Al contrario sono strumenti che ci possono aiutare a organizzare il pensiero. E il loro valore dipende sia dalla nostra capacità di comprendere i processi che danno origine ai dati che osserviamo sia dalla qualità di tali dati.