Indice
Google come strumento per prevenire il Covid
La maggior parte di noi tende a consultare Internet per cercare risposta a domande relative alla salute molto prima di fissare un appuntamento dal medico di base (sapevi che il 7% delle ricerche quotidiane mondiali su Google sono legate alla salute?). Con grande presunzione arriviamo ad effettuare delle autodiagnosi online nelle quali poniamo estrema fiducia.
Sebbene sia molto fastidioso per i medici avere a che fare con pazienti che ritengono la loro ricerca su Google equivalente a una sudata Laurea in Medicina, il comportamento collettivo di ricerca online ha in realtà un grande potenziale per la diagnosi precoce e la localizzazione di focolai di malattie globali e locali. Molti ricercatori infatti hanno utilizzato i dati di ricerca su Google per tracciare la diffusione dell’Ebola durante l’epidemia del 2014 in Africa occidentale, del virus Zika durante l’epidemia del 2016 in Brasile e della febbre del Nilo occidentale per un periodo di undici anni in Italia.
Oggi, a distanza di due anni dall’inizio della pandemia da Covid-19, possiamo vedere come i ricercatori abbiano utilizzato il motore di ricerca ed i suoi dati aggregati anche per stabilire, ad esempio, l’incidenza della perdita di olfatto e gusto nei potenziali pazienti affetti da Covid.
Google Flu Trends (2008-2015)
Per un periodo limitato di tempo il colosso di Mountain View aveva realizzato un sistema per prevedere l’andamento dell’influenza stagionale in buona parte del mondo, sulla base delle ricerche effettuate in tema dai suoi utenti. Il cosiddetto Google Flu Trends (GFT), dal cui sito si può estrarre questa breve presentazione:
Abbiamo notato una stretta relazione tra quante persone cercano argomenti relativi all’influenza e quante persone hanno effettivamente sintomi influenzali. Naturalmente, non tutte le persone che cercano “influenza” sono effettivamente malate, ma emerge uno schema interessante sommando assieme tutte le query di ricerca relative all’influenza. Abbiamo confrontato i nostri dati con i tradizionali sistemi di sorveglianza dell’influenza e abbiamo scoperto che molte query in tema tendono ad essere popolari esattamente durante la stagione influenzale. Controllando quindi la frequenza di queste query possiamo stimare la quantità di individui colpiti da influenza in diversi paesi e regioni del mondo. I nostri risultati sono stati pubblicati anche sulla rivista Nature.
Peccato che il sistema fosse imperfetto: nella stagione 2012-2013 ha infatti sovrastimato la presenza dell’influenza di oltre il cinquanta per cento. GFT puntava all’obiettivo di poter prevedere le epidemie, ma il sogno si è sgretolato nel 2015 con la completa interruzione del servizio. L’uso dei cosiddetti Big Data in particolari settori, come ad esempio quello medico, non è sufficiente se non combinato a strategie più tradizionali.
Prevedere il COVID utilizzando le statistiche di ricerca di Google
A causa della situazione ancora piuttosto grave in numerosi paesi del mondo, tantissime persone sono alla ricerca di informazioni su come prevenire il Covid in modo efficace. A questo proposito i paesi con una maggior possibilità di collegamento ad Internet hanno assistito da inizio 2020 all’aumento delle ricerche su quasi tutti gli aspetti della malattia come sintomi, meccanismi di infezione, misure protettive, possibili cure e vaccini.
Google Trends è uno strumento online liberamente accessibile, che consente all’utente di analizzare le tendenze nelle ricerche pubbliche su Google durante un determinato periodo e in un determinato paese. Può essere quindi utilizzato per individuare la keyword da inludere nei testi SEO, come anche per sviluppare approfondimenti significativi sul comportamento della popolazione e sulle preoccupazioni relative alla propria salute. Quella che sembra la chiave di svolta per la prevenire il Covid-19 (e nuovi focolai) però va incontro ad alcune importanti obiezioni.
Contestazioni sull’uso di Google Trends per prevenire il Covid
Il ruolo dei media
Un’obiezione comune all’uso di Google Trends per il recupero dei dati di ricerca sui sintomi da Covid-19 è l’effetto di distorsione che possono produrre i media. Infatti quando le news sono dominate dal Coronavirus, non possiamo essere sicuri che la ricerca dei sintomi sia sincera e non guidata dalla curiosità o dall’ipocondria.
Per affrontare al meglio questo problematica esistono delle metodologie di trattamento dei dati, utili a “normalizzarli”. Senza scendere nei dettagli tecnici possiamo darne un esempio molto semplice e comprensibile: basterà escludere le query di ricerca più ampie e generiche. Le ricerche “Non sento più gli odori” e “Ho perso il senso dell’olfatto” rientrano nell’ambito di applicazione di ricerca, al contrario le query “anosmia” e “perdita dell’olfatto coronavirus” sono da escludere.
L’esempio datoci da Google Flu Trends
Un’altra obiezione è che Google Flu Trends, il primo e più noto strumento infodemiologico di cui abbiamo trattato sopra, è stato chiuso per errori di previsione gravissimi dal punto di vista statistico. Tuttavia, la conclusione più utile da trarre dalla lezione dataci da GFT non è che l’analisi dei dati di ricerca sia inaffidabile, ma che si debba trattare di un semplice complemento ad altri metodi per incrociare i dati e colmare lacune. L’importante dunque è evitare l’errore fatto in precedenza ed accedere in primis alle banche dati sull’infezione da Covid-19 messe a disposizione da ogni Paese, incrociando i relativi dati con quelli di Google Trends.
Ma è davvero possibile prevenire il Covid con Google?
Bernhard Vennemann, ingegnere e data scientist di Zurigo, ha condotto una ricerca proprio sull’argomento trattato finora; il grafico qui presente è il risultato del suo lavoro.
La curva blu rappresenta i nuovi casi di Covid confermati nei relativi lassi temporali ed indica chiaramente che ci sono state tre ondate di infezioni da Covid, una iniziata all’inizio di marzo 2020, la seconda intorno a giugno 2020 e la terza intorno a ottobre 2020. Ognuna di queste ha raggiunto il picco diverse settimane dopo l’inizio, prima di scendere a un livello inferiore (ma comunque elevato). L’ultima ondata in realtà ha avuto due picchi, ma i dati potrebbero non essere del tutto conclusivi su questo.
La curva arancione mostra invece la tendenza di ricerca su Google per il termine “sintomi covid” nello stesso periodo di tempo. Come per la curva blu, vediamo tre picchi, più o meno nello stesso periodo delle tre ondate di contagi. È interessante notare che i picchi nelle ricerche online hanno raggiunto livelli approssimativamente uguali durante ciascuna ondata e non sono aumentati con l’aumentare della gravità delle tre ondate.
Ora torniamo alla nostra domanda: è davvero possibile prevenire il Covid grazie a Google? Beh, i picchi nelle ricerche si sono verificati 1-2 settimane prima che si raggiungesse il picco di diagnosi dell’infezione. Questo potrebbe confermare la nostra ipotesi iniziale, cioè che le persone che accusano la malattia cercano prima su Google i loro sintomi, per poi andare solo successivamente dal medico e diventare parte delle statistiche ufficiali.
Naturalmente parte del maggiore interesse online in determinati periodi potrebbe essere causato da un’aumentata copertura mediatica, per cui le persone avrebbero potuto cercare quali fossero i sintomi su Google anche se in quel momento si sentivano bene. Tuttavia questo non spiegherebbe perché l’interesse diminuisca rapidamente prima del raggiungimento del picco di casi Covid. L’ipotesi iniziale rimane quindi molto plausibile e pertanto potrebbe realmente esserci un potere predittivo da sfruttare.
Ognuno tragga le proprie conclusioni
Dedurre un’effettiva correlazione e relative certezze su come prevenire il covid con Google affidandoci solo a questo studio sarebbe da sciocchi, specialmente dal momento che abbiamo a che fare con una situazione dalle numerose relazioni multifattoriali. Nonostante questo, il risultato ottenuto da Bernhard Vennemann è davvero notevole. Il potere predittivo dei dati dei motori di ricerca è stato dimostrato in altri casi in passato e i dati qui presentati suggeriscono che approcci simili potrebbero essere un valido aiuto per individuare in anticipo focolai di Covid-19 o addirittura per prevenire future pandemie. E tu cosa ne pensi?