Brand
Genetica e Genomica

Il database open e accessibile che racconta il melting pot dei genomi italiani

Foto: Tim Mossholder / Unsplash

Al centro del Mediterraneo, “ponte” tra Europa e Africa, nonché culla dell’impero Romano, l’Italia ospita una popolazione caratterizzata da una grande variabilità genetica, maggiore di quella di altri paesi europei, che non sempre è adeguatamente rappresentata dai database internazionali attualmente in uso. Il nostro studio mette in luce come differenze di frequenza delle varianti geniche potrebbero essere messe in relazione con la suscettibilità a  determinate patologie. Da qui la necessità di creare dei repository dedicati anche rileggendo e interpretando i dati disponibili in modo nuovo.

Mai come negli ultimi tempi parole come DNA e RNA sembrano essere entrate nel lessico quotidiano. Tuttavia, sequenziare il genoma di un individuo, cioè in qualche misura “leggerlo”, sebbene i costi nel tempo si siano ridotti, non è un’impresa semplicissima. Figuriamoci sequenziarne più di 1500! I dati prodotti devono essere poi studiati in maniera approfondita e utilizzando approcci diversi.
È esattamente ciò che si è proposto di fare il nostro gruppo di ricerca, pubblicando un articolo sulla rivista “Human Mutation”, in cui rianalizziamo un dataset genetico di quasi 1700 italiani.

Lo studio
La ricerca è stata guidata da una ricercatrice e un ricercatore under30: Serena Aneli, biologa molecolare, e Giovanni Birolo bioinformatico, sotto la supervisione del prof. Giuseppe Matullo. Il team di lavoro è giovane, dinamico e soprattutto multidisciplinare, afferente al Dipartimento di Scienze Mediche dell’Università degli Studi di Torino, uno dei 180 dipartimenti di eccellenza individuati dal MIUR per il quinquennio 2018-22.
Gli acidi nucleici, i “mattoncini” costituenti le molecole di DNA ed RNA, sono il loro pane quotidiano e le sofisticate macchine di cui dispongono possono analizzare molti campioni simultaneamente. Per effettuare questo studio, tuttavia, hanno usato dei campioni raccolti e sequenziati precedentemente in uno studio clinico internazionale andando a selezionare quelli relativi a individui sani, residenti da almeno due generazioni sul nostro territorio. La novità sta nella prospettiva da cui abbiamo studiato i campioni: quella del genetista di popolazione e quella del clinico. Ovvero si è riletto il dataset sia in termini di frequenze delle varianti sia in termini di possibili patogenicità di quest’ultime.

L'eterogeneità della nostra penisola
Da almeno una ventina di anni gli studiosi sanno che la popolazione italiana è molto eterogenea dal punto di vista genetico, più di molte altre popolazioni europee, e ciò è dovuto sia alla posizione geografica della nostra penisola, sia a motivi storici. Recenti sviluppi tecnologici, come la possibilità di sequenziare il DNA di popolazioni attualmente viventi e di individui antichi hanno permesso di fornire un ritratto complesso del popolamento umano nel continente europeo e nel bacino del Mediterraneo. Per esempio, uno studio precedente pubblicato su “Science” - a cui hanno contribuito anche i nostri Aneli e Matullo - ha esaminato i dati del DNA antico di un centinaio di individui provenienti da diversi siti archeologici italiani e lo ha paragonato a popolazioni attuali. I risultati hanno mostrato come già nell’età romana la popolazione dell'urbe era cosmopolita in quanto molti abitanti provenivano da regioni diverse dell’Impero.

Tra il colore dei capelli e il rischio di malattie
Nel corso del nostro studio più recente, abbiamo studiato le sequenze del DNA codificanti, l’esoma, cioè la porzione del DNA che contiene tutte le informazioni essenziali per codificare le proteine: esso rappresenta solo il 2% del genoma totale ma è molto importante in quanto le mutazioni che si accumulano in questa parte del DNA possono avere delle conseguenze funzionali e cliniche sugli individui.
Cosa caratterizza dunque il genoma degli italiani? Il lavoro di Birolo e Aneli ha permesso di evidenziare che esistono pochissime varianti che mostrano delle differenze significative tra il Nord e il Sud del paese, mentre altre differenziano l’Italia dall’Europa e riguardano geni coinvolti nella risposta ai patogeni o ai farmaci e mutazioni che potrebbero costituire fattori di rischio per diverse patologie. Molte delle differenze nelle frequenze delle varianti tra Settentrione e Meridione si ritrovano per esempio a carico di geni coinvolti nella pigmentazione e nel colore dei capelli. Altre differenze invece riguardano LTC, uno dei geni implicati nell’intolleranza al lattosio; questi geni presentano un graduale cambiamento di frequenze sia all’interno dell’Italia che all’interno dell'Europa, un dato riportato da moltissimi studi e confermato dal nostro. Per quanto riguarda le patologie vi sono alcune varianti che sono più presenti Italia che in Europa, come quella dentro il gene HBB, collegata alla talassemia; viceversa, un polimorfismo dentro il gene FLG, che pare correlato con la dermatite atopica, è sette volte più frequente negli europei che negli italiani. Quello che è possibile asserire con certezza è che non esiste un gene, o un set di geni, che etichetti gli italiani ma è piuttosto la variazione di decine di migliaia di varianti comuni e rare a renderci particolari.

L’importanza di condividere... con un occhio alla privacy
“Ma uno degli aspetti più importanti dello studio - sottolinea il responsabile del gruppo Giuseppe Matullo - è che spesso i database genetici pubblici, quali ad esempio gnomAD, seppure di grandi dimensioni e nati da estese collaborazioni internazionali, non sempre sono in grado di descrivere adeguatamente una popolazione dalla storia così complessa come quella italiana. È quindi di fondamentale importanza creare dei database dedicati per una valutazione più accurata della frequenza delle varianti geniche e della loro relazione con determinate patologie”.
Per questo motivo, i dati raccolti dal nostro studio sono disponibili pubblicamente in un sito creato anche a tale scopo: il NIG database, a cui ha estesamente contribuito anche il Dipartimento di Scienze Mediche con questa e altre casistiche. È importante sottolineare che i dati caricati su questo sito seguono una regola fondamentale per garantire la privacy dei donatori: anziché presentare le intere sequenze genomiche che farebbero facilmente risalire all’identità degli individui che hanno partecipato agli studi, e di riflesso alle loro famiglie, sono pubblicate le sole frequenze delle diverse varianti individuate aggregate per macroaree.
Questo insieme di dati rappresenta uno strumento duttile sia per i medici sia per i ricercatori che desiderano riferirsi alla popolazione italiana. Ancora una volta per la ricerca è di fondamentale importanza l’accesso ai dati e la loro condivisione per poterli analizzare in maniera più completa e sotto prospettive diverse.

Gruppo di lavoro:
Giovanni Birolo, Serena Aneli, Cornelia Di Gaetano, Giovanni Cugliari, Alessia Russo, Alessandra Allione, Elisabetta Casalone, Elisa Giorgio, Giuseppe Matullo,Alessandra Renieri (Università degli Studi di Siena)


IMMAGINI

ESPLORA I TEMI


un racconto di
Cornelia Di Gaetano
DIPARTIMENTO / STRUTTURA

Pubblicato il

25 gennaio 2021

condividi

potrebbero interessarti anche