martedì, 31 Gennaio 2023

I geni più famosi del genoma umano

Da non perdere

Un excursus tra i geni più studiati in biologia. E alcune sorprendenti rivelazioni 



Peter Kerpedjiev aveva bisogno di un corso accelerato di genetica. Dottorando e software engineer con qualche conoscenza di bioinformatica, aveva pensato che gli sarebbe stato davvero d’aiuto apprendere alcuni fondamenti di biologia. “Se voglio avere una conversazione intelligente con qualcuno, quali geni ho bisogno di conoscere?” Si chiese mentre decideva di andare dritto al cuore della questione: i dati.

Per anni, la US National Library of Medicine (NLM) ha catalogato quasi tutti i paper presenti nel suo database sulle informazioni sul comportamento dei geni. Kerpedjiev ha estratto tutti i documenti che descrivono struttura, funzione o posizione di un gene o della proteina che codifica. Ordinando i documenti, ha compilato una lista dei geni più studiati di tutti i tempi, una sorta de “I migliori successi del genoma umano”.

A capo della lista, ha scoperto, c’è un gene chiamato TP53. Tre anni fa, quando Kerpedjiev iniziò la sua analisi, i ricercatori avevano esaminato il gene o la proteina che produce, la p53, in circa 6.600 paper. Oggi quel numero è di oltre 8.500. In media, ogni giorno vengono pubblicati circa due articoli che descrivono nuovi dettagli della biologia di base del TP53. La sua popolarità non è nuova ai biologi poché questo gene è un soppressore tumorale, ampiamente conosciuto come il guardiano del genoma. È mutato in circa la metà di tutti i tumori umani.

Alcuni geni invece sono meno conosciuti – inclusi alcuni diventati importanti nelle epoche passate, ma non più di moda man mano che la tecnologia progrediva. “La lista era sorprendente”, dice Kerpedjiev, ora postdoc e studente di  genomic data visualization alla Harvard Medical School di Boston. “Alcuni geni erano prevedibili, altri erano incredibili”.

Per saperne di più, Nature ha lavorato con Kerpedjiev per analizzare i geni più studiati di tutti i tempi facendo luce su importanti tendenze nella ricerca biomedica. Dei circa 20.000 geni codificanti le proteine ​​nel genoma umano, solo 100 rappresentano oltre un quarto dei documenti etichettati dalla NLM.

 

DENTRO E FUORI MODA

 

Nel 2002, subito dopo la pubblicazione delle prime bozze del genoma umano, la NLM ha iniziato ad aggiungere ai paper, anche a quelli degli anni’60, l’etichetta GeneRIF(gene di riferimento in funzione). Questo però non è un meccanismo perfettamente oleato. “In generale, il set di dati è alquanto confuso”, afferma Terence Murphy, uno scienziato dello staff della NLM di Bethesda. C’è probabilmente qualche bias di campionamento per gli articoli pubblicati prima del 2002. Significa che alcuni geni sono sovrarappresentati e altri potrebbero essere erroneamente mancanti. “Ma non è una cosa terribile, appena aggreghiamo più geni, riduciamo potenzialmente alcuni di questi bias”.

Tenendo presente questo problema, è facile notare che in alcuni periodi storici i documenti relativi ai geni tendevano a focalizzarsi su particolari argomenti caldi. Ad esempio, più del 10% di tutti gli studi sulla genetica umana prima del 1985 riguardavano in qualche modo l’emoglobina.

All’epoca, i ricercatori stavano ancora lavorando sugli studi di Linus Pauling e Vernon Ingram, i pionieri biochimici che hanno spianato la strada allo studio delle anomalie dell’emoglobina che causano le malattie a cellule falciformi. Il biologo molecolare Max Perutz, che vinse il Premio Nobel per la chimica nel 1962 per la sua mappa tridimensionale della struttura dell’emoglobina, continuò ad studiare come alcune forme proteiche si relazionassero alla sua funzione per decenni.

Secondo Alan Schechter, medico-scienziato e consulente storico senior presso l’US National Institutes of Health a Bethesda, i geni dell’emoglobina – più di tutti gli altri all’epoca – offrivano un modo per comprendere e forse trattare una malattia molecolare”.

Schechter, la cui ricerca era incentrata sulle cellule falciformi, afferma che tali geni erano al centro della conversazione sia negli incontri di genetica più importanti, sia negli incontri sulle malattie del sangue negli anni ’70 e nei primi anni ’80. Ma quando i ricercatori hanno avuto accesso a nuove tecnologie per il sequenziamento e la manipolazione del DNA, hanno iniziato a passare ad altri geni e malattie, tra cui un’infezione allora misteriosa che colpiva prevalentemente uomini gay.

Ancor prima della scoperta del 1983 che l’HIV era la causa dell’AIDS, gli immunologi clinici come David Klatzmann avevano notato uno schema particolare tra le persone affette dalla malattia. “Sono rimasto semplicemente colpito dal fatto che queste persone non avevano cellule T4“, ricorda Klatzmann, che ora lavora alla UPMC – University Pierre and Marie Curie. Lo studioso ha mostrato, in alcuni esperimenti in coltura cellulare, che l’HIV sembrava selettivamente infettare e distruggere queste cellule, che sono un sottogruppo delle cellule T del sistema immunitario. Ma come faceva il virus ad entrare nella cellula?

Klatzmann pensò che la proteina di superficie (in seguito chiamata CD4), che gli immunologi usavano per definire questo insieme di cellule, poteva anche essere il recettore attraverso il quale l’HIV entrava nella cellula. Aveva ragione, come ha riportato in uno studio pubblicato nel dicembre 1984.

Nel giro di tre anni, CD4 è stato il gene più famoso della letteratura biomedica. È rimasto tale dal 1987 al 1996, un periodo in cui rappresentava l’1-2% di tutte le catalogazioni prese in analisi dalla NLM.

Una tale attenzione derivava in parte anche dagli sforzi per affrontare la crisi emergente dell’AIDS. Alla fine degli anni ’80, ad esempio, diverse aziende si sono dilettate con l’idea di ingegnerizzare le forme terapeutiche della proteina CD4 che si pensava potesse assorbire le particelle dell’HIV prima di infettare le cellule sane. Ma i risultati di piccoli studi sull’uomo si sono dimostrati deludenti.

Un decennio più tardi, Littman ha mostrato che per entrare nelle cellule, l’HIV utilizza un altro recettore CD4: una proteina identificata come CCR5. Questi, e un secondo co-recettore chiamato CXCR4, sono il ​​fulcro della ricerca intensiva sull’HIV globale da allora, con l’obiettivo – finora non realizzato – di bloccare l’ingresso del virus nelle cellule.

 

QUINDICI MINUTI DI NOTORIETÀ

 

All’inizio degli anni ’90, la TP53 era già in ascesa. Ma prima che salisse in cima alla scala del gene umano, ci furono alcuni anni in cui era sotto i riflettori un gene meno noto, chiamato GRB2.

All’epoca, i ricercatori stavano iniziando ad identificare le specifiche interazioni proteiche coinvolte nella comunicazione cellulare. Grazie al lavoro pioneristico del biologo cellulare Tony Pawson, gli scienziati sapevano che alcune piccole proteine ​​intracellulari contenevano un modulo chiamato SH2, che poteva legarsi alle proteine ​​attivate sulla superficie delle cellule e trasmettere un segnale al nucleo.

Nel 1992, Joseph Schlessinger, un biochimico della Yale University School of Medicine di New Haven, mostrò che il punto di contatto era la proteina codificata da GRB2.

Altri ricercatori hanno presto colmato le lacune, aprendo un campo di studio nella trasduzione del segnale. E benché molti altri elementi costitutivi della segnalazione cellulare siano stati presto portati alla luce – in definitiva portando a trattamenti per cancro, malattie autoimmuni, diabete e malattie cardiache – GRB2 è rimasto all’avanguardia ed è stato il gene di riferimento per tre anni alla fine degli anni ’90.

In parte, questo era dovuto al fatto che GRB2 “era la prima connessione fisica tra due parti nella cascata di trasduzione del segnale”, afferma Peter van der Geer, un biochimico della San Diego State University. Inoltre, “è coinvolto in tanti aspetti diversi della regolazione cellulare”.

GRB2 è piuttosto un’anomalia della lista dei geni più studiati. Non è una causa diretta della malattia; né è un bersaglio farmacologico, il che forse spiega perché la sua popolarità è stata fugace. “Alcune stelle nascenti che cadono molto velocemente perché non hanno alcun valore clinico”, dice Thierry Soussi, ricercatore di lunga data della TP53 presso il Karolinska Institute di Stoccolma e la Pierre e Marie Curie University. I geni resistenti di solito mostrano una sorta di potenziale terapeutico che attira il supporto delle agenzie di finanziamento. “È sempre così”, dice Soussi. “L’importanza di un gene è legata al suo valore clinico”.

Ma la sua importanza può anche essere collegata a precise proprietà del gene, come i livelli ai quali si esprime, quanto varia tra la popolazioni e le caratteristiche della sua struttura. Secondo un’analisi di Thomas Stoeger, un biologo sistematico della Northwestern University di Evanston, sarebbe possibile prevedere quali geni saranno al centro degli studi, semplicemente inserendo le loro caratteristiche in un algoritmo.

Stoeger pensa che le ragioni di queste associazioni si riducano in gran parte a ciò che lui chiama scoperta. I geni più popolari si trovavano infatti in alcune aree calde della biologia e possono essere studiati con gli strumenti disponibili in ogni determinata epoca. “È più facile studiare alcune cose che altre”, afferma Stoeger, e questo è un problema, perché un gran numero di geni rimane poco definito e poco esplorato, lasciando alcune grosse lacune nella comprensione della salute e delle malattie umane.

 

NEL POSTO GIUSTO AL MOMENTO GIUSTO


Stoeger ha anche monitorato come le caratteristiche generali dei geni popolari siano cambiate nel corso del tempo. Ad esempio, ha scoperto che negli anni ’80 i ricercatori si sono concentrati principalmente su geni i cui prodotti proteici erano stati trovati al di fuori delle cellule. Questo probabilmente perché queste proteine ​​erano più facili da isolare e studiare. Solo più recentemente l’attenzione si è spostata sui geni i cui prodotti si trovano all’interno della cellula.

Questo cambiamento è avvenuto nel periodo in cui veniva pubblicato il Progetto genoma umano, afferma Stoeger. Se l’attenzione si fosse concentrata prima sull’interno della cellula anche il progetto genoma ne avrebbe tratto beneficio.

Molti dei geni più esplorati, tuttavia, non si adattano a questi trend più ampi. La proteina p53, ad esempio, è attiva all’interno del nucleo. Eppure TP53 è diventato il gene più studiato intorno al 2000. E, come molti dei geni che hanno dominato la ricerca biologica, dopo una prima scoperta non è stato compreso precisamente.

All’inizio, la comunità che si occupava della ricerca sul cancro l’ha scambiato per un gene che, una volta mutato, causa lo sviluppo del tumore. Fu solo nel 1989 che Suzanne Baker mostrò come in realtà fosse fatto un soppressore tumorale. Solo allora gli studi di genomica funzionale hanno iniziato davvero a prendere valore e far posizionare il secondo classificato come il gene umano più referenziato di tutti i tempi, con più di 5.300 citazioni nei dati NLM.

Il gene si rivelò un mediatore dell’infiammazione e il suo effetto sui tumori era secondario. Una volta che divenne chiaro, l’attenzione si spostò rapidamente verso la sperimentazione degli anticorpi che bloccano la sua azione. Ora, le terapie anti-TNF sono le colonne portanti del trattamento per i disturbi infiammatori come l’artrite reumatoide, che complessivamente raccolgono decine di miliardi di dollari ogni anno in tutto il mondo.

“Questo è un esempio di come la conoscenza del gene e il prodotto genico hanno cambiato in modo relativamente rapido la salute del mondo”, afferma Kevin Tracey, neurochirurgo e immunologo presso l’Istituto Feinstein per la ricerca medica a Manhasset.

Il dominio di TP53 è stato brevemente interrotto da un altro gene, l’APOE. Descritto per la prima volta a metà degli anni ’70 come un trasportatore coinvolto nella rimozione del colesterolo dal sangue, la proteina APOE è stata “seriamente considerata” come un trattamento ipolipemizzante per la prevenzione delle malattie cardiache.

Alla fine degli anni ’80, l’arrivo delle statine mandò in rovina questi studi. Ma poi, il neuroscienziato Allen Roses e i suoi colleghi hanno trovato il collegamento tra la proteina APOE e le placche del cervello di persone malate di Alzheimer. Nel 1993 hanno mostrato 10 casi in cui una particolare forma del gene, APOE4, era associata ad un aumentato rischio della malattia.

Questo ha generato un interesse molto più ampio nel gene. Tuttavia, ci è voluto del tempo per risalire la classifica dei geni. Affermare che l’accumulo di un frammento proteico chiamato amiloide-β è responsabile della malattia, era di gran moda nella comunità di ricerca dell’Alzheimer all’epoca. E pochi ricercatori sembravano interessati a scoprire che cosa una proteina di trasporto del colesterolo aveva a che fare con la malattia. Ma il legame genetico tra APOE4 e il rischio di Alzheimer si è dimostrato “inconfutabile”, dice e nel 2001, APOE ha superato velocemente TP53. Resta  ora nella top five di tutti i tempi.

Come altri geni popolari, l’APOE è ben studiato perché è al centro di uno dei più grandi misteri irrisolti sulla salute umana. Ma è anche importante perché le terapie anti-amiloide si concludono in test clinici falliti e costringono l’industria e le agenzie di finanziamento a ripensare le strategie terapeutiche per affrontare l’Alzheimer.

Ma sorge un problema. Per diventare il gene più studiato al mondo c’è bisogno di una confluenza di fattori  diversi, che vanno dalla biologia alla pressione sociale, dalle opportunità commerciali alle necessità mediche. Ma una volta raggiunta la notorietà c’è un alto grado di conservatorismo che li spinge a restare in vetta alla classifica fino a quando le condizioni cambiano.

La domanda ora è: come possiamo cambiare? Quali nuove scoperte potrebbero inserire un nuovo gene nel grafico e far cadere i migliori geni di oggi dal loro piedistallo?

 

 

traduzione di Alessia Boragine

- Advertisement -spot_img

Talk For

F&NEWS