RicercaResarch    
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
   HomeCABGenRicerca



CABGen: Attività di ricerca

 


La comprensione dei meccanismi biologici implicati nell’insorgenza delle patologie umane ad ereditarietà multifattoriale richiede oggi l’utilizzo di approcci bioinformatici e biostatistici in grado di interpretare ed integrare l’enorme quantità di informazioni ottenute mediante approcci di tipo “genome-wide”. I recenti sviluppi tecnologici, che hanno reso possibile la comprensione della gran parte della diversità umana a livello genotipico e trascrizionale, hanno aperto la strada ad una nuova era della genetica umana mirata all’identificazione dei determinanti genetici, alla comprensione delle loro interazioni e dei meccanismi molecolari coinvolti nell’insorgenza delle malattie multifattoriali. 

In questo ambito, lo scopo delle ricerche in corso è quello di applicare le nuove metodologie di genetica statistica ed analisi genomica

  • allo studio delle patologie cerebrovascolari, in particolare alla caratterizzazione dei determinanti genetici implicati nell’insorgenza di forme diverse di ictus.
  • all’identificazione delle alterazioni in meccanismi molecolari, quali l’espressione genica o lo splicing alternativo, che costituiscono fattori di suscettibilità per le malattie genetiche complesse.

 

Sviluppo di strumenti bioinformatici per la gestione e l’analisi di dati “genome-wide”

La comprensione dei meccanismi biologici alla base di ogni processo cellulare richiede oggi l’utilizzo di approcci bioinformatici e biostatistici in grado di gestire, interpretare ed integrare l’enorme quantità di informazioni ottenute mediante approcci sperimentali di tipo “genome-wide”. I recenti sviluppi tecnologici nel campo dello studio dell’espressione genica, della genotipizzazione a livello dell’intero genoma e del sequenziamento di nuova generazione, hanno reso necessario l’acquisizione di nuove infrastrutture bioinformatiche e lo sviluppo di nuovi approcci di studio per la comprensione dei fenomeni biologici a livello globale. 

 

CorrelaGenes

Al fine di contribuire alla comprensione dei meccanismi molecolari coinvolti nei processi biologici delle cellule umane abbiamo sviluppato un nuovo strumento bioinformatico che abbiamo chiamato CorrelaGenes. Tale strumento, utilizzando i dati di espressione derivati da esperimenti di Microarray pubblicamente disponibili nella banca dati Gene Expression Omnibus (GEO), permette l'identificazione di gruppi di geni che mostrano profili di espressione simili in differenti condizioni sperimentali.

CorrelaGenes utilizza un algoritmo per la ricerca di regole di associazione (Association Rule Mining: ARM) per identificare geni che risultano frequentemente co-espressi nei dataset estratti da GEO. Al fine di migliorare la significatività biologica dei risultati l'algoritmo è stato modificato per identificare solo regole di associazione che coinvolgono solo due geni uno dei quali, chiamato Target, è definito dall'utente come parametro iniziale della ricerca. Questa modifica aggiunge alla tecnica standard di ARM un approccio guidato al fine di identificare una lista di geni frequentemente co-espressi con il gene Target suggerendo la loro azione coordinata negli stessi processi biologici.

I risultati preliminari ottenuti da CorrelaGene in una simulazione con 15 geni Target (ACTG1, AFF3, APOE, APP, CDC5L, DIAPH2, EMD, FOXO1, HIF1A, IL8, MAPT, PRFP19, PSEN1, PSEN2, PTPN22) ha mostrato un buon accordo con i dati disponibili in letteratura contribuendo alla caratterizzazione dei profili trascrizioniali di tali geni integrando i risultati che è possibile ottenere da altri strumenti pubblicamente disponibili.

 

Identificazione dei fattori di rischio genetici e dei meccanismi molecolari nell’insorgenza di patologie cerebrovascolari

La maggior parte delle malattie umane ha, tra gli elementi determinanti la patogenesi, una componente genetica. Nelle patologie di tipo mendeliano l’eredità dell’allele mutato, con meccanismo di ereditarietà autosomica recessiva, dominante o X-linked, è sufficiente a determinare il fenotipo patologico. Tuttavia, la maggior parte delle malattie non segue questo schema di ereditarietà ma è causata dall’interazione di molteplici fattori genetici e ambientali che vanno a determinare disordini complessi e multigenici.

Nello studio di queste malattie un importante contributo viene dall’analisi dell’associazione genetica che consente di determinare la correlazione statistica tra un determinato allele di un marcatore genetico e un tratto, sia quantitativo che discreto, del fenotipo patologico (Cordell e Clayton, 2005). L’analisi di associazione, rispetto agli studi di linkage, ha un maggiore potere di individuare alleli con piccoli effetti ma necessita di un numero elevato di marcatori. Esistono differenti tipi di studi di associazione ma quelli più diffusi sono gli studi caso-controllo in cui vengono analizzati un elevato numero di individui affetti dalla patologia in studio (casi) e un elevato numero di individui presi dalla popolazione generale (controlli). 

A partire dal 2005, grazie ai progressi metodologici nel sequenziamento del genoma umano e alla progressiva caratterizzazione della variabilità genetica umana con l’identificazione di numerosi polimorfismi del singolo nucleotide (single nucleotide polimorphism - SNP), è stato possibile condurre studi di associazione sull’intero genoma (genome-wide association studies – GWAS), identificando numerose varianti genetiche che contribuiscono alla determinazione del fenotipo patologico di molteplici malattie.

Tra le malattie complesse, quelle cerebrovascolari rappresentano per i Paesi occidentali una problematica sanitaria di notevole importanza. Nei Paesi sviluppati l’ictus è la terza causa di morte e la principale causa di disabilità neurologica. Sostanzialmente esistono due tipi di ictus: ischemico, causato dall’occlusione di un vaso sanguigno, ed emorragico, in cui si ha la rottura del vaso stesso.  Circa l’80% degli ictus sono di tipo ischemico. Dati epidemiologici indicano che il rischio di ictus ha una componente genetica, tuttavia questa è difficilmente identificabile dal momento che sono coinvolti molti alleli, ciascuno con un piccolo effetto fenotipico. Inoltre, gli effetti di alcuni alleli sono limitati ad uno o pochi sottotipi di ictus e la dimensione dell’effetto può variare in base al sesso e all’etnia di appartenenza.

Il presente programma di ricerca si propone di analizzare i dati genotipici ottenuti da una casistica di >700 pazienti colpiti da differenti forme di ictus in collaborazione con l’Istituto Neurologico C. Besta di Milano, e di >950 individui sani di controllo. Ciascun individuo è stato tipizzato per più di 600.000 marcatori attraverso i microarray Illumina Human 610-Quad BeadChips e Human660W-Quad BeadChip. Lo studio in corso è mirato a: (1) validazione delle varianti di rischio per l’insorgenza dell’ictus ischemico ad oggi identificate nella popolazione italiana; (2) studio d’associazione sull’intero genoma per l’identificazione di nuovi fattori di rischio; (3) applicazione di nuove metodologie per gli srudi d’associazione basati sull’analisi dei pathways (pathway-based analysis of genome-wide data).

 

Analisi dei profili d’espressione dei geni umani in differenti condizioni sperimentali 

Il gruppo CABGen si è particolarmente dedicato allo studio dei profili d’espressione genica ottenuti mediante analisi su microarray per soddisfare le esigenze di molti gruppi di ricerca interni all’Istituto. In particolare sono state condotte analisi sulle variazioni d’espressione: (1) in un sistema cellulare che ricapitola le fasi della trasformazione tumorale in collaborazione con la Dott.ssa C. Mondello (Ostano et al., 2012); (2) in un sistema cellulare difettivo del prodotto del gene LIG1 in collaborazione con la Dott.ssa A. Montecucco; (3) in un sistema cellulare messo a punto nel laboratorio del Dott. G. Biamonti in cui differenti condizioni di crescita determinano specifici cambiamenti a livello del meccanismi di splicing e di organizzazione della cromatina.

 

Analisi statistiche

L’analisi statistica dei dati è un elemento imprescindibile di molte ricerche scientifiche. Il laboratorio Cabgen ha sviluppato una forte esperienza nel campo dell’analisi statistica e matematica di dati biomedici, molecolari e popolazionistici  che ha portato a diverse collaborazioni con laboratori di varie università e all’interno dell’IGM stesso.

Le analisi statistiche hanno riguardato diverse fasi delle seguenti ricerche:

  • studio dell'influenza del gene COMT (catecolo-O-metiltransferasi) come fattore di rischio genetico per il deterioramento cognitivo in un campione di soggetti sani, pazienti affetti da malattia di Alzheimer (AD) e soggetti con decadimento cognitivo lieve (MCI). Tutti i soggetti sono stati analizzati per il polimorfismo rs4680 COMT e genotipo APOE ed è stata dimostrata un'associazione tra genotipo COMT GG (Val/Val) e APOE epsilon4 e il rischio di AD e MCI. In particolare, quando genotipo GG è incluso nell'analisi multinomiale, il rischio di AD e MCI per l’allele ApoE epsilon4 è aumentata di circa 2-3 volte ed, inoltre, il rischio conferito dalla combinazione di G e alleli epsilon4 è più pronunciata in pazienti di sesso maschile. (Lanni et al., 2012)
  • studio retrospettivo in collaborazione con centri internazionali sull’esito a lungo termine e l'attecchimento delle cellule di donatore in pazienti con sindrome di Wiskott-Aldrich (WAS), trattati con trapianto di cellule ematopoietiche (HCT) nel periodo 1980 – 2009. Lo studio ha indicato un significativo miglioramento dei risultati dopo HCT per pazienti WAS con importanti implicazioni per lo sviluppo di nuovi protocolli che mirino a ottenere il ripristino completo della malattia e ridurre le complicanze post-HCT (Moratto et al., 2011)
  • applicazione di una tecnica statistico-matematica (Self-Organizing Maps, SOM) allo studio della distribuzione geografica della frequenza di 77.451 cognomi diversi (17.579.891 individui) ottenuti dagli elenchi degli abbonati al telefono dell’anno 1993, con lo scopo di identificare automaticamente l'origine geografica degli individui portatori degli specifici cognomi. E’ stato così possibile creare un database con l’origine di 49.117 cognomi diversi che potrà essere di grande aiuto nelle fasi di campionamento di individui italiani arruolati nelle analisi epidemiologiche e molecolari (Boattini et al., 2012)
  • studio evolutivo dell’aplogruppo G del cromosoma Y per l’identificazione di pattern evolutivi delle popolazioni europee e caucasiche (Rootsi et al., 2012)
  • studio pilota per individuare i marcatori molecolari di apoptosi, stress cellulare e danni al DNA in linfociti di pazienti affetti da Sclerosi Multipla (SM). I risultati hanno mostrato un aumento nei marcatori PAR e gammaH2AX nei pazienti con SM rispetto ai soggetti sani ed inoltre è stata riscontrata una correlazione positiva tra il livello di aggressività e gammaH2AX nei pazienti affetti. (Grecchi et al., 2012)
  • studio delle modificazioni post-trascrizionali della proteina codificata dal gene SRSF1 in seguito a stress replicativo (Leva et al., 2012).

 


Copyright © 2014 Home