Attività di ricerca A4
Ultima modifica
08/02/2006 15:26
Sviluppo e mantenimento di una banca dati sul ciclo cellulare
(CNRB-UNIMI)
Il ciclo cellulare è un meccanismo molecolare complesso, comune a tutti gli organismi viventi, ma che può essere risolto con varie strategie, alcune ‘universalì, altre specifiche per un dato organismo. L’analisi comparata, interpretata in chiave evolutiva, aiuterà enormemente a chiarire step cruciali del processi biologici e per scoprire le sue leggi fondamentali. Un database specializzato che comprende tutti gli aspetti del ciclo cellulare in differenti organismi non è attualmente disponibile.Il database che verrà sviluppato conterrà informazioni, disponibili in letteratura, derivanti da numerose tecnologie ed approcci sperimentali sui geni/proteine coinvolti nel ciclo cellulare e sulla loro regolazione, sulle modificazioni post-traduzionali, sulle interazioni proteina-proteina e DNA-proteina, sullo splicing, sui knock-out e dati di RNAi, sui dati di stabilità dei prodotti genici, su mutazioni associate a patologie, literature datamining, etc. I dati saranno integrati con l’analisi dei dati di profili di espressione, tra i quali la
periodicità dei trascritti e dei livelli dei prodotti genici durante il ciclo cellulare, la risposta a stimoli (agenti genotossici, temperatura, stress ossidativo etc.) o la risposta a specifici inibitori (della replicazione del DNA, della proliferazione celluare, della mitosi, di classi specifiche di enzimi come le protein chinasi etc.). Saranno anche considerati i dati di ChIP on Chip che possono dare informazioni sui networks che controllano la co -espressione o la co-regolazione di classi di geni durante il ciclo cellulare, la risposta a danni al DNA etc.
Si intende realizzare una banca dati, che considerando gli organismi sino ad ora sequenziati e dando rilevanza agli aspetti comparativi, organizzi le informazioni disponibili relative in particolare al controllo della progressione del ciclo cellulare, ai geni e alle reti di regolazione genica coinvolti nei check points del ciclo cellulare e a come questo è modulato dalle interazioni tra diversi aspetti del metabolismo del DNA.
Data l’ampia disponibilità di dati relativi all ’analisi funzionale del genoma del lievito Saccharomyces cerevisiae, il backbone della banca dati sarà costituito a partire da questo organismo per estenderlo in seguito anche agli altri organismi modello. Si intende includere anche alcuni modelli procarioti, quali E. coli e Deinococcus, e rappresentanti del terzo dominio degli Archea. Questo porterebbe alla creazione
di una banca dati che invece di essere centrata su un singolo organismo, come la maggior parte di quelle già esistenti, sarebbe organizzata attorno ad un insieme preciso di processi metabolici e, riunendo informazioni provenienti da organismi cos ì diversi tra loro, fornirebbe un solido aiuto ad analisi comparative di tipo evolutivo.
La banca dati potrà inoltre essere arricchita di dati originali che derivano dal fatto che i laboratori lavorano sperimentalmente su tali problematiche.
Obiettivo di questa attivit à è anche quella di sviluppare modelli in silico di reti di interazioni molecolari di geni coinvolti nella regolazione del ciclo cellulare. Il network di interazioni può essere schematizzato come una rete i cui nodi rappresentano le proteine (o domini di esse), mentre le linee che definiscono la connettività della rete rappresentano le interazioni proteina: proteina. Ogni interazione è caratterizzabile in chiave stutturale (formazione di complessi multiproteina), funzionale (inibizione, attivazione), e bibliografica
(descrizione degli esperimenti e dettagli contenuti).
Per risolvere la complessità e la molteplicità dei meccanismi coinvolti è stato recentemente proposto il “System Biology Mark-up Language” (SBML), un linguaggio di interscambio per i modelli biologici basato su XML. SBML èapplicabile a reti metaboliche, reti di regolazione genica ed altre aree della biologia funzionale. Altri tools di cui si prevede l ’utilizzo sono Biospice ed Ingenue. Il modello del network utilizzerà cross-link a database remoti (bibliografici, di pathway regolativi e metabolici, di sequenze e strutture proteiche). Il
front-end consentirà inoltre all’utilizzatore di accedere direttamente alle informazioni relative ad una specifica interazione (quali descrizione del tipo di interazione, informazioni strutturali sul complesso proteina:proteina, riferimenti bibliografici associati), o associate ad una determinata proteina (quali identificazione dei vari domini, funzione, localizzazione del sito attivo, distribuzione in altre specie,
caratterizzazione strutturale, presenza di omologhi strutturali a funzione nota). Lo strumento informatico potrà inoltre essere interfacciato direttamente a dati di large scale gene expression ottenuti con la tecnica dei microarrays, al fine rendere meno complessa l’interpretazione dei risultati. A tale scopo l’utilizzatore potrà simulare l’effetto dello spegnimento di geni o alterazioni delle interazioni
proteina:proteina sull ’equilibrio globale della rete, con la possibilità di confrontare i pattern predetti dal modello con quelli osservati sperimentalmente in microarrays.
Una caratteristica essenziale della risorsa software così sviluppata è la sua portabilità verso altri contesti o sistemi biologici in cui la regolazione genica è coinvolta.
Il lavoro sarà svolto in collaborazione con il dr. Kohn dell ’NIH.
Per strutturare, integrare e gestire la grande mole di dati biologici eterogenei provenienti da diverse fonti e rendere disponibili le informazioni, è richiesto il contributo di tutte le UR sia per quanto riguarda la definizione dei contenuti, lo sviluppo del disegno logico della banca dati, la piattaforma tecnologica, le metodologie computazionali per l’analisi e la simulazione dei dati, che i processi di data/information mining e lo sviluppo dell’interfaccia web. Il database del ciclo cellulare rappresenta l’esempio di come una complessa problematica biologica viene coperta dall ’intera supply - chain scientifica bioinformatica: dalla ricerca di base ai potenziali utenti finali.
L’implementazione di una banca dati cos ì concepita può avere un grosso impatto sulla salute umana, infatti numerose patologie, tra cui il cancro, sono associate a disordini del ciclo cellulare e l ’uso di informazioni derivanti dallo studio del ciclo cellulare è uno delle aree più attive di ricerca per terapie innovative e applicazioni farmacologiche.

