Riassunto analitico
Le tecnologie moderne di genomica, epi-genomica e proteomica permettono lo screening di migliaia di molecole in parallelo fornendo così nuove intuizioni sui meccanismi biomolecolari associati a condizioni fisiologiche e patologiche. Tuttavia, l'accumulo massiccio di annotazioni strutturali e funzionali di alta qualità dei genomi impone lo sviluppo di quadri computazionali capaci, non solo di analizzare dati genomici per sé, ma anche ad elevare lo studio dei singoli componenti del sistema (ad esempio, i geni , proteine) a gerarchie più alte, come intere regioni genomiche, gruppi di geni co-espressi, moduli funzionali, e le reti di interazioni. Dal momento che le reti di segnali e le relazioni tra geni e regolatori (ad esempio, fattori di trascrizione, TFs) controllano lo sviluppo degli stati fisio-patologici, la comprensione di come gli oggetti elementari biologici agiscono insieme e interagiscono è fondamentale per il progresso delle conoscenze biologiche. In questo contesto, l'obiettivo è di ricapitolare interazioni regolatorie di sistemi biologici in modelli matematici. Tuttavia, l'inferenza di reti di regolazione genica è un compito impegnativo, a causa di una conoscenza incompleta delle molecole coinvolte, la natura combinatoria del problema e del fatto che, spesso, i dati disponibili sono limitati e imprecisi. Per esempio, le metodologie standard per l'analisi dei profili di espressione genica, che mirano ad identificare i geni rilevanti dall'analisi statistica dei segnali di microarray, sembrano essere fortemente limitati nello svelare i meccanismi che regolano la cascata trascrizionale. Sebbene dimostrando la loro efficacia, ad esempio, per identificare le firme molecolari di espressione per la diagnosi del cancro, molti strumenti computazionali non sono riusciti a chiarire come avviene il processo di regolazione della trascrizione.
Il lavoro di ricerca presentato in questa tesi si concentra sull'applicazione di metodi di calcolo per la ricostruzione delle reti di regolazione genica e dei moduli di trascrizione negli organismi complessi. Lo studio mira ad individuare interazioni regolative che esistono tra geni coinvolti nel meccanismo di infiammazione fisiologica. Specificamente, i profili di espressione genica di monociti umani, da donatori sani normali esposti a una combinazione di fattori che riproducono normali condizioni infiammatorie, sono stati monitorati durante una serie temporale di 48 ore. Gli esperimenti che riguardano la serie temporale sono stati integrati con dati pubblici di esperimenti già condotti su monociti, macrofagi e cellule dendritiche e dati di espressione genica analizzati utilizzando algoritmi per la ricostruzione di reti di regolazione. Questo approccio bioinformatico ha consentito la caratterizzazione di diversi membri della famiglia dell’ interleuchina-1 come regolatori principali di specifici moduli di regolazione legati al processo di infiammazione.
|
Abstract
Modern genomic, epi-genomic and proteomic data-rich technologies allow screening thousands of molecules in parallel thus providing novel insights into the biomolecular mechanisms associated with physiological and pathological conditions. However, the massive accumulation of high-quality structural and functional annotations of the genomes imposes the development of computational frameworks able, not only to analyze genomic data per se, but also to elevate the study of the single components of the system (e.g., genes, proteins) to higher hierarchies, as entire genomic regions, groups of co-expressed genes, functional modules, and networks of interactions. Since the networks of signals and relations among genes and regulators (e.g., transcription factors, TFs) control the development of physio-pathological states, understanding how elementary biological objects act together and interact is fundamental to the advancement of biological knowledge. In this context, the aim is to recapitulate regulatory interactions of biological systems into mathematical models. However, the inference of gene regulatory networks is a challenging task because of incomplete knowledge of the involved molecules, the combinatorial nature of the problem and the fact that, often, available data are limited and inaccurate. For instance, standard methodologies for the analysis of gene expression profiles, which aim at identifying relevant genes from the statistical analysis of the microarray signals, seem to be severely limited in unveiling the mechanisms governing the transcriptional cascade. Although proving their effectiveness, e.g., in identifying expression signatures for cancer diagnosis, most computational tools have fallen short of representing a systematic method for understanding how the transcriptional regulation process takes place.
The research work presented in this thesis focuses on the application of computational methods for the reconstruction of gene regulatory networks and transcriptional modules in complex organisms. The study aims at identifying regulative interactions that exist between genes involved in the mechanism of physiological inflammation. Specifically, gene expression profiles of human blood monocytes, from normal healthy donors and exposed to a combination of factors reproducing normal inflammatory conditions, have been monitored during a time course of 48 hours. The time-course experiments have been complemented with publicly available data from steady-state experiments already performed on monocytes, macrophages, and dendritic cells and gene expression data analyzed using algorithms for the reconstruction of regulatory networks. This bioinformatics approach allowed the characterization of several member of the interleukin-1 family as master regulators of specific regulatory modules linked to the inflammation process.
|