Riassunto analitico
Nel corso degli ultimi anni, bioinformatica e biologia computazionale hanno svolto un ruolo di rilievo nell'identificazione di meccanismi molecolari alla base di patologie critiche e nel successivo sviluppo di nuove strategie per il loro trattamento. A questo scopo, grandi quantità di dati genomici e farmacologici derivanti da diversi modelli patologici sono stati generati e resi pubblici. Tra questi, le linee cellulari di cancro, nonostante le limitazioni intrinseche presenti nel modello stesso, rimangono tra le più utilizzate per esplorare le basi molecolari inerenti l'attività farmacologica. A partire dal pionieristico pannello di linee cellulari rappresentato dal progetto NCI60, sono stati sviluppati diversi screening atti ad unire dati di profili genetici con dati di risposta farmacologica, cercando di capire come l'assetto genomico delle linee cancerose possa andare a definire la risposta terapica. Questi screening sostanzialmente si basano su due diversi approcci: nel primo, I profili genetici delle linee cellulari vengono ricavati sia prima che dopo il trattamento farmacologico, ottenendo cosi informazioni su come le linee rispondono a livello molecolare all'azione dei diversi composti. Nel secondo approccio, I dati derivanti da cellule non trattate e della loro risposta ai diversi composti vengono analizzati in parallelo, in modo da evidenziare o predire come l'assetto moleculare possa andare a determinare resistenza o sensibilità all'azione di farmaci. Tuttavia, nonostante la loro disponibilità pubblica, la maggior parte di questi dati presenta alta eterogenicità e mancanza di correlazione in termini di linee cellulari considerate, composti analizzati, tipologia e qualità dei dati genomici. Per superare la mancanza di interconnessione di queste risorse, ho dapprima creato e sviluppato Mutations and Drug Portal (MDP) e successivamente ampliato MDP in Genomics and Drugs integrated Analysis (GDA), due strumenti web che uniscono l'ampio database di risposta a più di 50,000 composti prodotto da NCI60 con I dati di sequenziamento e profili di espressione genica derivanti da microarray presenti nella Cancer Cell Line Encyclopedia (CCLE) e in NCI60, al fine di identificare caratteristiche genomiche correlate alla risposta farmacologica nelle linee cellulari di cancro. Successivamente, ho ulteriormente ampliato questo progetto attraverso lo sviluppo di approcci computazionali mirati all'identificazione di specifiche molecole di DNA o RNA per sistemi di veicolazione farmacologica oligonucleotidici. Infatti, nel campo della veicolazione farmacologica, una nuova e promettente strategia è rappresentata dagli aptameri a DNA, piccoli oligonucleotidi capaci di riconoscere il loro ligando specifico con una affinità uguale o superiore a quella degli anticorpi. Con l'utilizzo di esperimenti dedicati, è possibile generare milioni di sequenze di questo tipo che presentano un ampio ventaglio di potenziali bersagli biologici, a partire da proteine di membrana fino a specifiche popolazioni cellulari. Attraverso l'integrazione delle sequenze nucleotidiche e delle informazioni strutturali ho sviluppato APTANI, un metodo bioinformatico di identificazione, caratterizzazione e interpretazione biologica di aptameri bersaglio specifici. In conclusione, il mio progetto di dottorato propone diversi strumenti ed algoritmi per l'analisi bioinformatica di dati genomici per il riposizionamento e la veicolazione di farmaci, ponendo specifica attenzione sul trattamento tumorale.
|
Abstract
In recent years, computational biology and bioinformatics have played an ever-growing role in uncovering molecular mechanisms at the basis of diseases and in unveiling new strategies for the treatment of high-impact pathologies. To this end, large amounts of genomic and pharmacological data obtained from different models of diseases have been generated and made publicly available. Among others, cancer cell lines, despite their inability to reflect many aspects of a drug’s behavior in the human body, are the most widely used models to explore the molecular basis of drug activity and since the pioneering panel of the NCI60 project, several major screenings of unite genetic profiling with drug testing have been created to investigate of how genomic portraits can shape a cancer’s response to therapy. All of the cancer cell-line screenings basically adopt two approaches; in the first cell lines are profiled both before and after treatment to assess how their molecular profiles respond to perturbation by the various agents tested. In the other approach the molecular profiles of untreated cells and their response to various compounds are investigated in parallel to assess or predict how the molecular portraits determine intrinsic cell sensitivity and resistance to drugs or potential drugs. Despite their availability, most of these data are heterogeneous and lack of concordance in terms of investigated cell lines and compounds and in the type and quality of genomic data. To overcome the lack of the interconnection between these resources, I first created and developed Mutations and Drugs Portal (MDP) and then expanded MDP into the Genomics and Drug integrated Analysis (GDA), two web-based publicly accessible tools that bridge NCI60 uniquely large number of drug sensitivity data for more than 50,000 compounds with the Cancer Cell Lines Encyclopedia (CCLE) and NCI60 gene sequencing information and microarray gene expression profiles to identify either drugs or genomics characteristics linked to drug response in cancer cell lines. Furthermore, I coupled this effort with computational approaches aimed at the identification of specific DNA or RNA molecules for oligonucleotide-based drug delivery systems. Nowadays, a novel and promising strategy for drug delivery is represented by DNA aptamers, small oligonucleotides that recognize their ligands with an affinity equal or superior to antibodies. Through dedicated experiments, it is possible to generate millions of these sequences, showing a wide range of affinity towards biological targets, spanning from membrane proteins to cellular populations. By integrating sequence and secondary structure information, I developed and deployed APTANI, a bioinformatics method for the identification, characterization, and downstream biological interpretation of target-specific aptamers. In summary, my PhD work proposed a set of tools and algorithms for the bioinformatics analysis of genomic data for drug repurposing and delivery with a specific focus on cancer treatment.
|