Riassunto analitico
Da qualche anno a questa parte, il Cloud Computing non è più solamente una soluzione teorica al problema dell'enorme aumento dei dati da processare e dei servizi Internet da gestire, bensì è diventato un modello di elaborazione basato su risorse condivise e utilizzabili dinamicamente. Proprio per questo motivo, e grazie anche alla nascita di piattaforme di cloud computing (come per esempio Amazon Web Services), ad oggi la stragrande maggioranza delle aziende fa uso dei servizi e delle infrastrutture messe a disposizione dalle piattaforme Cloud a discapito delle soluzioni on-premise gestite e controllate privatamente. Lo scopo di questa trattazione è di descrivere il progetto sviluppato in collaborazione con Ammagamma S.r.l, una società che costruisce le architetture e gli applicativi necessari alla gestione e all'estrazione del valore dai dati attraverso soluzioni matematiche. In particolare, tale progetto si pone come obiettivo quello di progettare, orchestrare ed ridistribuire delle pipeline ETL che in origine eseguivano sul servizio AWS Glue su un'istanza di Apache Airflow rilasciata sull'architettura cloud di AWS.
|