Riassunto analitico
Questa tesi magistrale ha l'obiettivo di presentare l'integrazione tra il software IBM Process Mining e diversi cloud object storage providers. Il Process Mining è un software nato agli inizi degli anni 2000, con l'obiettivo di estrarre business intelligence dai processi aziendali. Inizialmente il Process Mining era un software statico, in grado di analizzare i dati forniti attraverso le fasi di process discovery, conformance checking and process enhancement, offrendo agli utenti l'accesso a informazioni su come effettivamente i processi della loro azienda funzionavano. È in grado di individuare colli di bottiglia ed eseguire simulazioni direttamente sui dati dei clienti, consentendo di scoprire inefficienze e offrire soluzioni. Ultimamente il process mining è passato da un modello statico a uno dinamico. I vantaggi sono infiniti, la process analysis può essere sempre aggiornata e non è richiesta quasi nessuna interazione da parte dell'utente, soprattutto per quanto riguarda la fase di acquisizione dei dati. Ciò porta il process mining in una nuova era, dove è in grado di agire come un near-real time digital twin of the organization. Con la situazione attuale, tuttavia, è richiesto un certo background tecnico per impostare le funzionalità necessarie all'abilitazione del reactive process mining. Qui entra in gioco l’object storage, una tecnologia che si è rapidamente guadagnata lo status di standard-de-facto nel settore dell'archiviazione di grandi quantità di dati strutturati e non. Con il lavoro descritto in questa tesi magistrale, viene mostrato come il divario tra il reactive process mining e il background tecnico necessario per configurarlo è stato chiuso, consentendo ai clienti di creare una connessione ad un cloud objct storage provider (IBM, AWS e Azure) e utilizzare questa connessione in due modi. Il primo è caricare un singolo data source sulla piattaforma IBM Process Mining, invece di prenderlo dal file system locale. La seconda, che abilita e facilita il reactive process mining, avvicinandolo ad utenti di qualsiasi background, è quello ricorrente. Con questa funzionalità, gli utenti possono specificare un job ricorrente che si connetterà al bucket dell'object storage, cercherà nuovi file che non sono ancora stati importati, li aggiungerà ai data source del process mining e attiverà la ricomputazione della nuova process analysis. Ciò non solo consente agli utenti di non dover quasi mai caricare i dati manualmente, ma trasforma anche il reactive process mining, rendendolo facile da usare. Il vantaggio è che IBM Process Mining può facilmente diventare un digital twin of the organization, essendo sempre aggiornato con la controparte “fisica”. Consente al Process Mining di individuare i colli di bottiglia e le inefficienze non appena si presentano, e grazie ad altre funzionalità integrate nella piattaforma è possibile monitorare costantemente i KPI del cliente, assicurandosi che i processi siano sempre sotto controllo.
|
Abstract
This master thesis has the goal to present an integration between the Process Mining software by IBM, and different cloud object storage providers.
Process Mining is a software born in the early 2000's, with the goal of extracting business intelligence from a company's process operations. At first, Process Mining was a static software, able to analyze the data provided through the steps of process discovery, conformance checking and process enhancement, giving users access to many insights of how their company's processes actually worked.
It is able to find bottlenecks and run simulations directly on customers data, allowing to discover inefficiencies and fix them.
Lately, process mining has been switching from static to dynamic. The benefits are endless, the process analysis can be always up-to-date and almost no user interaction is required especially regarding the data ingestion.
This bring process mining into a new era, where it is able to act as a near-real time digital twin of the organization.
With the current situation, however, some technical background was required to setup the features needed to enable reactive process mining.
Here it comes into play object storage, a technology that has quickly earned the standard-de-facto status in the industry for storing large amounts of structured and unstructured data.
With the work described in this master thesis, it is shown how the gap between reactive process mining and technical experience required to set it up has been closed, allowing customers to setup a connection to cloud object storage providers (IBM, AWS and Azure), and use this connection in two ways.
The first is to upload a single data source to the IBM Process Mining platform, instead of taking it from the local filesystem.
The second one, which enables and facilitates reactive process mining, bringing it closer to users with any background, is the recurring one.
With this feature, users are able to specify a recurring job that will connect to the object storage bucket, search for new files that have not been imported yet, add them to the process mining data sources and trigger new process
analysis re-computation.
This not only allows users to almost never have to upload data manually, but it also transforms reactive process mining, making it user friendly.
The benefit is that IBM Process Mining can easily become a digital twin of the organization, being always up-to-date with the "physical" counterpart. It allows process mining to spot bottlenecks and inefficiencies as they arise, and thanks to other features integrated in the platform it is possible to constantly monitor the customer's KPIs, making sure the processes are always under control.
|