Riassunto analitico
Obiettivo principale di questa tesi è l’analisi e l’approfondimento delle tecnologie utilizzate per la progettazione e realizzazione di una web application, Studio Keyword Tool, volta ad automatizzare, semplificare e migliorare lo studio keyword, una delle attività principali degli specialisti in ambito Search Engine Optimization (SEO) all’interno dell’azienda Webranking. Questa attività consiste nello studio delle keyword queries, digitate da miliardi di utenti sui principali motori di ricerca per interfacciarsi con le risorse del web, che rappresentano, di fatto, le loro intenzioni principali. Verranno introdotti i concetti principali necessari alla comprensione dell’argomento. L’applicazione realizzata utilizza diversi strumenti e tecnologie, fra le quali web scraping, natural language processing, machine learning e altre ancora, per permettere lo scaricamento, l’elaborazione e la visualizzazione dei dati necessari. Grazie a questi strumenti è stato possibile generare le keyword di ricerca, analizzarle semanticamente, stabilire la loro importanza, raggrupparle per similitudine e visualizzarne le loro caratteristiche intrinseche. Lo scraping di siti web è necessario per creare un corpus di testo specifico per argomento di studi o per cliente, che verrà utilizzato per allenare una rete neurale sull’utilizzo del linguaggio naturale e per estrarre contenuti significativi dalle risorse web. I primi strumenti analizzati riguardano il Natural Language Processing, ovvero l’elaborazione del linguaggio naturale attraverso il calcolatore, verranno illustrate le principali tecniche utilizzate di analisi semantica, sintattica e word embedding. Metodi di apprendimento automatico non supervisionato come tecniche di clustering permettono di ottenere dei raggruppamenti significativi, che possono essere visualizzati ed esportati dagli specialisti del settore, permettendo loro di estrarre insight e informazioni utili. Concludendo la spiegazione dell’attività svolta, verranno mostrati gli effettivi risultati ottenuti e i possibili sviluppi futuri.
|