Dipartimento di Matematica e informatica

TIROCINI-TESI PER IL 2022

Progetto di Tesi di Ricerca in collaborazione con azienda Growens
Online converter from HTML documents to JSON through deep learning approaches INTRO PROJECT FLOWCHART

Progetto di Tesi di Data Engineering in collaborazione con azienda AgileLab
Automatic scanning for sensitive data detection, masking and ABAC authorization policies, driven data interception for masking and/or tokenization. Tool evaluation: Okera, Immuta.

Progetto di Tesi di Data Engineering in collaborazione con azienda AgileLab
Implementation and evaluation of the state of the art of an end-to-end AI Pipeline with Spark on Ray on Kubernetes. A comprehensive evaluation of the benefits in terms of efficiency and costs that Rayframework can bring into ML use cases.

Progetto di Tesi di Knowledge Graphs in collaborazione con azienda AgileLab
Definition of the Data Mesh ontology and its relationship with Domain ontologies and how to use them in combination for polysemes management.

Progetto di Tesi di Visualization and metadata in collaborazione con azienda AgileLab
Management of data storage across different clouds taking into account data gravity, exploiting Kubernetes federation, tagging, policies, etc for efficient and cost-effective workload management.

Progetto di Tesi di Data Governance and Regulation in collaborazione con azienda AgileLab
Investigation on available technologies to add indexes to popular data and table formats.

Progetto di Tesi di Data Governance and Regulation in collaborazione con azienda AgileLab
Investigation on all the enabling technologies for privacy preservation applicable to big amounts of data. Right to be forgotten in a bigdata immutable world, differential and homomorphic encryption in a bigdata environment.

Progetto Reading Course/Tesi
Realizzazione di una WEB Application per Chat-Bot personalizzabile e riutilizzabile, da interfacciare con AIDA-Bot Chat (A Conversational Agent to ExploreScholarly Knowledge Graphs) mediante API rest calls. Il sistema dovrà ricevere l'input (una frase testuale) dall'utente (eventualmente gestire l'audio), restituire l'output di AIDA-Bot (anche con eventuali animazioni) e gestire le sessioni (utilizzo contemporaneo di più utenti web). Il sistema dovrà essere realizzato con programmazione Python server-side. Aida-Bot è realizzato in Python e accetta in input testo in linguaggio naturale. In output genera testo in linguaggio naturale e testo formattato con TAG HTML. La comunicazione tra la web application e AIDA-Bot avverrà attraverso una stringa in formato JSON contenente i dati di sessione. Guarda uno schema dell'architettura.

Skills che si apprenderanno:
Python
HTML
Javascript
JSON
Django Framework

Progetti Big Data/Tesi/Reading Course presso azienda Rainapp
Sviluppo di una piattaforma WebGIS IoT basata su Amazon AWS, sulla base dello schema di massima riportato nel seguito, finalizzata a raccogliere ed elaborare i dati prodotti da dei dispositivi IoT (LoRaWan, NB-IoT) per il monitoraggio urbano, restituendo: (i) informazioni relative alle aree interessate da eventi meteorici, (ii) previsioni sull’evoluzione dei fenomeni, (iii) definizione dei percorsi, ottimizzati in termini di tempo e di risorse, dei mezzi atti alla manutenzione. Le attività prevedono l’integrazione di fonti di dati di diversa natura,
l’implementazione di un algoritmo già strutturato e la restituzione delle informazioni sia in forma numerica (serie storiche di dati), sia in forma visuale (mappe georeferenziate), oltre alla definizione di API per la comunicazione con applicazioni di terze parti (in particolare ArcGIS). Le attività sono volte alla realizzazione di due test pilota (50 dispositivi), sono remunerate e devono concludersi improrogabilmente entro il 15 settembre 2022. Guarda lo schema.

Tesi presso azienda Kibernetes
Titolo: Creazione di un ChatBot
Descrizione: La collaborazione prevede l’integrazione di un chatbot, all’interno di un CRM aziendale utilizzato da circa 250 utenti, in grado di gestire correttamente le risposte a intent semplici più utilizzati nel CRM (inserimento ordini, opportunità, ticket, modifica contatti, visualizzazione scheda cliente), utilizzando tecnologie open source di “natural speech language processing”. Altri sviluppi prevederanno il supporto del chatbot alla navigazione, ricerca dei contenuti all'interno della piattaforma di assistenza.

Tesi presso azienda Kibernetes
Titolo: Recommendation
Descrizione: A partire dal set di dati disponibili all’interno del crm, implementare un algoritmo di AI (o di ottimizzazione), al fine di profilare i contatti registrati nel CRM che utilizzano il portale di assistenza come utenti, suggerendo contenuti e/o percorsi preferenziali per accedervi. In ambito marketing suggerire inoltre nuovi prodotti disponibili considerati dall’algoritmo di maggior interesse per il contatto stesso.

Tesi presso azienda Kibernetes
Titolo: Deep Learning e Machine Learning
Descrizione: Riconoscimento automatico di oggetti da immagini satellitari. Previsione dell'andamento della linea di costa da immagini satellitari combinate con analisi di eventi atmosferici ed interventi antropici.

Tesi presso azienda Kibernetes
Titolo: Deep Learning e Machine Learning
Descrizione: Creazione di un sistema automatizzato di individuazione delle fonti relative all'amministrazione pubblica e stesura di testi in bozza da mandare in revisione alla redazione. Sviluppo di algoritmo per produrre news a partire da base di dati nazionale e locale.

Tesi
Titolo: Verso il metaverso: comparazione delle SDK di alcuni frameworks per la creazione di mondi virtuali aumentati con tecniche di Intelligenza Artificiale
Descrizione: Il progetto mira allo studio di alcuni frameworks per lo sviluppo di mondi virtuali (e.g., VRChat, hubs.mozilla.com, OpenSimulator) e comprensione delle loro flessibilita' per l'arricchimento dei comportamenti degli avatar (umani o bot) con funzioni di Intelligenza Artificiale chiamate da engine che girano su cloud.

Tirocinio presso IMI-REMOSA
Titolo: Sviluppo di una sala controllo
Descrizione: Per sviluppare la nuova Sala Controllo per lo Stabilimento in costruzione IMI REMOSA intende costituire un Team di 3 o 4 Studenti con capacità polivalenti anche in ambito Digitale. Gli studenti faranno parte del Team del Progetto attualmente in corso.

Tirocinio presso il CNR.
Titolo: Classificazione delle pagine di Wikipedia mediante Graph Convolutional Networks
Descrizione: Il progetto di tirocinio consiste nella realizzazione di un modello di machine learning basato su Graph Convolutional Network, capace di inferire le proprietà di entità (corrispondenti a pagine di Wikipedia), anche in assenza di testo associato, utilizzando una rete di co-occorrenze nel testo. I dati per il training e la validazione saranno forniti al tirocinante insieme a tutto il necessario per lo sviluppo del progetto. Il progetto sarà svolto presso il CNR e supervisionato dal dott. Misael Mongiovì.

Tirocinio presso il CNR.
Titolo:
Question Answering contestuale con l'utilizzo di grafi di conoscenza
Descrizione: Il tirocinio consiste nell'implementazione di un sistema di question answering contestuale, dove la domanda è associata ad un contesto espresso in linguaggio naturale. Un esempio di contesto è "Ragazzi che praticano skateboard." e la domanda associata "Cosa indossano in testa?". Per formulare la risposta corretta (nell'esempio "Casco") il sistema farà uso di conoscenza esterna sotto forma di knowledge graph. Il progetto prevede la realizzazione di un modello di machine learning basato su Graph Neural Network da allenare su un dataset fornito dal supervisore insieme al knowledge graph e tutto il materiale necessario. Il progetto sarà svolto presso il CNR in collaborazione con l'Università dei Paesi Baschi e supervisionato dal dott. Misael Mongiovì.T

TIROCINI-TESI PER IL 2021

Tirocinio presso BUP Srl.
Riconoscimento di entita’ all’interno di un test non strutturato.

Research (thesis work) about Dow Jones DNA
Analysis of APIs of Dow Jones DNA to extract news and perform a classification task on the extracted documents. https://developer.dowjones.com/site/global/develop/analytics_and_services/snapshots/index.gsp

Research (thesis work) about graph embeddings on FIFA soccer teams and formations.
The most natural way I can think about explaining node2vec is to explain how node2vec generates a “corpus” — and if we understand word2vec we already know how to embed a corpus.
So how do we generate this corpus from a graph? That’s exactly the innovative part of node2vec and it does so in an intelligent way which is done using the sampling strategy. Node2vec has already been developed and can be used. What we are going to do is to do some tests on different datasets. One of these, using formation of European football teams, will be to embed the teams, players and positions of different clubs. The data we are going to be using is taken from the FIFA 17 dataset on Kaggle. From there we will perform some tests and will analyse statistics and perform a bit of data science. To read further details please visit this link

Opportunità di tesi da sistemista per configurare un server molto grande con tante GPU al suo interno.
Si tratta di smanettare un po’ con Linux e riuscire a configurare le GPU all’interno del sistema testandole con qualche classificatore scritto in Keras o TensorFlow. Il progetto si colloca all’interno del dominio di Big Data e può anche essere un progetto della materia Big Data oltre a essere argomento di tesi. Il risultato finale sarà quello di configurare un modo di lavoro multi-utente e allocare le GPU secondo policy che verranno definite.

Opportunità di tesi innovativa per studenti su sviluppo piattaforma WEB (back-end e front-end) per acquisizione e analisi di immagini tramite scanner laser
Per lo sviluppo di un processo innovativo nell’ambito della biomeccanica, Idea Postura, ditta operante nella realizzazione di soluzioni per il benessere posturale delle persone ad alta valenza tecnologica, necessita la realizzazione di un software per l’acquisizione e l’analisi di impronte plantari 3D e 2D tramite scanner laser.

Il sistema software (back-end) dovrà interfacciarsi con uno scanner laser gestito da arduino nel livello 1 (acquisizione dati). Lo scanner permette il movimento di un sensore costituito da webcam+laser lineare e dovrà consentire la lettura e l’acquisizione dei dati in tempo reale (posizione sensore, pixel interessati dal laser, acquisizione panoramica impronta). In particolare il sistema dovrà permettere l’inserimento e il salvataggio di dati anagrafici e anamnestici, commenti tecnici, accettazione modulo privacy e avvio dell’acquisizione di entrambe le impronte plantari sia in 3D che in 2D.

Successivamente, a livello 2 (elaborazione dati – front end) dovrà permettere la visualizzazione delle acquisizioni precedentemente ottenute ed una loro analisi: le impronte 2D dovranno essere processate tramite scala cromatica e tramite studio della geometria di appoggio per la classificazione delle stesse come da letteratura scientifica. Le impronte 3D dovranno essere ricostruite e visualizzate nello spazio.
Il sistema dovrà altresì effettuare il salvataggio in automatico di dati aggregati, mantenerli in memoria o permetterne la cancellazione, consentirne l’esportazione/importazione in formati dedicati.

Lo scanner è gia’ stato realizzato tramite piattaforma Arduino e lo studente ci si interfaccerà con API dedicate. Ci si concentrerà sullo sviluppo dell’acquisizione di dati e del front end grafico.

Lo studente si coordinerà e sarà supportato da Ingegneri Biomedici nello sviluppo del sistema.

Opportunità di tesi innovative per studenti su machine learning e big data nel settore agricolo
Nell’ambito di numerosi progetti nei quali la SPIVA srl è coinvolta sia come componente del partenariato che come consulente di servizi esterno, si denota la necessità di gestire ed elaborare una grande mole di dati (BIG DATA) di natura raster e vettoriali.
Si vuole sviluppare un sistema DSS (Decision Support System) nel settore agricolo che possa aiutare l’utilizzatore finale a prendere la giusta decisione in campo (es. quanto, quando e dove irrigare o utilizzare i fertilizzanti) al fine di ottimizzare le risorse ambientali ed economiche aziendali.

In particolare risulta necessario gestire i BIG DATA raccolti da sensori multispettrali satellitari, da sensori di prossimità nel terreno e da stazioni meteorologiche nel livello 1 (acquisizione dati).
Questi dati, nel livello 2 (elaborazione dati) saranno resi leggibili attraverso la creazione di prodotti cartografici digitali che in seguito andranno analizzati nel livello 3 (creazione metodologia) attraverso tecniche di machine learning con lo scopo di individuare degli elementi di correlazione utili che possano indirizzare le attività agronomiche sul terreno come previsto nel livello 4 del progetto (applicazione in campo).

Lo studente avrà la possibilità di lavorare in sede aziendale e sarà supportato da esperti senior che forniranno supporto per gli approfondimenti in materia di remote sensing. Lo studente sarà inserito in un contesto operativo di ricerca e sviluppo di nuove tecnologie legate all’aerospazio e al machine learning e big data. Le aziende coinvolte nel progetto sono, oltre il proponente, il CRS4 e Abinsula.

Opportunity for bachelor/master thesis related to the development of a Photovoltaic Energy Production Estimation Tool
Architects and other professionals involved in the design and construction of buildings usually have to evaluate the best choice and distribution of solar panels and/or PV glass.
In order to take meaningful decisions, a cloud based tool for estimating the energy production and installation costs would be absolutely useful for these professionals.

R2M Solution already have developed a Python based tool for estimating the distribution and costs for PV glass which can be used as reference for developing the cloud based tool.

If you are enthusiastic about Python, want to use different cloud based microservices and want to research web technologies, this is your thesis.

The application will be advised by R2M Solution.

Key technologies: Python, JavaScript, HTML/CSS.

REQUIRED SKILLS:
? Knowledge and development skills in Python
? Use of services distributed through the REST interfaces
? Knowledge of GIT and version-control systems

Opportunity for bachelor/master thesis related to the development a Pokédex of worldwide fishes
Gotta catch ‘em all!. We are sure you know what the slogan means. What about being involved in bachelor/master thesis related to developing a Pokédex? This time not about Pokémon but for worldwide fishes.

Within EU-MARE project, R2M Solution and the Consiglio Nazionale delle Ricerche, together other partners, developed a information system (including back-end, web front-end and mobile apps) for commercial designations for fishery and aquaculture products. So, the fishery and aquaculture data is available, would you be able to make it appealing for younger generations developing a Pokédex style application for Android/iOS?

The application will be built within the MARE project of the European Commission will be advised by R2M Solution and CNR.

Key technologies: Java, Android, iOS, databases, REST APIs, Swift/Objective-C.
REQUIRED SKILLS:
? Willingness to develop applications for Android/iOS
? Knowledge and development skills in Java / Swift or Objective-C
? Use of services distributed through the REST interface
? Knowledge of SQL and databases in general
? Knowledge of GIT and version-control systems

Opportunity for bachelor/master thesis related to the development of native (Android / iOS) front-end application with efficient data caching.
Analysis, design and development of a native Android / IOS front-end application for querying and efficiently caching data from a back-end server hosting a database. The project will involve researching on analysing and predicting user actions in order to client-side cache and prefetch web content, so that the information is partially available when Internet connection is limited. The project will encourage the researcher to study and develop taking into account software development best practices such as code quality, test/code coverage and security.

The application will be built within the MARE project of the European Commission will be advised by R2M Solution and CNR.

Key technologies: Java, Android, iOS, databases, REST APIs, Swift/Objective-C.
REQUIRED SKILLS:
? Willingness to develop applications for Android/iOS
? Knowledge and development skills in Java / Swift or Objective-C
? Use of services distributed through the REST interface
? Knowledge of SQL and databases in general
? Knowledge of GIT and version-control systems

Opportunità di tesi triennale/magistrale relativa alla creazione di una GUI per la gestione di dati provenienti da siti web e in collaborazione con un azienda lombarda con sedi in Francia, Spagna e UK. Si tratta di creare una versione più generale e intelligente di tool come Flipboard e Feedly

Sviluppo di GUI per browser web usando tecnologie per front end Web e sviluppo della relativa parte di backend per gestire contenuti web e mostrarli con template ad-hoc e secondo preferenze degli utenti che potranno seguire siti web, news, e altro, cercare keywork da motori di ricerca ed avere all’interno di un magazine virtuale l’elenco di tutti i contenuti scelti. Il magazine virtuale sarà automatizzato e avrà una funzione di self-feeding in base alle scelte dell’utente.

Opportunità di tesi triennale/magistrale relativa alla creazione di una GUI per la gestione di dati energetici provenienti da smart grid e smart devices e presenti su cloud Amazon e DB oracle in collaborazione con l’azienda NesosNet

Sviluppo di GUI per browser web usando tecnologie per front end Web in collaborazione con l’azienda NesosNet.

Opportunità di tesi triennale/magistrale relativa alla comprensione del software open-source picochess per il gioco degli scacchi con scacchiera digitale DGIT

Analisi e comprensione del software, degli engines su cui il software picochess si basa in collaborazione con il Circolo Scacchistico di Cagliari della Federazione Scacchistica Italiana.

Opportunità di tesi triennale relativa al crawling di dati da piattaforma e-learning per pubblicazione scientifica

Sviluppo di crawler per estrazione di dati da piattaforme di e-learning per una pubblicazione scientifica su conferenza o rivista internazionale. Si verrà seguiti da alcuni dottorandi.

Opportunità di tesi triennale o magistrale per studio di reinforcement learning

Esplorazione del reinforcement learning, suo utilizzo tramite il framework Keras e sviluppo di applicazioni su dati reali.
Si verrà seguiti direttamente dal professore.

Opportunità di tesi triennale di sviluppo WEB GUI usando la libreria Bootstrap

Sviluppo di interfaccia GUI esistente e scritta in HTML/Javascript da riscrivere usando librerie https://getbootstrap.com/docs/4.0/getting-started/introduction/
Si verrà seguiti direttamente dal professore.

Opportunità di tesi triennale relativa al text extraction all’interno di un progetto Nazionale

Sviluppo di strumenti di estrazione di testo da documenti all’interno di un progetto nazionale. Si verrà seguiti da un’azienda italiana.

Opportunità di tesi magistrale in collaborazione con Fondazione Bruno Kessler
La realizzazione di sistemi intelligenti per supportare gli utenti nell’ambito della sanita’ e’ un argomento di forte interesse e che offre innumerevoli possibilita’ nell’ambito della ricerca. Si pensi ad esempio al fornire strumenti per il self-management di patologie croniche come il diabete, o piu’ semplicemente applicazioni per il monitoraggio di sani stili di vita. Durante il periodo di stage e tesi proposto, lo studente lavorera’ ad un primo prototipo che integra l’utilizzo di knowledge bases esterne all’interno di al fine di costruire un sistema che interagisca con gli utenti, sotto forma di linguaggio naturale, per lo svolgimento di specifici compiti legati alla sanita’. Esempi di questi compiti legati alla proposta corrente sono:

Acquisizione di una lista di piatti consumati da un utente durante un pasto.

Individuazione all’interno della knowledge base del piatto corretto o di una serie di alternative da proporre all’utente per conferma.

Restituzione all’utente delle informazioni relative al pasto consumato.

Ulteriori compiti potranno essere assegnati in corso d’opera qualora le attivita’ procedessero in modo proficuo.
Il lavoro di stage piu’ tesi sara’ svolto congiuntamente tra l’Universita’ di Cagliari (Prof. Diego Reforgiato Recupero) e la Fondazione Bruno Kessler di Trento (Dott. Mauro Dragoni).

COMPETENZE RICHIESTE:

Ottima conoscenza e capacita’ di sviluppo in Java.

Conoscenza di tecniche di natural language processing.

Utilizzo di servizi distribuiti tramite interfaccia REST.

Utilizzo del formato JSON per gestire l’interoperabilita’ dei sistemi.

Volonta’ di acquisire conoscenze di base legate alla creazione di sistemi di dialogo.

Opportunità di lavoro/ricerca all’estero

Il prof. Reforgiato ha una collaborazione con Philips Research Eindhoven la quale ospita due studenti l’anno per periodi di 3-6 mesi pagando un salario mensile di 1000 euro su temi innovativi e di ricerca relativi alla cognitive computation, semantic web, natural language processing.

Il prof. Reforgiato ha una collaborazione con Intel Dublin la quale ospita studenti per periodi di 6 mesi pagando un salario mensile di 1000 euro.

Il prof. Reforgiato ha una collaborazione con la New York University la quale ospita studenti per periodi di 3 mesi per lavorare su temi di ricerca precedentemente accordati in campo di graph theory.

Opportunità di lavoro/ricerca in Italia

Il prof. Reforgiato ha una collaborazione con diversi istituti del CNR (ISTC, IVALSA) per lavorare su temi di Semantic Web, Natural Language Processing e Sentiment Analysis o di pure applicazioni informatiche. Salari e logistica dipendono da caso a caso.

Il prof. Reforgiato ha una collaborazione con l’azienda R2M Solution s.r.l. per lavorare su progetti Europei di ricerca su temi di Smart Grid e efficienza energetica. Salari e logistica dipendono da caso a caso.

Il prof. Reforgiato dispone del robot Zora e sono disponibili tesi altamente innovative ma anche compilative a riguardo per programmare tale robot in diversi domini di applicazione

Il prof. Reforgiato dispone della scheda grafica NVidia Titan X messa a disposizione su un server Linux con ssh (accessibile dall’esterno) e sono disponibili tesi altamente innovative ma anche compilative a riguardo per programmare tale scheda usando l’architettura CUDA per problemi in diversi ambiti di applicazione

Insieme al Prof. Carta coordina il progetto cluster DoUtDes relativo al trasferimento di tecnologie e competenze di Business Intelligence alle aziende dei settori innovativi e tradizionali. Il progetto durerà fino al 2021. Opportunità per tesisti e tirocinanti per lavorare all’interno di questo progetto

Gli studenti interessati possono chiedere ulteriori informazioni al prof. Reforgiato.

Questionario e social

Condividi su:
Impostazioni cookie