For the convenience of the students, contents in this page are in Italian.

Material



Big Data, Data Warehousing e Integrazione di Dati.

La mole di dati a disposizione raggiunge ormai in diversi contesti l'ordine dei Tera- o dei Peta-byte. Questo comporta che le tecniche tradizionali di analisi per la risoluzione di problemi anche abbastanza classici non siano adeguate, soprattutto a causa della elevata eterogeneitá e variabilitá dei dati. Nell'ambito di questa tematica, sará possibile approfondire tecniche di progettazione per Business Intelligence, Business Analytics e Big Data, includendo tecniche di modellazione NoSQL e piattaforme come Apache Hadoop. Alcuni aspetti specifici potranno riguardare lo studio di speciali tipologie di dati, ad esempio nel dominio biologico o in quello del marketing aziendale.

Proposta tesi per laurea triennale: Tecnologie e algoritmi per la gestione e l'analisi di Big Data (Apache Hadoop, Data Warehousing, Data Streaming). Approcci di profilazione utenti per il marketing comportamentale.

Proposta tesi per laurea magistrale: Ideazione, progettazione e sviluppo di moduli basati su tecnologie di Big Data (Apache Hadoop, NoSQL, ecc.) per la risoluzione di problemi in ambito biologico.

Analisi di Reti

Molti contesti della vita reale si prestano ad essere rappresentati sotto forma di rete, basti pensare a Facebook o al web. Anche la cellula viene rappresentata come una rete, dove le connessioni rappresentano interazioni tra suoi componenti specifici, come geni, RNA e proteine. Dal punto di vista informatico, le reti sono dei grafi con diverse caratteristiche proprie del dominio di applicazione. Molti problemi che coinvolgono reti di varia tipologia possono essere affrontati attraverso la proposta di algoritmi per l'allineamento, il clustering e altri tipi di analisi di grafi.

Proposta tesi per laurea triennale: Analisi di grafi nel dominio biologico, reti sociali, web databases. Data mining e analisi di dati per la risoluzione di problemi su long non-coding RNA, metagenomica, epigenomica.

Proposta tesi per laurea magistrale: Tecniche di data mining, intelligenza artificiale e analisi di dati applicate a grafi.

Elaborazione di Stringhe e Sequenze

I componenti cellulari possono essere rappresentati attraverso sequenze codificate come stringhe su alfabeti di quattro o ventuno caratteri, a seconda che si tratti ad esempio di acidi nucleici o amminoacidi. Numerosi problemi in ambito biologico possono essere affrontati attraverso la progettazione di algoritmi per l'elaborazione di stringhe. In particolare, ci si riferirá principalmente a sequenze biologiche provenienti da tecniche di sequenziamento di nuova generazione, e si tratteranno metodi alignment-free o legati all'estrazione di pattern e/o outlier.

Proposta tesi per laurea triennale: Data mining e analisi di dati per la risoluzione di problemi su long non-coding RNA, metagenomica, epigenomica.

Proposta tesi per laurea magistrale: Tecniche di data mining, intelligenza artificiale e analisi di dati applicate a stringhe.

Analisi di Immagini Digitali

Si studieranno algoritmi basati sull'estrazione di motifs, ovvero, ripetizioni approssimate, per la compressione e classificazione di immagini digitali rappresentate come array bidimensionali. In particolare, si cercheranno tecniche efficienti per rappresentare il contenuto informativo delle immagini, eliminando l'eventuale ridondanza intrinseca alla tipologia di rappresentazione. Lo studio potrá includere anche la definizione di opportune misure di similaritá tra immagini digitali.

Proposta tesi per laurea triennale: Classificazione e compressione di immagini digitali.