21210229 - Statistical learning

• Reti bayesiane. Tecniche di apprendimento e stima delle strutture associative tra variabili.
• Introduzione all’analisi della causalità
• Tecniche di campionamento.
• Analisi della qualità dell’informazione contenuta nei big data. Tecniche di ponderazione, calibrazione e campionamento per passare dai big data agli smart data.
Prerequisiti: avere superato i due precedenti esami di Statistica.
scheda docente | materiale didattico

Programma

Il corso affronterà le seguenti tematiche:
• Introduzione ai principali modelli di statistical learning (apprendimento statistico);
• problemi di previsione e classificazione: richiami su regressione lineare e sui principali metodi di classificazione non supervisionata;
• Supervised classification: K-Nearest-Neighbours;
• Errore di misclassificazione;
• Metodi di ricampionamento: cross validation e bootstrap;
• Metodi basati su alberi decisionali: regression trees, classification trees, bagging, random forests, boosting.
• Introduzione ai metodi di classificazione Semi-supervisionata;
• Uso dell’ambiente statistico R


Testi Adottati

I materiali dell’insegnamento saranno fruibili sulla pagina Moodle e sulla classe Teams dell'insegnamento.

Modalità Erogazione

L’insegnamento è strutturato in 40 ore di didattica frontale, con lezioni teoriche e pratiche (con utilizzo del software RStudio).

Modalità Valutazione

esame orale