
Statistical Modeling & Machine Learning
Il modulo si propone di fornire un’approfondita conoscenza delle tecniche e degli strumenti di Data Mining e Machine Learning, mostrando come possano essere impiegati per risolvere problemi pratici e per fornire valore aggiunto nei processi di business. Dopo una prima parte che fornisce le competenze di Statistical Modelling, vengono presentate le peculiarità distintive del Data Mining e del Machine Learning e le modalità in cui possono essere utilizzate per produrre benefici in processo di analisi di Big Data. L’obiettivo del modulo è di fornire conoscenze che permettano di affrontare un problema di analisi dati in tutte le sue fasi: scopo dell’analisi, preparazione del dato, scelta del modello e della tecnica adeguata confrontando diversi possibili scenari, presentazione dei risultati ottenuti e delle motivazioni sulle scelte effettuate.
- Foundations on Statistics
Inferenza e distribuzioni
Fondamenti di inferenza (stimatori, IC, test e pvalue) - Statistical Modelling
Modelli statistici (logit e regression) - Data Mining & Machine Learning
Train, Test, Validation e Crossvalidation
Overfitting E Bias vs Variance tradoff
Classification Metrics
Knn, Naive Bayes, Random Forest, Boosting, Ensemble Logistic Regression Classifier, Neural Networks
Outlier management
Regularization
Forecast Cluster Analysis - Data Preprocessing & Machine Learning
- Laboratorio – Team Project