Il corso di Statistica per Big Data propone di introdurre gli studenti alle tecniche moderne di visualizzazione dei dati, ai metodi e modelli statistici per l’analisi di struture di dipendenza semplici e complesse, ai metodi statistici di supporto alle decisioni. Verranno anche introdotte anche alcune tecniche multivariate. Il corso si concentra in particolare sull'analisi esplorativa dei dati, sui modelli lineari e sui modelli lineari generalizzati, sui loro punti di forza e sui loro limiti.
Facendo ampio uso di esempi di dati reali e della loro analisi con R attraverso RStudio e con il software Minitab, il corso enfatizzerà il ruolo dei modelli statistici nell'affrontare le domande scientifiche e come queste si traducono in domande statistiche rilevanti. Lo studente imparerà a distinguere tra problemi di stima dei parametri, test di ipotesi e previsione. Pertanto allo studente verrà insegnato non solo ad applicare tecniche statistiche ma anche a scegliere la tecnica più opportuna ed a commentare l’output ai fini decisionali.
Facendo ampio uso di esempi di dati reali e della loro analisi con R attraverso RStudio e con il software Minitab, il corso enfatizzerà il ruolo dei modelli statistici nell'affrontare le domande scientifiche e come queste si traducono in domande statistiche rilevanti. Lo studente imparerà a distinguere tra problemi di stima dei parametri, test di ipotesi e previsione. Pertanto allo studente verrà insegnato non solo ad applicare tecniche statistiche ma anche a scegliere la tecnica più opportuna ed a commentare l’output ai fini decisionali.