ΣΤΑΤΙΣΤΙΚΗ ΜΑΘΗΣΗ


ΓΕΝΙΚΑ

ΕΞΑΜΗΝΟ ΦΟΙΤΗΣΗΣ: 2ο
ΚΑΤΕΥΘΥΝΣΗ: Μαθηματικά Επιστήμης Δεδομένων
ΠΙΣΤΩΤΙΚΕΣ ΜΟΝΑΔΕΣ: 8

ΔΙΔΑΣΚΟΝΤΕΣ

Χρυσ. Καρώνη, Χρ. Κουκουβίνος, Κ. Δρόσου

ΠΡΟΑΠΑΙΤΟΥΜΕΝΕΣ ΓΝΩΣΕΙΣ

Πιθανότητες, Στατιστική Συμπερασματολογία, Ανάλυση Παλινδρόμησης, Πληροφορική

ΣΤΟΧΟΣ

Αυτό το μάθημα παρέχει μια λεπτομερή και σύγχρονη επισκόπηση των στατιστικών μοντέλων που χρησιμοποιούνται από τους επιστήμονες δεδομένων για την πρόβλεψη και την εξαγωγή συμπερασμάτων. Με τις ραγδαίες εξελίξεις στην τεχνολογία του Διαδικτύου, στη γονιδιωματική, στη μοντελοποίηση του χρηματοπιστωτικού κινδύνου και σε άλλες βιομηχανίες υψηλής τεχνολογίας, βασιζόμαστε ολοένα και περισσότερο στην ανάλυση δεδομένων και στα στατιστικά μοντέλα για να εκμεταλλευτούμε τα τεράστια ποσά των δεδομένων που έχουμε στη διάθεση μας. Σε αυτό το μάθημα τονίζουμε τα εργαλεία που είναι χρήσιμα για την αντιμετώπιση των σύγχρονων προβλημάτων ανάλυσης δεδομένων. Πολλά από αυτά αποτελούν απαραίτητα δομικά στοιχεία, αλλά συμπεριλαμβάνουμε επίσης τεχνικές στην πρωτοπορία της τεχνολογίας για την αντιμετώπιση προβλημάτων με μεγάλα δεδομένα. Από τη μεγάλη γκάμα εργαλείων που διαθέτουμε, έχουμε επιλέξει αυτό που θεωρούμε ότι είναι τα πιο συναφή.

ΜΕΘΟΔΟΣ ΕΞΕΤΑΣΗΣ

Παράδοση ασκήσεων και εργασιών, γραπτή εξέταση στο τέλος του εξαμήνου.

ΠΕΡΙΕΧΟΜΕΝΑ

Γραμμική και πολυωνυμική παλινδρόμηση.
Λογιστική παλινδρόμηση και γραμμική διακριτική ανάλυση.
Διασταυρωµένη επικύρωση και bootstrap.
Επιλογή μοντέλου και ποινικοποιημένες μέθοδοι (ridge και lasso).
Μη γραμμικά μοντέλα, splines και γενικευμένα προσθετικά μοντέλα.
Tree-based methods, random forests και boosting.
Μηχανές διανυσμάτων υποστήριξης.
Μέθοδοι μάθησης χωρίς επίβλεψη.
Ανάλυση κυρίων συνιστωσών και ομαδοποίηση δεδομένων (k-means και ιεραρχική).

ΒΙΒΛΙΟΓΡΑΦΙΑ

1. T. Hastie, R. Tibshirani and J. Friedman (2009). Elements of Statistical Learning, 2nd edition, Springer.
2. T. Hastie, R. Tibshirani and M. Wainwright (2015). Statistical Learning with Sparsity: the Lasso and Generalizations, Chapman and Hall.
3. G. James, D. Witten,T. Hastie and R. Tibshirani (2013). Introduction to Statistical Learning with applications in R, Springer.
4. B. Efron and T. Hastie (2016). Computer Age Statistical Inference, Algorithms, Evidence, and Data Science, Cambridge, University Press.
5. B. Efron and R. Tibshirani (1993). An Introduction to the Bootstrap, Chapman and Hall.