Παράκαμψη προς το κυρίως περιεχόμενο

Εισαγωγή στην επιστήμη των δεδομένων και τη μηχανική μάθηση

Κωδικός
Φ-252
Επίπεδο
Προπτυχιακό
Κατηγορία
Γ
Διδάσκων
P. Bonfini, Γ. Τσιρώνης
ECTS
6
Ώρες
4
Εξάμηνο
Χειμερινό
Ανοικτό
Ναι
Προσφέρεται
Ναι
Σκοπός Μαθήματος

Στη σύγχρονη επιστήμη, πειράματα σε πεδία όπως στη φυσική υψηλών ενεργειών και παρατηρήσεις από τα αστρονομικά παρατηρητήρια δημιουργούν πλήθος δεδομένων (“big data”) τα οποία απαιτούν εξαιρετικά αποτελεσματικές μεθόδους προκειμένου να αναλύονται και να παράγονται σημαντικά αποτελέσματα. Η επιστήμη των δεδομένων (data science) είναι ο διεπιστημονικός τομέας που ενοποιεί πεδία όπως στατιστική και πιθανότητες, επιστήμη της πληροφορίας, ανάλυση δεδομένων, μηχανική μάθηση και άλλες συναφείς μεθόδους, προκειμένου να αναλύσει, κατηγοριοποιήσει, προβλέψει και ερμηνεύσει φαινόμενα από δεδομένα. Οι σύγχρονες μέθοδοι μηχανικής μάθησης (machine learning [ML]) έχουν διαδραματίσει σημαντικό ρόλο στην πρόοδο της επιστήμης των δεδομένων. Επιμέρους πεδία, όπως μέθοδοι βασισμένες σε συστοιχίες νευρωνικών δικτύων (deep learning [DL]), έχουν παίξει καθοριστικό ρόλο στην πρόοδο που παρατηρείται σε πολλούς τομείς όπως η αναγνώριση ομιλίας, η μηχανική μετάφραση και η ρομποτική μεταξύ άλλων. Στη φυσική, οι μέθοδοι ML και DL χρησιμοποιούνται για να ανιχνεύσουν και να ταξινομήσουν αστρονομικά αντικείμενα, να εντοπίσουν σωματίδια σε συστοιχίες ανιχνευτών και να προβλέψουν την κατάσταση σύνθετων, μη γραμμικών δυναμικών συστημάτων.
Ο σκοπός αυτού του μαθήματος είναι να προσφέρει εισαγωγή στις βασικές έννοιες και τα σύγχρονα υπολογιστικά εργαλεία της επιστήμης των δεδομένων, της μηχανικής μάθησης και της «βαθιάς μάθησης» (deep learning), κατά τρόπο κατανοητό και με μεθόδους ενεργούς μάθησης, στους φοιτητές του Τμήματος Φυσικής. Το μάθημα θα επικεντρωθεί σε υπολογιστικές (hands-on) εφαρμογές των μεθόδων αυτών με χρήση δεδομένων από τα πεδία της φυσικής. Θα παρουσιαστούν οι βασικές μαθηματικές έννοιες και θα αναδειχθούν οι συσχετίσεις με έννοιες και μεθόδους στατιστικής φυσικής. Ταυτόχρονα, οι φοιτητές θα εκπαιδευθούν σε σύγχρονα υπολογιστικά εργαλεία και γλώσσες προγραμματισμού (Python, Jupyter Νotebooks, σύγχρονα ML / DL στατιστικά πακέτα). Το μάθημα θα προσφέρει καινοτόμο προοπτική για το πεδίο της επιστήμης δεδομένων και των μεθόδων μηχανικής μάθησης, για την προώθηση της κατανόησης του φυσικού κόσμου καθώς και των ανοιχτών προβλημάτων σε σύγχρονα πεδία επιστήμης και τεχνολογίας, στα οποία οι φοιτητές του Τμήματος Φυσικής είναι σε θέση να συνεισφέρουν επιστημονικά, και τα οποία θεωρούνται τα πλέον περιζήτητα από πλευράς θέσεων εργασίας.

Πρόγραμμα

Τετάρτη,17:00-20:00, Αίθουσα Υπολογιστών 2

Διδακτέα Ύλη

Θεματική Ενότητα 1: Python και Tensoflow για την Επιστήμη των Δεδομένων
Εβδομάδα 1. Εισαγωγή. Μαθηματικά προ-απαιτούμενα. Δημιουργία του υπολογιστικού περιβάλλοντος: Εισαγωγή στη γλώσσα προγραμματισμού Python (Ι).
Εβδομάδα 2. Εισαγωγή στη γλώσσα προγραμματισμού Python (II). Η χρήση Jupyter Notebooks.
Εβδομάδα 3. Εφαρμογές με Python (I). Πρόσβαση σε πηγές δεδομένων. Εγκατάσταση Keras και TensorFlow. Εισαγωγή στο περιβάλλον προγραμματισμού TensorFlow.
Εβδομάδα 4. Εφαρμογές με Python (II). Πιθανότητες και Στατιστική με εφαρμογές στην Επιστήμη των Δεδομένων. Χρησιμοποιώντας Python και TensoFlow για την εκμάθηση βασικών μεθόδων και στατιστικών προσεγγίσεων για την ανάλυση δεδομένων.

Θεματική Ενότητα 2: Μηχανική Μάθηση (Machine Learning)
Εβδομάδα 5. Οι βασικές αρχές της μηχανικής μάθησης: Το ευρύτερο πεδίο και η δομή εφαρμογών. Πηγές δεδομένων και κύριες εφαρμογές: ταξινόμηση (classification) και πρόβλεψη (prediction). Γραμμική παλινδρόμηση, steepest descent, πολυωνυμική παλινδρόμηση. 
Εβδομάδα 6. Regularized Linear Models (Ridge Regression, Lasso Regression, Elastic Net, Early Stopping). Λογιστική παλινδρόμηση (Εκτίμηση πιθανοτήτων, Decision Boundaries, Softmax Regression).
Εβδομάδα 7. Support Vector Machines. Decision Trees. Ensemble Learning and Random Forests.
Εβδομάδα 8. Dimensionality Analysis. Principal Components Analysis.

Θεματική Ενότητα 3: Βαθιά Μάθηση (Deep Learning)
Εβδομάδα 9. Νευρωνικά δίκτυα και βαθιά μάθηση. Εφαρμογές με χρήση TensorFlow.
Εβδομάδα 10. Πλήρως διασυνδεδεμένα βαθιά νευρωνικά δίκτυα. Εκπαιδεύοντας βαθιά νευρωνικά δίκτυα (I).
Εβδομάδα 11. Training Deep Neural Nets (II). Convolutional Neural Networks. Recurrent Neural Networks.
Εβδομάδα 12. Autoencoders. Reinforcement Learning. Το μέλλον της βαθιάς μάθησης.
Εβδομάδα 13. Υποβολή τελικής εργασίας.
 

Βιβλιογραφία

Βιβλιογραφία διαθέσιμη στο διαδικτυο καθώς και:
1. For Hands-on Machine Learning, Neural Networks and Deep Learning:
Hands-On Machine Learning with Scikit-Learn and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems by Aurelien Geron (2017).2. For a more thorough mathematical exposition (especially on the Deep Learning part): 
Deep Learning, by Goodfellow, Bengio and Courville (2016).