Με τη ραγδαία εξέλιξη της τεχνολογίας και τη συνεχώς αυξανόμενη διείσδυσή της στην καθημερινότητα, τα τελευταία χρόνια δίνεται ολοένα και μεγαλύτερο βάρος στην αυτοματοποιημένη λήψη αποφάσεων από υπολογιστικά συστήματα. Συνεπώς η προσοχή μας στρέφεται ολοένα και περισσότερο στην εφαρμογή τεχνικών Μηχανικής Μάθησης (Machine Learning), δηλαδή στον τρόπο με τον οποίο ένα υπολογιστικό σύστημα μπορεί να εκπαιδευτεί, προκειμένου να είναι σε θέση να λάβει τις ζητούμενες αποφάσεις. Πέρα από τα κλασικά πεδία εφαρμογής, ενδιαφέρον παρουσιάζουν οι εφαρμογές αυθεντικοποίησης (authentication) που συναντάμε καθημερινά, όπως η ταυτοποίηση μέσω αναγνώρισης προσώπου (face recognition) ή δακτυλικού αποτυπώματος (fingerprint). Πιο συγκεκριμένα, η Μηχανική Όραση (Computer Vision) είναι ο κλάδος της Τεχνητής Νοημοσύνης (Artificial Intelligence) που ασχολείται με την αντίληψη του υπολογιστή μέσω εικόνων, με απώτερο στόχο την εξομοίωση της λειτουργίας του ανθρώπινου ματιού. Όμως, καθώς τα υπολογιστικά συστήματα βρίσκονται σε θέση να αναγνωρίζουν αντικείμενα, πολύ συχνά συναντάται η περίπτωση όπου κάποια από αυτά αξιολογούνται λανθασμένα. Αν λάβει κανείς υπόψη του τη σημασία και τη σπουδαιότητα των αποφάσεων που καλούνται να λάβουν οι υπολογιστές, γίνεται αμέσως αντιληπτό πως δεν υπάρχουν περιθώρια για τέτοιου είδους σφάλματα. Για τον λόγο αυτό γίνεται έρευνα γύρω από τις ευπάθειες των υπολογιστικών συστημάτων, προκειμένου να εντοπιστούν και να ληφθούν τα απαραίτητα μέτρα. Κάθε μοντέλο λήψης αποφάσεων αντιλαμβάνεται ένα πλήθος αντικειμένων και τα αξιολογεί σύμφωνα με την εκπαίδευση που έχει λάβει. Στην παρούσα διατριβή μελετάται και αξιολογείται ένα σύνολο μοντέλων νευρωνικών δικτύων βαθειάς μάθησης ως προς την ευρωστία τους, δηλαδή την ικανότητά τους να αντεπεξέρχονται σε συνθήκες που τα ωθούν σε λανθασμένες αποφάσεις. Επίσης μέσω της μελέτης αυτής επιδιώκεται η ανάδειξη των αποτελεσματικότερων μεθόδων δημιουργίας εύρωστων μοντέλων, καθώς και μεθόδων πουαποσκοπούν στην περεταίρω θωράκιση ήδη υπαρχόντων μοντέλων.
2. Σκοπός της διπλωματικής εργασίας
• Μελέτη και ανάδειξη μεθόδων με στόχο την
αποτελεσματική αξιολόγηση της ευρωστίας των
ταξινομητών – νευρωνικών δικτύων
• Δημιουργία περισσότερο εύρωστων νευρωνικών
δικτύων
• Βελτίωση ευρωστίας – θωράκιση ήδη
αναπτυγμένων (deployed) νευρωνικών δικτύων
30/10/2020 Ευρωστία νευρωνικών δικτύων βαθειάς μάθησης 2
3. Γνώσεις που αποκτήθηκαν
• Είδη ταξινομητών – νευρωνικών δικτύων ανάλογα
με την αρχιτεκτονική και το σετ δεδομένων που
χρησιμοποιείται
• Εναλλακτικές μέθοδοι εκπαίδευσης ως τεχνικές
δημιουργίας πιο εύρωστων νευρωνικών δικτύων
• Είδη παραμορφώσεων στα δεδομένα εισόδου
30/10/2020 Ευρωστία νευρωνικών δικτύων βαθειάς μάθησης 3
4. Γνώσεις που αποκτήθηκαν
• Επιθετικές μέθοδοι με σκοπό την έκθεση των
ευπαθειών των νευρωνικών δικτύων
• Αμυντικές μέθοδοι για τη θωράκιση των
ταξινομητών – νευρωνικών δικτύων ως προς τις
αδυναμίες τους
• Μετρικές αξιολόγησης των ταξινομητών ως προς
την ευρωστία τους
30/10/2020 Ευρωστία νευρωνικών δικτύων βαθειάς μάθησης 4
5. Ορισμός ευρωστίας
• Έστω χώρος 𝐿𝑝 και ένα δείγμα εισόδου 𝑥 το οποίο
ανήκει στην κλάση 𝑦 και 𝑥′ το παραμορφωμένο
δείγμα εισόδου τέτοιο, ώστε να ταξινομείται στην
κλάση 𝑦′.
• Ευρωστία: 𝑟𝑝𝑥
= 𝑚𝑖𝑛 ∥ (𝑥 − 𝑥′
) ∥𝑝, ∀𝑥′ ⇾ 𝑦′ ≠ 𝑦
30/10/2020 Ευρωστία νευρωνικών δικτύων βαθειάς μάθησης 5
6. Μεθοδολογία
• Εγκατάσταση-εργαλεία
• Python 3.7
• Keras (Tensorflow)
• ART (Advesarial Robustness Toolbox)
• Δημιουργία νευρωνικών δικτύων με
διαφοροποιήσεις ως προς τα σετ δεδομένων
(MNIST, CIFAR-10), τις ιδιαιτερότητες των μεθόδων
εκπαίδευσης (A.T., G.D.A.) και τις αρχιτεκτονικές
(C.N.N., D.N.N.)
30/10/2020 Ευρωστία νευρωνικών δικτύων βαθειάς μάθησης 6
7. Μεθοδολογία
• Αξιολόγηση της ευρωστίας των νευρωνικών
δικτύων με χρήση μετρικής (Empirical Robustness)
• Εξέταση αποτελεσματικότητας (Accuracy)
αμυντικών μεθόδων προεπεξεργασίας (F.S., T.V.M.,
S.S.) απέναντι σε κορυφαίες επιθέσεις (E.A.D.,
C.&W., P.G.D.)
30/10/2020 Ευρωστία νευρωνικών δικτύων βαθειάς μάθησης 7
11. Συμπεράσματα
• Gaussian Data Augmentation (G.D.A.)> Adversarial
Training (A.T.) > Standard Training
• Απλή αρχιτεκτονική + σετ δεδομένων χαμηλής
διαστασιμότητας => υψηλότερη ευρωστία
• Feature Squeezing (F.S.) -> ιδανική για
ασπρόμαυρα σετ δεδομένων (MNIST)
• Total Variance Minimization (T.V.M.)-> σταθερά
αποτελέσματα σε όλες τις περιπτώσεις
• Spatial Smoothing (S.S.)-> ιδανική για τοπικές
παραμορφώσεις (νόρμες 𝑙1 και 𝑙2)
30/10/2020 Ευρωστία νευρωνικών δικτύων βαθειάς μάθησης 11
12. Μελλοντική Εργασία
• Συγκριτική μελέτη άλλων σετ δεδομένων και
αρχιτεκτονικών
• Μελέτη επίδρασης άλλων κατανομών θορύβου
κατά την εκπαίδευση
• Μία μετρική ευρωστίας ως κοινό σημείο
αναφοράς
30/10/2020 Ευρωστία νευρωνικών δικτύων βαθειάς μάθησης 12
13. Ευχαριστίες:
• Σε όλους τους ανθρώπους που με στήριξαν στην
προσπάθειά μου!
• Σε όλους τους υπόλοιπους, για την προσοχή σας!
30/10/2020 Ευρωστία νευρωνικών δικτύων βαθειάς μάθησης 13