Στη σύγχρονη εποχή είναι αδιαμφισβήτητη πραγματικότητα πως τα «έξυπνα» κινητά τηλέφωνα αποτελούν κυρίαρχο στοιχείο της ζωής του ανθρώπου. Με το πάτημα ενός κουμπιού μπορεί κάποιος να ενημερωθεί για τις εξελίξεις παγκοσμίως, να επικοινωνήσει με άτομα από την άλλη άκρη του πλανήτη και να ψυχαγωγηθεί. Ειδικότερα, κύριος πόλος έλξης τους αποτελεί η φορητότητα τους, η οποία κατέστη δυνατή μέσω της αξιοποίησης των μπαταριών. Ωστόσο, αυτές διαθέτουν συγκεκριμένο αριθμό επαναφορτίσεων και συνεπώς, η διάρκεια ζωής μιας συσκευής εξαρτάται άμεσα από τον τύπο χρήσης της και τη στρατηγική επαναφόρτισης της.
Η παρούσα διπλωματική εργασία ασχολείται με την ανάλυση της χρήσης των κινητών τηλεφώνων και την εκτίμηση της κατανάλωσης ενέργειας (energy drain) της μπαταρίας τους. Αρχικά, για τη συλλογή των δεδομένων αναπτύχθηκε η εφαρμογή BatteryApp, η οποία περιοδικά καταγράφει τις λειτουργίες της συσκευής και τις πληροφορίες της μπαταρίας. Στη συνέχεια, ακολουθεί η ομαδοποίηση (clustering) όμοιων τύπων χρήσεων των συσκευών μέσω της ιεραρχικής ομαδοποίησης, η οποία δεν επιβάλει την εξ’ αρχής (apriori) επιλογή συγκεκριμένου αριθμού ομάδων και δεν εισάγει περιορισμούς στη συνάρτηση απόστασης που θα επιλεχθεί. Έπειτα, αυτή αξιολογείται ως προς το περιεχόμενό της, έτσι ώστε να επιλεγούν εκείνες οι ομάδες που περιέχουν την περισσότερη πληροφορία. Τέλος, για την εκτίμηση του energy drain, χρησιμοποιήθηκαν ένα απλό γραμμικό μοντέλο, δύο παραλλαγές της γραμμικής παλινδρόμησης, όπου εισάγεται η έννοια της ποινής (Ridge και Lasso Regression), και ένα μη γραμμικό μοντέλο, που ανήκει στην κατηγορία του Ensemble Learning (eXtreme Gradient Boosted trees), με τη διαδικασία μάθησης των παραμέτρων να πραγματοποιείται σε κάθε μια από τις επιλεγμένες ομάδες ξεχωριστά.
Full coverage of a priori known map from multiple robotic agents
Thesis presentation georgios-balaouras
1. ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ
ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ
ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ
ΤΟΜΕΑΣ ΗΛΕΚΤΡΟΝΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ
ΕΡΓΑΣΤΗΡΙΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΠΛΗΡΟΦΟΡΙΑΣ ΚΑΙ ΥΠΟΛΟΓΙΣΜΩΝ
Συλλογή και Ανάλυση Δεδομένων Κατανάλωσης Ενέργειας Κινητών
Τηλεφώνων με Χρήση Τεχνικών Μηχανικής Μάθησης
Γεώργιος Μπαλαούρας (ΑΕΜ: 8861)
Επιβλέποντες
Ανδρέας Συμεωνίδης, Αναπληρωτής Καθηγητής
Εμμανουήλ Τσαρδούλιας, Μεταδιδακτορικός Ερευνητής
Θεσσαλονίκη, Οκτώβριος 2020
2. Κίνητρο
• Smartphones: Κυρίαρχο στοιχείο της
καθημερινότητας
• Μπαταρία: Φορητότητα συσκευών
o Συγκεκριμένος αριθμός επαναφορτίσεων
• Αναγνώριση τύπων χρήσεων
o Βελτίωση σχεδιασμού συσκευών
o Καλύτερος έλεγχος αποφορτίσεων
Δευτέρα, 9 Νοεμβρίου 2020
Συλλογή και Ανάλυση Δεδομένων Κατανάλωσης Ενέργειας
Κινητών Τηλεφώνων με Χρήση Τεχνικών Μηχανικής Μάθησης
2
Σκοπός διπλωματικής
• Ανάπτυξη εφαρμογής BatteryApp
• Ομαδοποίηση όμοιων χρήσεων της συσκευής
• Εκτίμηση κατανάλωσης ενέργειας
3. Βιβλιογραφία
Εκτίμηση επιπέδου φόρτισης ( SOC)
• Συμβατικές τεχνικές
o Φυσικές ιδιότητες μπαταρίας
o Μεγάλα σφάλματα
• Model based τεχνικές
o Μοντέλο περιγραφής μπαταρίας
o Κατασκευή μοντέλου
o Προσδιορισμός παραμέτρων για διαφορετικές συνθήκες λειτουργίας
• Data driven τεχνικές
o Δεδομένα λειτουργίας μπαταρίας
o Ποσότητα και ποιότητα δεδομένων
Δευτέρα, 9 Νοεμβρίου 2020
Συλλογή και Ανάλυση Δεδομένων Κατανάλωσης Ενέργειας
Κινητών Τηλεφώνων με Χρήση Τεχνικών Μηχανικής Μάθησης
3
4. Ανάλυση μεθοδολογίας
Δευτέρα, 9 Νοεμβρίου 2020
Συλλογή και Ανάλυση Δεδομένων Κατανάλωσης Ενέργειας
Κινητών Τηλεφώνων με Χρήση Τεχνικών Μηχανικής Μάθησης
4
5. Ανάπτυξη εφαρμογής BatteryApp
• Foreground Service
• Περιοδική καταγραφή
o Δεδομένων λειτουργίας συσκευής
o Πληροφορίων μπαταρίας
• Ανώνυμα δεδομένα
Δευτέρα, 9 Νοεμβρίου 2020
Συλλογή και Ανάλυση Δεδομένων Κατανάλωσης Ενέργειας
Κινητών Τηλεφώνων με Χρήση Τεχνικών Μηχανικής Μάθησης
5
6. Προεπεξεργασία δεδομένων
• Σωστή δειγματοληψία
• Διπλότυπες εγγραφές
• Ύπαρξη μηδενικών, αρνητικών και ελλειπουσών τιμών
• Κανονικοποίηση χαρακτηριστικών στο [0, 1]
Δευτέρα, 9 Νοεμβρίου 2020
Συλλογή και Ανάλυση Δεδομένων Κατανάλωσης Ενέργειας
Κινητών Τηλεφώνων με Χρήση Τεχνικών Μηχανικής Μάθησης
6
7. Ορισμός παραθύρων χρήσης
• Σκοπός:
o Ομαλοποίηση δεδομένων
• Υπολογισμός τιμών:
o Αριθμητικά δεδομένα: μέσος όρος
o Κατηγορικά δεδομένα: majority vote
• Βέλτιστη χρονική διάρκεια:
o Ελαχιστοποίηση roughness penalty
o roughness penalty = i xi−2xi−1+xi−2
2
4
o Οπτικός έλεγχος γραφικών παραστάσεων
Δευτέρα, 9 Νοεμβρίου 2020
Συλλογή και Ανάλυση Δεδομένων Κατανάλωσης Ενέργειας
Κινητών Τηλεφώνων με Χρήση Τεχνικών Μηχανικής Μάθησης
7
8. Υπολογισμός energy drain
• energy drain ≠ επίπεδο φόρτισης
• Υπολογίζεται για κάθε αρχείο
Δευτέρα, 9 Νοεμβρίου 2020
Συλλογή και Ανάλυση Δεδομένων Κατανάλωσης Ενέργειας
Κινητών Τηλεφώνων με Χρήση Τεχνικών Μηχανικής Μάθησης
8
9. Ομαδοποίηση παραθύρων χρήσης (1/2)
• Ιεραρχική ομαδοποίηση
o Δενδρόγραμμα
o Χαρακτηριστικά χρήσης κινητού
• Αξιολόγηση ομαδοποίησης
o Συντελεστής συσχέτισης
Cophenetic (CPCC)
o Συντελεστής Silhouette
o Multidimensional scaling (MDS)
Δευτέρα, 9 Νοεμβρίου 2020
Συλλογή και Ανάλυση Δεδομένων Κατανάλωσης Ενέργειας
Κινητών Τηλεφώνων με Χρήση Τεχνικών Μηχανικής Μάθησης
9
10. Ομαδοποίηση παραθύρων χρήσης (2/2)
Δευτέρα, 9 Νοεμβρίου 2020
Συλλογή και Ανάλυση Δεδομένων Κατανάλωσης Ενέργειας
Κινητών Τηλεφώνων με Χρήση Τεχνικών Μηχανικής Μάθησης
10
11. Εκτίμηση energy drain (1/2)
• Μέθοδοι Παλινδρόμησης
o Γραμμικό μοντέλο
o Ridge & Lasso
o eXtreme Gradient Boosted trees
• Εκπαίδευση
o 75% training data - 25% test data
• Αξιολόγηση Παλινδρόμησης
o ΜΑΕ
o RMSE
Δευτέρα, 9 Νοεμβρίου 2020
Συλλογή και Ανάλυση Δεδομένων Κατανάλωσης Ενέργειας
Κινητών Τηλεφώνων με Χρήση Τεχνικών Μηχανικής Μάθησης
11
12. Εκτίμηση energy drain (2/2)
• Αρχικός υπολογισμός υπερπαραμέτρων
o Ridge & Lasso: alpha
o xgboost: n_estimators, learning rate, max_depth, colsample_bytree, reg_lambda
o Αναζήτηση πλέγματος
3-fold Cross validation
• Επιλογή χαρακτηριστικών
• Ρύθμιση υπερπαραμέτρων
Δευτέρα, 9 Νοεμβρίου 2020
Συλλογή και Ανάλυση Δεδομένων Κατανάλωσης Ενέργειας
Κινητών Τηλεφώνων με Χρήση Τεχνικών Μηχανικής Μάθησης
12
13. Πείραμα 1: Μεμονωμένος χρήστης (1/6)
• Ομαδοποίηση
o CPCC: Complete (0.85) – Average (0.87)
o Silhouette: Complete 5 ομάδες (0.63) – Average 4 ομάδες (0.62)
• Αξιολόγηση ομάδων
Δευτέρα, 9 Νοεμβρίου 2020
Συλλογή και Ανάλυση Δεδομένων Κατανάλωσης Ενέργειας
Κινητών Τηλεφώνων με Χρήση Τεχνικών Μηχανικής Μάθησης
13
14. Πείραμα 1: Μεμονωμένος χρήστης (2/6)
Θηκογράμματα χρήσης
Δευτέρα, 9 Νοεμβρίου 2020
Συλλογή και Ανάλυση Δεδομένων Κατανάλωσης Ενέργειας
Κινητών Τηλεφώνων με Χρήση Τεχνικών Μηχανικής Μάθησης
14
15. Πείραμα 1: Μεμονωμένος χρήστης (3/6)
Οπτικοποίηση MDS
Δευτέρα, 9 Νοεμβρίου 2020
Συλλογή και Ανάλυση Δεδομένων Κατανάλωσης Ενέργειας
Κινητών Τηλεφώνων με Χρήση Τεχνικών Μηχανικής Μάθησης
15
16. Πείραμα 1: Μεμονωμένος χρήστης (4/6)
• Αρχική αναζήτηση πλέγματος • Επιλογή χαρακτηριστικών
o Feature importance: 0.037 (10)
Δευτέρα, 9 Νοεμβρίου 2020
Συλλογή και Ανάλυση Δεδομένων Κατανάλωσης Ενέργειας
Κινητών Τηλεφώνων με Χρήση Τεχνικών Μηχανικής Μάθησης
16
-40%
17. Πείραμα 1: Μεμονωμένος χρήστης (5/6)
Πρόβλεψη energy drain
Δευτέρα, 9 Νοεμβρίου 2020
Συλλογή και Ανάλυση Δεδομένων Κατανάλωσης Ενέργειας
Κινητών Τηλεφώνων με Χρήση Τεχνικών Μηχανικής Μάθησης
17
18. Πείραμα 1: Μεμονωμένος χρήστης (6/6)
Δευτέρα, 9 Νοεμβρίου 2020
Συλλογή και Ανάλυση Δεδομένων Κατανάλωσης Ενέργειας
Κινητών Τηλεφώνων με Χρήση Τεχνικών Μηχανικής Μάθησης
18
19. Συμπεράσματα
• Η ομαδοποίηση βασίστηκε στα δυαδικά χαρακτηριστικά
• Ισχυρά μη γραμμικό πρόβλημα
• Αδυναμία στην πρόβλεψη των μεγάλων τιμών
• Φωτεινότητα οθόνης, φορτίο επεξεργαστή, θερμοκρασία και επίπεδο
μπαταρίας συμμετέχουν σημαντικά στην πρόβλεψη
• Καλύτερα αποτελέσματα για μια συσκευή
Δευτέρα, 9 Νοεμβρίου 2020
Συλλογή και Ανάλυση Δεδομένων Κατανάλωσης Ενέργειας
Κινητών Τηλεφώνων με Χρήση Τεχνικών Μηχανικής Μάθησης
25
20. Μελλοντικές επεκτάσεις
• Καταγραφή περισσοτέρων δεδομένων χρήσης
• Ενσωμάτωση μοντέλου μηχανικής μάθησης εντός της εφαρμογής
• Απόκτηση στατιστικών πληροφοριών χρηστών
• Δοκιμή περισσότερων αλγορίθμων ομαδοποίησης και παλινδρόμησης
Δευτέρα, 9 Νοεμβρίου 2020
Συλλογή και Ανάλυση Δεδομένων Κατανάλωσης Ενέργειας
Κινητών Τηλεφώνων με Χρήση Τεχνικών Μηχανικής Μάθησης
26
21. Ευχαριστίες
Ευχαριστώ θερμά:
• Τον αναπληρωτή καθηγητή κ. Ανδρέα Συμεωνίδη
• Τον μεταδιδακτορικό ερευνητή κ. Εμμανουήλ Τσαρδούλια
• Τους χρήστες της εφαρμογής
Δευτέρα, 9 Νοεμβρίου 2020
Συλλογή και Ανάλυση Δεδομένων Κατανάλωσης Ενέργειας
Κινητών Τηλεφώνων με Χρήση Τεχνικών Μηχανικής Μάθησης
27
22. Ευχαριστώ πολύ για την προσοχή σας!
Δευτέρα, 9 Νοεμβρίου 2020
Συλλογή και Ανάλυση Δεδομένων Κατανάλωσης Ενέργειας
Κινητών Τηλεφώνων με Χρήση Τεχνικών Μηχανικής Μάθησης
28