Basketball data analytics via Machine Learning techniques using the REMEDES system

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ
ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ
ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ
ΤΟΜΕΑΣ ΗΛΕΚΤΡΟΝΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ
ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ
ΑΝΑΛΥΣΗ ΑΘΛΗΤΙΚΩΝ ΕΠΙΔΟΣΕΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΤΟΥ ΣΥΣΤΗΜΑΤΟΣ
REMEDES
ΕΚΠΟΝΗΣΗ:
ΒΑΣΙΛΕΙΟΣ ΜΠΕΛΛΟΣ [8715]
ΕΠΙΒΛΕΨΗ:
ΑΝΤΡΕΑΣ ΣΥΜΕΩΝΙΔΗΣ
ΕΜΜΑΝΟΥΗΛ ΤΣΑΡΔΟΥΛΙΑΣ
ΘΩΜΑΣ ΚΑΡΑΝΙΚΙΩΤΗΣ

ΕΙΣΑΓΩΓΗ
Αντικείμενο της παρούσας διπλωματικής είναι:
Η ανάλυση αθλητικών επιδόσεων στην καλαθοσφαίριση, με τη βοήθεια του συστήματος REMEDES
Σκοπός της διπλωματικής εργασίας:
Η ανάπτυξη ενός μοντέλου αξιολόγησης αθλητών καλαθοσφαίρισης:
• Αξιολόγηση σε συγκεκριμένα χαρακτηριστικά
• Συνολική αξιολόγηση
Extras:
• Γίνεται χρήση της γλώσσας προγραμματισμού Python
• Συλλογή δεδομένων από ένα πλήθος τριάντα χρηστών (Δέκα αθλητές, δέκα μη αθλητές και δέκα αθλητές
καλαθοσφαίρισης)
• Όλοι οι χρήστες εκτέλεσαν ένα σετ ασκήσεων που διαμορφώθηκε λαμβάνοντας υπόψη κινήσεις που
εκτελούνται συχνά κατά τη διάρκεια ενός αγώνα.
• Για τη δημιουργία του μοντέλου αξιολόγησης χρησιμοποιούνται τεχνικές Μηχανικής Μάθησης
• Αλγόριθμος παλινδρόμησης: Support Vector for Regression (SVR)

Επιστήμη των δεδομένων:
Πρόκειται για έναν συνδυασμό της στατιστικής, της ανάλυσης - εξόρυξης δεδομένων και της μηχανικής
μάθησης.
Αθλητισμός και επιστήμη δεδομένων:
Τα πρώτα δείγματα αυτής της συνεργασίας, δεδομένων και αθλητισμού, ξεκίνησαν δειλά το 2003 στον χώρο
του επαγγελματικού Baseball με τη κυκλοφορία του “Moneyball” , βιβλίο ορόσημο για την εξέλιξη του
αθλητισμού και συνεχίζονται μέχρι σήμερα, με μεγαλύτερη και εντονότερη παρουσία στον χώρο της
καλαθοσφαίρισης και πιο συγκεκριμένα στον μαγικό κόσμο του NBA.
Καλαθοσφαίριση και επιστήμη δεδομένων:
• Ανάλυση αντιπάλων
• Προετοιμασία αγώνα
• Προπόνηση
• Επιλογή παιχτών
• Αποφυγή τραυματισμών
• Λήψη αποφάσεων κατά τη διάρκεια του αγώνα

Σύστημα REMEDES:
Αποτελεί ένα σύστημα προσανατολισμένο στην μέτρηση και καταγραφή αντανακλαστικών και αντίδρασης με υψηλή
ακρίβεια, κάνοντας χρήση οπτικών ή/και ακουστικών ερεθισμάτων.
Το σύστημα Remedes αποτελείται από:
• Remedes Pads με τα καλώδια τροφοδοσίας/φόρτισής τους.
• Ένα Remedes Master Pad με το καλώδιο τροφοδοσίας/φόρτισής του.
• USB Hubs για την φόρτιση των Pads.
• Ένα προ-ρυθμισμένο Access Point.
• Ένα power-bank 15000mAh.
Τύποι ασκήσεων REMEDES:
• Ασκήσεις κατά βήμα
• Αυτοματοποιημένες ασκήσεις
• Δημιουργία άσκησης με πρότυπο
Θεωρητικό Υπόβαθρο:

Χαρακτηριστικά
(Features) που
χρησιμοποιήθηκαν:
mean_response: Μέσος χρόνος αντίδρασης.
successes%: Το ποσοστό επιτυχίας απενεργοποίησης των Pads.
median_response: Χρόνος διάμεσης απόκρισης.
max_response: Χρόνος μέγιστης απόκρισης.
min_response: Χρόνος ελάχιστης απόκρισης.
q10, q25, q75, q90: Τα αντίστοιχα quartiles.
start_mean: Ο μέσος χρόνος αντίδρασης στην αρχή της άσκησης.
start successes%: Το ποσοστό επιτυχίας απενεργοποίησης στην αρχή της άσκησης.
start_std: Η τυπική απόκλιση των αποκρίσεων στην αρχή της άσκησης.
middle_mean: Ο μέσος χρόνος αντίδρασης στη μέση της άσκησης.
middle successes%: Το ποσοστό επιτυχίας απενεργοποίησης στη μέση της άσκησης.
middle_std: Η τυπική απόκλιση των αποκρίσεων στη μέση της άσκησης.
end_mean: Ο μέσος χρόνος αντίδρασης στο τέλος της άσκησης.
end successes%: Το ποσοστό επιτυχίας απενεργοποίησης στο τέλος της άσκησης.
end_std: Η τυπική απόκλιση των αποκρίσεων στο τέλος της άσκησης.
dm_errors: Λάθη απόφασης (decision making errors).
status: Περιγράφει την κατάσταση του χρήστη (pro, athlete, noob).

Τεχνολογικό Υπόβαθρο:
Προ-επεξεργασία δεδομένων (Data Preprocessing):
• Καθαρισμός Δεδομένων (Data Cleaning): Είναι η διαδικασία εντοπισμού και διόρθωσης ή διαγραφής λάθους ή μη ακριβούς
πληροφορίας (Dirty Data).
• Μείωση σετ δεδομένων (Dataset Reduction ή Instance Selection): Πρόκειται για τη μείωση του αρχικού σετ δεδομένων, σε
ένα μικρότερο πιο ουσιώδους και πιο εύκολο στη χρήση. Ειδικά για προβλήματα μηχανικής μάθησης θα πρέπει να
αφαιρεθούν και τα χαρακτηριστικά, που δεν μπορούν να χρησιμοποιηθούν σαν είσοδος στο ML μοντέλο.
• Κανονικοποίηση (Normalization): Στόχος είναι ο μετασχηματισμός των αριθμητικών δεδομένων σε τιμές που θα αποφέρουν
καλύτερα αποτελέσματα και θα μειώσουν την εξάρτηση μεταξύ διαφόρων χαρακτηριστικών.
• Μείωση Διαστάσεων (Dimensionality Reduction): Πρόκειται για το μετασχηματισμό των δεδομένων από έναν χώρο
πολλών διαστάσεων, σε μια αναπαράσταση ενός χώρου μικρότερων διαστάσεων, διατηρώντας όμως όσο το δυνατόν
περισσότερη πληροφορία.

Μηχανική μάθηση (Machine Learning - ML)
Η μηχανική μάθηση αναπτύχθηκε από τη μελέτη της αναγνώρισης προτύπων και ορίστηκε από τον
Άρθουρ Σάμιουελ το 1959 ως “το πεδίο μελέτης που δίνει στους υπολογιστές την ικανότητα να
μαθαίνουν χωρίς να έχουν ρητά προγραμματιστεί”.
 Επιτηρούμενη Μάθηση (Supervised Learning):
Αποτελεί ένα πρόβλημα για το οποίο υπάρχει γνώση των
ανεξάρτητων μεταβλητών, αλλά και της εξαρτημένης
μεταβλητής. Έτσι εκπαιδεύοντας κάποιο ML μοντέλο με τα ήδη
γνωστά δεδομένα, υπάρχει η δυνατότητα πρόβλεψης της εξόδου
για νέα δεδομένα εισόδου.
 Μη επιτηρούμενη μάθηση (Unsupervised Learning):
Σε αυτή την περίπτωση ενώ είναι γνωστές οι ανεξάρτητες
μεταβλητές, δεν υπάρχει γνώση της εξαρτημένης μεταβλητής η
αλλιώς της εξόδου. Στόχος του Unsupervised Learning είναι να
ανακαλύψει τη δομή των δεδομένων εισόδου και παρόλο που
δεν είναι ένα καλά ορισμένο πρόβλημα, τα αποτελέσματα του
μπορεί να είναι πολύ ισχυρά
Κύριοι τύποι προβλημάτων ML:
 Ταξινόμηση (Classification):
Η ταξινόμηση είναι ένα πρόβλημα επιτηρούμενης μάθησης και έχει ως
στόχο να μπορεί να ταξινομήσει σε μια κλάση (εξαρτημένη
μεταβλητή), πρότερα μη γνωστές εγγραφές (ανεξάρτητες μεταβλητές
εκπαίδευσης), με όσο το δυνατόν μεγαλύτερη ακρίβεια.
 Παλινδρόμηση (Regression):
Η λογική της παλινδρόμησης είναι ίδια με αυτής της ταξινόμησης, με
τη μόνη διαφορά πως αντί για διακριτές τιμές στην κλάση, έχουμε
συνεχείς αριθμητικές τιμές.
 Ομαδοποίηση (Clustering):
Αποτελεί ένα πρόβλημα μη επιτηρούμενης μάθησης, με στόχο να
μπορεί να διαχωρίσει τα δεδομένα σε υποομάδες με κοινά
χαρακτηριστικά. Το ανορθόδοξο με το clustering είναι ότι τα κριτήρια
με τα οποία θέλουμε να διαχωρίσουμε τα δεδομένα δεν είναι γνωστά,
αλλά πρέπει να αναγνωριστούν στην πορεία.

Support Vector
for Regression
(SVR)
Εφευρέθηκε πίσω
στη δεκαετία του
'90 από τον
Vladimir Vapnik και
τους συναδέλφους
του.
Linear Regression Linear SVR

Kernel SVR:
Ένας “kernel” είναι ουσιαστικά
μια μαθηματική συνάρτηση,
που δέχεται ως είσοδο τα
δεδομένα και τα μετατρέπει
στην επιθυμητή μορφή. Οι
μορφές ποικίλουν. Μπορεί να
είναι γραμμική μορφή (linear),
μη γραμμική (non-linear),
πολυωνυμική (polynomial),
σιγμοειδής (sigmoid),
ακτινικής συνάρτησης βάσης
(Radial Basis Function - RBF),
κ.α.. Παρακάτω παρουσιάζεται
ένα παράδειγμα “Non-Linear
SVR” αλγορίθμου με RBF
Kernel.

Μέτρα αξιολόγησης:
F-Score:
Είναι ένα μέτρο της ακρίβειας ενός μοντέλου ταξινόμησης σε ένα σύνολο δεδομένων.
Όπου:
*(tp = true positives, fp = false positives, fn = false negatives)
Προφανώς επειδή γίνεται χρήση ενός αλγορίθμου παλινδρόμησης, θα πρέπει να στρογγυλοποιηθούν οι προβλέψεις στην πιο “κοντινή”
κατηγορία πριν χρησιμοποιηθεί το μετρικό F-Score.

R2 Squared:
Όπου SS(res/tot) το άθροισμα των τετραγώνων των αποκλίσεων, όπως ακριβώς φαίνεται και στις εικόνες που ακολουθούν:
Συνήθως το “R2” κυμαίνεται από μηδέν έως ένα με τη δυνατότητα φυσικά να πάρει και αρνητικές τιμές πράγμα που θα σήμαινε ένα πάρα
πολύ κακό μοντέλο. Όσο μικρότερο το άθροισμα των τετραγώνων των αποκλίσεων (SSres), τόσο μεγαλύτερο το “R Squared” άρα και το
μοντέλο είναι καλύτερο.

Mean Squared Error:
Το σφάλμα MSE ή αλλιώς Mean Squared είναι μία από τα προτιμώμενα μετρικά αξιολόγησης για προβλήματα
παλινδρόμησης. Πρόκειται για τον μέσο όρο της τετραγωνικής διαφοράς μεταξύ της πραγματικής τιμής και της τιμής που
προβλέπεται από το μοντέλο παλινδρόμησης. Καθώς τετραγωνίζει τις διαφορές, τιμωρεί ακόμη και ένα μικρό σφάλμα και
οδηγεί σε υπερεκτίμηση του πόσο κακό είναι το μοντέλο.

Root Mean Squared Error:
Το RMSE είναι η πιο ευρέως χρησιμοποιούμενη αξιολόγηση για προβλήματα παλινδρόμησης, αντιπροσωπεύει την τυπική
απόκλιση του δείγματος και είναι η τετραγωνική ρίζα της μέσης τετραγωνικής διαφοράς, μεταξύ της πραγματικής τιμής
και της τιμής που προβλέπεται από το μοντέλο. Προτιμάται περισσότερο σε ορισμένες περιπτώσεις, επειδή τα σφάλματα
τετραγωνίζονται πρώτα πριν από τον μέσο όρο, γεγονός που θέτει υψηλή ποινή σε μεγάλα σφάλματα. Αυτό σημαίνει ότι το
RMSE είναι χρήσιμο όταν τα μεγάλα σφάλματα είναι ανεπιθύμητα.

Mean Absolute Error:
Το MAE είναι η απόλυτη διαφορά μεταξύ της πραγματικής τιμής και της τιμής που προβλέπεται από το μοντέλο. Η MAE
είναι πιο ισχυρή στις ακραίες τιμές και δεν τιμωρεί τα σφάλματα τόσο αυστηρά όσο το MSE. Το MAE είναι ένα γραμμικό
μετρικό αξιολόγησης, που σημαίνει ότι όλες οι μεμονωμένες διαφορές έχουν την ίδια αξία. Δεν είναι κατάλληλο για
προβλήματα όπου χρειάζεται να δώσουμε μεγαλύτερη προσοχή στις ακραίες τιμές.

K-Means:
Ο αλγόριθμος K-Means, βασίζεται στην τεχνική της διαίρεσης και αποτελεί έναν αλγόριθμο ομαδοποίησης, όπως αρχικά είχε προταθεί από τον J.B.MacQueen.
Βήμα 1ο: Επιλέγεται το Κ, δηλαδή τον
αριθμό των ομάδων όπου θέλουμε να
διαχωρίσουμε τα δεδομένα.
Βήμα 2ο: Επιλέγονται τυχαία K σημεία (όχι
αναγκαστικά από το σετ δεδομένων) ως
κέντρα (centroids) των ομάδων (clusters).
Βήμα 3ο: Κάθε σημείο του σετ δεδομένων
τοποθετείται σε μία ομάδα από το κέντρο
της οποίας έχει την μικρότερη απόσταση.
Έτσι δημιουργούνται Κ ομάδες.
Βήμα 4ο: Έχοντας υπόψιν τις νέες ομάδες
επανατοποθετούνται τα κέντρα. .
Βήμα 5ο: Επανατοποθετείται κάθε σημείο
του σετ δεδομένων σε μία ομάδα, από το
κέντρο της οποίας έχει την μικρότερη
απόσταση.
*Τα βήματα 4 & 5 επαναλαμβάνονται μέχρι
να μην υπάρξει νέα αλλαγή στις ομάδες.

Αξιολόγηση των ομάδων του K-Means:
Η πιο συνήθης αξιολόγηση των ομάδων είναι το άθροισμα του τετραγώνου σφαλμάτων (Sum of Squared
Error – SSE/WCSS) . Σφάλμα αποτελεί η απόσταση του κάθε σημείου από το κέντρο της κοντινότερης
ομάδας.
Elbow Method:
Tο SSE/WCSS μπορεί να χρησιμοποιηθεί και για τον υπολογισμό του βέλτιστου αριθμού των ομάδων. όσο μεγαλώνει ο αριθμός των ομάδων,
τόσο μικρότερες θα είναι οι ομάδες και επομένως θα ελαχιστοποιείται και το σφάλμα.
Τελικά η καλύτερη επιλογή είναι το K για το οποίο το SSE μειώνεται
απότομα.

Ασκησιολόγιο REMEDES
Άσκηση 1 – Man in the Middle:
Αριθμός Pads: 6
Χαρακτηριστικά: Γρήγορα Χέρια (Active Hands), Περιφερειακή Όραση
Τύπος άσκησης: Αυτοματοποιημένη
Τα pads βρίσκονται πάνω στην ίδια κάθετη επιφάνεια και ενεργοποιούνται τυχαία.
A. Χρόνοι αντίδρασης αναγνώρισης (Recognition RT): Ανάλογα με το χρώμα, πράσινο ή κόκκινο, θα πρέπει να απενεργοποιούνται ή
όχι.
B. Χρόνοι αντίδρασης αναγνώρισης και επιλογής (Recognition & Choice RT): Ανάλογα με το χρώμα (πράσινο, μπλε ή κόκκινο) θα
πρέπει να απενεργοποιούνται ή όχι. Το πράσινο χρώμα σημαίνει ότι το συγκεκριμένο pad θα πρέπει να απενεργοποιηθεί με το δεξί
χέρι, ενώ το μπλε με το αριστερό. Στο κόκκινο χρώμα δεν πρέπει να υπάρξει καμία αντίδραση.

Άσκηση 2 – Crossovers in Motion:
Χαρακτηριστικά: Ballhandling, Επιτάχυνση - Πρώτο Βήμα
Τύπος άσκησης: Κατά βήμα
Τα Pads ενεργοποιούνται διαδοχικά, από το pad1 έως το pad6 και αντίστροφα. Ο αθλητής πριν απενεργοποιήσει το εκάστοτε pad,
πρέπει να εκτελέσει σταυρωτή ντρίμπλα ενώ είναι σε κίνηση.
A. Απλοί χρόνοι αντίδρασης (Simple RT): Ο αθλητής εκτελεί μόνο απλή σταυρωτή ντρίμπλα.
B. Απλοί χρόνοι αντίδρασης (Simple RT): Ο αθλητής εκτελεί μόνο σταυρωτή ντρίμπλα κάτω από τα πόδια.
C. Απλοί χρόνοι αντίδρασης (Simple RT): Ο αθλητής εκτελεί μόνο σταυρωτή ντρίμπλα πίσω από την πλάτη.
D. Χρόνοι αντίδρασης επιλογής (Choice RT): Ανάλογα με το χρώμα (πράσινο, μπλε ή κόκκινο) που ενεργοποιείται ένα pad, ο αθλητής
εκτελεί συγκεκριμένο τύπο σταυρωτής ντρίπλας (απλή, κάτω από τα πόδια, πίσω από τη πλάτη).

Άσκηση 3 – Static Crossovers:
Χαρακτηριστικά: Ballhandling, Γρήγορα Χέρια (Active Hands)
Τα Pads ενεργοποιούνται τυχαία. Πριν απενεργοποιήσει το εκάστοτε pad, ο αθλητής πρέπει να εκτελέσει σταυρωτή ντρίμπλα στατικά.
A. Απλοί χρόνοι αντίδρασης (Simple RT): Ο αθλητής εκτελεί μόνο απλή σταυρωτή ντρίμπλα.
B. Απλοί χρόνοι αντίδρασης (Simple RT): Ο αθλητής εκτελεί μόνο σταυρωτή ντρίμπλα κάτω από τα πόδια.
C. Απλοί χρόνοι αντίδρασης (Simple RT): Ο αθλητής εκτελεί μόνο σταυρωτή ντρίμπλα πίσω από την πλάτη.
D. Χρόνοι αντίδρασης επιλογής (Choice RT): Ανάλογα με το χρώμα (πράσινο, μπλε ή κόκκινο) που ενεργοποιείται ένα pad, ο αθλητής
εκτελεί συγκεκριμένο τύπο σταυρωτής ντρίπλας (απλή, κάτω από τα πόδια, πίσω από τη πλάτη).

Άσκηση 4 – Quick Feet:
Χαρακτηριστικά: Footwork
Τα Pads ενεργοποιούνται με τυχαία σειρά. Ο αθλητής καθ’ όλη τη διάρκεια της άσκησης κρατάει τα πόδια του σε κίνηση, παρόλο που ο
ίδιος είναι στατικός.
A. Απλοί χρόνοι αντίδρασης (Simple RT): Ο αθλητής απενεργοποιεί τα pads εναλλάξ, μία με το δεξί πόδι και μία με το αριστερό,
εκτελώντας συγκεκριμένο footwork.
B. Χρόνοι αντίδρασης επιλογής (Choice RT): Ο αθλητής ανάλογα με το χρώμα του Pad (πράσινο ή μπλε), θα το απενεργοποιεί με το
αντίστοιχο πόδι (δεξί ή αριστερό).

Άσκηση 5 – Kick, Slide & Run Defense:
Χαρακτηριστικά: Πλάγια Βήματα, Ταχύτητα
Ο αθλητής βρίσκεται σε στάση άμυνας και καλείται να απενεργοποιήσει τα Pads, τα οποία ενεργοποιούνται με τυχαία σειρά. Αν
ανάψουν διαδοχικά δύο διπλανά Pads, τότε ο αθλητής θα πρέπει να κινηθεί με πλάγια βήματα άμυνας, ενώ σε διαφορετική περίπτωση
θα πρέπει να εκτελέσει τη τεχνική running defense.
A. Απλοί χρόνοι αντίδρασης (Simple RT): Το ερέθισμα που δέχεται ο αθλητής από την ενεργοποίηση του κάθε pad είναι οπτικό-
ακουστικό.
B. Απλοί χρόνοι αντίδρασης (Simple RT): Το ερέθισμα που δέχεται ο αθλητής από την ενεργοποίηση του κάθε pad είναι μόνο οπτικό.

Άσκηση 6 – Footwork:
Χαρακτηριστικά: Footwork
Τα Pads ενεργοποιούνται με τυχαία σειρά. Ο αθλητής πρέπει να απενεργοποιήσει το εκάστοτε pad με συγκεκριμένο τρόπο (Footwork)
χρησιμοποιώντας τα πόδια του. Ο αθλητής κινείται πάντα πάνω στην ευθεία των pads και τα απενεργοποιεί, περνώντας πάνω από αυτά.
A. Απλοί χρόνοι αντίδρασης (Simple RT): Χρησιμοποιώντας αμυντικά γλιστρήματα (kick - slide footwork). Ο αθλητής ξεκινάει την
κίνηση του με το πόδι που βρίσκεται προς το συγκεκριμένο pad.
B. Απλοί χρόνοι αντίδρασης (Simple RT): Χρησιμοποιώντας άλματα.
C. Απλοί χρόνοι αντίδρασης (Simple RT): Ο αθλητής περνάει πάντα και τα δύο του πόδια (εναλλάξ) πάνω από το pad που θέλει να
απενεργοποιήσει. Η κίνηση ξεκινάει με το πόδι που βρίσκεται προς το συγκεκριμένο pad (Two feet sideways footwork).

Άσκηση 7 – Rip & First Step:
Ο αθλητής βρίσκεται σε στάση απειλής μπροστά από το pad3, κρατώντας τη μπάλα μπροστά από το στήθος του. Έπειτα ενεργοποιείται
το pad3 και στη συνέχεια ένα από τα pad2 ή pad1. Ο κάτοχος της μπάλας πρέπει να τραβήξει με δύναμη τη μπάλα του χαμηλά (rip)
πάνω από το pad3, ώστε να το απενεργοποιήσει και αμέσως χρησιμοποιώντας μία ή το πολύ δύο ντρίπλες, να φτάσει να
απενεργοποιήσει το δεύτερο pad που έχει ανάψει. Η διαδικασία επαναλαμβάνεται. Η ντρίμπλα θα γίνεται πάντα με το “έξω χέρι” ενώ η
απενεργοποίηση του δεύτερου pad πάντα με το “μέσα χέρι”.
A. Απλοί χρόνοι αντίδρασης (Simple RT): Ο αθλητής γνωρίζει κάθε φορά ποιο είναι το επόμενο pad που θα ενεργοποιηθεί και εκτελεί
πάντα σταυρωτό πρώτο βήμα (cross step).
B. Απλοί χρόνοι αντίδρασης (Simple RT): Ο αθλητής γνωρίζει κάθε φορά ποιο είναι το επόμενο pad που θα ενεργοποιηθεί, με το
πρώτο του βήμα να είναι το αντίστοιχο με το χέρι που ντριμπλάρει (same foot same hand).
C. Χρόνοι αντίδρασης επιλογής (Choice RT): Ο αθλητής ανάλογα με το χρώμα του pad3 (πράσινο ή μπλε), θα εκτελέσει αντίστοιχα
σταυρωτό ή όχι πρώτο βήμα.

Άσκηση 4 – Help & Recover:
Χαρακτηριστικά: Πλάγια Βήματα, Ταχύτητα
Τύπος άσκησης: Κατά βήμα
Ο αθλητής θα ξεκινάει από το pad1. Αρχικά ενεργοποιείται το pad2 και στη συνέχεια το pad1. Η διαδικασία επαναλαμβάνεται. Από το
pad1 ο αθλητής θα φτάσει στο pad2 με πλάγια βήματα ενώ για την αντίθετη πορεία, με τεχνική close out.
A. Απλοί χρόνοι αντίδρασης (Simple RT): Ο αθλητής εκτελεί την άσκηση (και από τις δύο πλευρές του γηπέδου) γνωρίζοντας με ποιο
χέρι πρέπει να απενεργοποιεί το κάθε pad.
B. Χρόνοι αντίδρασης επιλογής (Choice RT): Ανάλογα με το χρώμα (πράσινο ή μπλε) που θα έχει το pad1, ο αθλητής θα πρέπει να
χρησιμοποιήσει και το συγκεκριμένο χέρι (δεξί ή αριστερό αντίστοιχα) για να το απενεργοποιήσει.

Δημιουργία Μοντέλου Αξιολόγησης
Προ-επεξεργασία δεδομένων:
• Δημιουργία της κλάσης “status” (pro, noob ή athlete)
• Επιλογή χαρακτηριστικών
• Αντικατάσταση χαρακτηριστικών όπου μπορούσαν να εκφραστούν σε ποσοστό
• Αντικατάσταση λανθασμένων τιμών
• Συμπλήρωση τιμών που έλειπαν (missing values)
• Ορισμός indexes
Πριν
Μετά

Δημιουργία ξεχωριστών πινάκων για κάθε άσκηση :
Κάθε άσκηση έχει μία ή και περισσότερες παραλλαγές και επειδή είναι προτιμότερο να
παραμείνει το σύστημα όσο πιο απλό γίνεται, η τελική τιμή ενός χαρακτηριστικού μιας
άσκησης, προκύπτει από τον συνδυασμό των τιμών των χαρακτηριστικών, της κάθε
διαφορετικής παραλλαγής της άσκησης.
Η αρχική μορφή του σετ δεδομένων της άσκησης “Ex2_BallhandlingInMotion” (με τις παραλλαγές των ασκήσεων).
Η τελική μορφή του σετ δεδομένων της άσκησης “Ex2_BallhandlingInMotion” (με ομαδοποιημένες τις παραλλαγές των ασκήσεων).

Αξιολόγηση αθλητών για κάθε άσκηση με τη χρήση του αλγορίθμου SVR:
• Δημιουργία οχτώ μοντέλων SVR ένα για κάθε άσκηση.
• Εκπαιδεύθηκαν με το 80% (24/30) του σετ δεδομένων (8 pro, 8 athletes, 8 noobs).
• Dummy variables (pro-2, athlete-1, noob-0).
• Εφαρμογή K-Fold cross validation.
• Αξιολόγηση (R2 Score, F1 Score, MSE, RMSE, MAE).
• Tuning σε παραμέτρους χρησιμοποιώντας GridSearchCV.
Ομαδοποίηση αθλητών με τον αλγόριθμο K-Means για κάθε άσκηση:
• K=3 (ανεξαρτήτως τι υποδείκνυε η μέθοδος elbow).
• Ανάλογα με τα χαρακτηριστικά “Average Mean_Respone” και
“Average Dm_Errors” αποδόθηκε σε κάθε ομάδα το σκορ 0, 1 ή 2.
Στόχος η συνολική αξιολόγηση Μικρό Dataset

Ex1_ActiveHands Average Mean_Response Average Dm_Erros
Cluster 0 | Score = 0 0.5573 3.1000
Cluster 1 | Score = 1 0.5382 2.0000
Cluster 2 | Score = 2 0.5451 0.8000
Ex2_BallHandlingInMotion Average
Mean_Response
Cluster 0 | Score = 0 2.1042
Ex3_StaticBallHandling Average Mean_Response Average Dm_Erros
Cluster 0 | Score = 0 1.5723 2.3076
Cluster 1 | Score = 1 1.5200 0.8333
Cluster 2 | Score = 2 0.8510 0.4545
Ex4_QuickFeet Average Mean_Response Average Dm_Erros
Cluster 0 | Score = 0 0.9043 1.2000
Cluster 1 | Score = 1 0.7657 1.5555
Cluster 2 | Score = 2 0.6219 0.8125
Ex5_KickSlideRunDefens
e
Average Mean_Response
Ex6_Footwork Average Mean_Response
Ex7_RipFirstStep Average Mean_Response Average Dm_Erros
Cluster 0 | Score = 0 1.4952 2.5000
Cluster 1 | Score = 1 1.1054 2.4000
Cluster 2 | Score = 2 0.8045 1.3333
Ex8_HelpAndRecover Average Mean_Response

Εκπαίδευση και αποθήκευση ενός SVR μοντέλου ειδικό για την τελική και συνολική αξιολόγηση των
αθλητών :
• Διαμόρφωση ενός πίνακα με τη βαθμολογία όλων των αθλητών για κάθε άσκηση.
• Εκπαίδευση και αποθήκευση ενός SVR μοντέλου χρησιμοποιώντας το παραπάνω dataset.
• Παρά το γεγονός ότι το μοντέλο εκπαιδεύτηκε με τις κατηγορικές τιμές 0, 1 και 2, η πρόβλεψη αποτελεί
συνεχή τιμή.

Συνολική αξιολόγηση των αθλητών με χρήση του αλγορίθμου SVR.
• Πρόβλεψη του τελικού score χρησιμοποιώντας το μοντέλο που εκπαιδεύτηκε με τα score που προέκυψαν από
την ομαδοποίηση των χρηστών για κάθε άσκηση ξεχωριστά, έχοντας ως είσοδο τις προβλέψεις της απόδοσης
των αθλητών για κάθε άσκηση ξεχωριστά.
• Για να μπορέσει να γίνει αυτό, ο κώδικας ζητάει από τον χρήστη να του δώσει ένα συγκεκριμένο random_state
Αποτελέσματα συνολικής αξιολόγησης:

Αξιοπιστία αποτελεσμάτων
Average R2 score for 1000 different
random_states
0.9348
Average F1 score for 1000 different
random_states
0.9758
Average MSE score for 1000 different
random_states
0.0427
Average RMSE score for 1000 different
random_states
0.1980
Average MAE score for 1000 different
random_states
0.1621
1998
1984

Correlations
Ball Handling – Status:
*H ικανότητα χειρισμού της μπάλας (mean_response score) συμβαδίζει σχεδόν απόλυτα με τη κλάση status. Αυτό έχει ως αποτέλεσμα οι προβλέψεις των
SVR μοντέλων που δημιουργήθηκαν γι’ αυτές τις ασκήσεις, να είναι αρκετά κοντά στις πραγματικές τιμές. Προκύπτει το συμπέρασμα λοιπόν, πως ο
χειρισμός της μπάλας είναι ένα από τα χαρακτηριστικά που ξεχωρίζει τον αθλητή καλαθοσφαίρισης από τους υπόλοιπους αθλητές ή μη αθλητές, πράγμα το
οποίο και φυσικά περιμέναμε.

Correlations
Footwork– Status:
*Oι μέσοι χρόνοι αντίδρασης σε ασκήσεις που αφορούν το footwork, έχουν ιδιαίτερα υψηλή συσχέτιση με το status του χρήστη, παρά το γεγονός ότι τα
μοτίβα κινήσεων που χρειάστηκαν να εκτελεστούν ήταν αρκετά απλά. Για άλλη μια φορά οι προβλέψεις των SVR μοντέλων ήταν αρκετά κοντά στις
πραγματικές τιμές της κλάσης.
Είναι οι αθλητές της
καλαθοσφαίρισης όντως πιο
γρήγοροι και πιο εκρηκτικοί ή απλά
έχουν διαμορφώσει πιο γρήγορη
αντίληψη και αντίδραση σε
συγκεκριμένα μοτίβα κινήσεων των
ποδιών;

Correlations
Speed & Acceleration– Status:
*Βλέπουμε πως το correlation ανάμεσα στο mean_response και το status δεν είναι ιδιαίτερα υψηλό, αλλά ούτε χαμηλό. Έτσι στις συγκεκριμένες ασκήσεις οι
χρόνοι αντίδρασης “μαρτυρούν” τους αθλητές, αλλά όχι συγκεκριμένα τους αθλητές καλαθοσφαίρισης, με αποτέλεσμα τα SVR μοντέλα στις αντίστοιχες
ασκήσεις να έχουν αποκλίσεις. Τα σφάλματα αυτά κάθε άλλο παρά ενοχλούν, διότι στόχος είναι να αποδοθεί score στους χρήστες ανά άσκηση και όχι να
γίνει πρόβλεψη της κλάσης τους.

Correlations
Active Hands RT – Status:
*Η συσχέτιση του mean_response με το status είναι ιδιαίτερα μικρή, παρά το γεγονός πως στην καλαθοσφαίριση οι χρόνοι αντίδρασης των χεριών έχουν
σημαντικό ρόλο, τόσο στη δημιουργία πάσας όσο και στην διακοπή μίας. Παρόλα αυτά φαίνεται πως υπάρχει ικανοποιητική συσχέτιση ανάμεσα στο
dm_errors και στο status, πράγμα που σημαίνει ότι για ακόμα μια φορά, είναι η αντίληψη του αθλητή και όχι η ταχύτητα που κάνει τη διαφορά.

Επικοινωνία στην καλαθοσφαίριση
*H πέμπτη κατά σειρά άσκηση με όνομα “Ex5_Kick_Slide_Run_Defense” εκτελέστηκε με δύο παραλλαγές. Την πρώτη φορά η ενεργοποίηση των Pads είχε
οπτικοακουστικό ερέθισμα, ενώ τη δεύτερη μόνο οπτικό. Το αποτέλεσμα ήταν είκοσι έξι από τους τριάντα χρήστες να έχουν καλύτερη απόδοση στο
οπτικοακουστικό ερέθισμα, δύο να έχουν την ίδια απόδοση και μόνο δύο να έχουν χειρότερη.

Σενάρια χρήσης του συστήματος
1.Αξιολόγηση της βελτίωσης
• Αντίληψη βελτίωσης
• Επιβράβευση της
προσπάθειας
• Ανάπτυξη αυτοπεποίθησης
παιδιών με λιγότερο ταλέντο
• Χρήσιμο για μελλοντικό
προγραμματισμό της
προπόνησης (π.χ. βελτίωση
των λιγότερο ανεπτυγμένων
χαρακτηριστικών των
αθλητών της ομάδας)
2.Ένταξη νέου αθλητή στο roster
• Εκπαίδευση του μοντέλου με
τους 10 “pro” της εκάστοτε
ομάδας
• Γρήγορη πρώτη αντίληψη για
τις ικανότητες του νέου αθλητή
• Ενίσχυση αυτοπεποίθησης του
αθλητή αν τελικά επιλεχθεί
• Διαφάνεια επιλογής παιχτών
• Ενίσχυση της αξιοπιστίας του
συλλόγου
**Το σύστημα αυτό δεν μπορεί να
αξιολογήσει κάποια βασικά
χαρακτηριστικά που απαιτούνται στην
καλαθοσφαίριση, όπως η πάσα ή το
σουτ. Για τον λόγο αυτό ο κάθε
σύλλογος, θα πρέπει να αξιολογήσει τον
αθλητή και στα προαναφερθέντα
χαρακτηριστικά.
3.Αξιολόγηση της αποκατάστασης
• Οι παίχτες της ομάδας στην αρχή
της χρονιάς, μετά το τέλος της
περιόδου της προετοιμασίας θα
εκτελούν τις ασκήσεις του
συγκεκριμένου συστήματος, ώστε
να αξιολογηθεί η απόδοση τους.
• Εάν κάποιος παίχτης υποστεί
κάποιον τραυματισμό, θα έχει
ένα σημείο αναφοράς της
απόδοσής του όταν ήταν υγιής
• Ο σύλλογος και ο προπονητής,
θα επιτρέψουν στον αθλητή να
συμμετέχει ξανά στις
προπονήσεις αφού αξιολογήσουν
την ετοιμότητα του,
χρησιμοποιώντας το σύστημα
αξιολόγησης

Προβλήματα που προέκυψαν
Covid 19
Το ολικό lockdown απαγόρευσε την χρησιμοποίηση ενός κλειστού γηπέδου καλαθοσφαίρισης για
το πειραματικό κομμάτι.
Οι αθλητές αναγκάστηκαν να εκτελέσουν τις ασκήσεις σε χώρο και δάπεδο, μη κατάλληλο για
αθλητικές δραστηριότητες.
Εάν η συλλογή των δεδομένων γινόταν σε κανονικό κλειστό γυμναστήριο καλαθοσφαίρισης, οι
χρόνοι των αθλητών ενδέχεται να ήταν λίγο έως αρκετά καλύτεροι.
Εφόσον το πειραματικό κομμάτι υλοποιήθηκε σε ανοιχτό χώρο, προέκυψαν και κάποια λειτουργικά
προβλήματα στο σύστημα “REMEDES”. Εξαιτίας της υγρασίας υπήρξε δυσλειτουργία στον
συγχρονισμό των pads με αποτέλεσμα την πιο δύσκολη και αρκετά πιο χρονοβόρα συλλογή των
δεδομένων

Μελλοντική εργασία
1. Δημιουργία τριών συστημάτων αξιολόγησης αθλητών. Ένα σύστημα επαγγελματικού αθλητισμού, ένα σύστημα
ημιεπαγγελματικού αθλητισμού και τέλος ένα σύστημα ερασιτεχνικού αθλητισμού, καθένα από τα οποία θα είναι
εκπαιδευμένο με αθλητές αντίστοιχου επιπέδου.
2. Δημιουργία εφαρμογής, ώστε οι προπονητές και οι σύλλογοι να είναι ικανοί από μόνοι τους, να εκτελέσουν ολόκληρη
την διαδικασία της αξιολόγησης. Για να γίνει αυτό εκτός από τη δημιουργία της εφαρμογής, θα χρειαστεί να βελτιωθούν
συγκεκριμένα κομμάτια κώδικα, ώστε κάποιες διαδικασίες να γίνονται αυτόματα.
3. Αξιολόγηση των αθλητών στην πάσα. Με τον κατάλληλο εξοπλισμό, είναι εφικτό να δημιουργηθούν ασκήσεις με το
σύστημα “REMEDES”, που να αξιολογούν την ικανότητα του αθλητή στην ακρίβεια της πάσας, αλλά και τη λήψη
απόφασης.
4. Δημιουργία μεγάλης βάσης δεδομένων με χρήστες που έχουν εκτελέσει τις ίδιες ακριβώς ασκήσεις ώστε το σύστημα να
αξιολογήσει έναν καινούριο χρήστη με πολύ μεγαλύτερη ακρίβεια. Αν όντως υπήρχε μια τέτοια βάση δεδομένων, η
διαδικασία του clustering που εκτελέστηκε στα πλαίσια αυτής της διπλωματικής εργασίας δεν θα ήταν αναγκαία, διότι θα
υπήρχαν αρκετές εγγραφές ώστε να εκπαιδευτεί το τελικό SVR μοντέλο συνολικής αξιολόγησης, με τα αποτελέσματα των
προηγούμενων 8 SVR μοντέλων.

Basketball data analytics via Machine Learning techniques using the REMEDES system

Recomendados

Recomendados

Mais conteúdo relacionado

Semelhante a Basketball data analytics via Machine Learning techniques using the REMEDES system

Semelhante a Basketball data analytics via Machine Learning techniques using the REMEDES system (20)

Mais de ISSEL

Mais de ISSEL (20)

Basketball data analytics via Machine Learning techniques using the REMEDES system