Ανάλυση του Συστήματος Elo ratings σε Αγώνες Ποδοσφαίρου

Google+ Pinterest LinkedIn Tumblr +

Έχοντας κάνει μια μίνι εισαγωγή στα Elo ratings κι έχοντας εξετάσει τη βάση δεδομένων του clubelo.com, θα δούμε την ανάλυση και τα συμπεράσματα στα οποία κατέληξε ο Lars Schiefler μέσω της εφαρμογής των Elo ratings στους αγώνες ποδοσφαίρου. Αν και προς το παρόν οι πληροφορίες που δίνονται δεν σχετίζονται άμεσα με το στοίχημα ποδοσφαίρου, εντούτοις είναι σωστό να γνωρίζουμε την ακριβή θεωρία, ώστε να έχουμε πλήρη εικόνα πριν κατασκευάσουμε οποιοδήποτε σύστημα στοιχήματος με βάση τα Elo ratings. Ετοιμαστείτε για μαθηματικά, στατιστική κι αρκετά γραφήματα που όμως θα φανούν ιδιαίτερα χρήσιμα στην ανάλυσή μας.

Το σύστημα με τους βαθμούς Elo λοιπόν βασίζεται σε πιθανότητες, όπως άλλωστε ήταν κι αναμενόμενο. Κάθε ομάδα έχει μια συγκεκριμένη τιμή Elo, που προκύπτει από τα προηγούμενα αποτελέσματά της. Η διαφορά μεταξύ των βαθμών Elo δύο ομάδων αντιπροσωπεύει την πιθανότητα μια ομάδα να κερδίσει την άλλη. Η πιθανότητα αυτή μπορεί να ονομαστεί και προσδοκία αποτελέσματος και εκφράζεται με κλάσματα ή ποσοστά. Η νίκη ισοδυναμεί με τη μονάδα (100%), η ισοπαλία με 0.5 (50%) και η ήττα με το μηδέν (0%).

elo-ratings-prosdokia-apotelesmatos-grafima

Στον αγώνα μεταξύ δύο ομάδων ποδοσφαίρου, η προσδοκία αποτελέσματος υπολογίζεται σύμφωνα με την εξίσωση του Elo:

E = 1 / (10(-dr/400) + 1)       (1)

Όπου dr είναι η διαφορά των βαθμών Elo των δύο ομάδων. Όταν μια ομάδα κερδίζει, κλέβει πόντους από την ηττημένη ομάδα. Ο αριθμός των βαθμών Elo που αποκτά προκύπτει από τον τύπο:

P = W * F * (R-E)               (2)

Όπου R είναι το πραγματικό αποτέλεσμα και E η προσδοκία αποτελέσματος. Το W είναι μια μεταβλητή που ακούει στο όνομα δείκτης βαρύτητας (weight index) και το F είναι μια επιπλέον μεταβλητή, που εξαρτάται από το εύρος της νίκης. Νίκες με μεγάλη διαφορά τερμάτων είναι πιο σημαντικές, οπότε ο αριθμός των κερδισμένων βαθμών Elo αυξάνεται. Ο Lars προτείνει το F να ισούται με την τετραγωνική ρίζα της διαφοράς τερμάτων, εφόσον υπάρχει νικητής στον αγώνα. Για την ισοπαλία το F παραλείπεται (στην ουσία ισούται με μονάδα).

Σχετικά με το δείκτη βαρύτητας (W), μια μικρή τιμή του (κάτω από 10) θα οδηγούσε σε αξιολόγηση των ομάδων, κατά την οποία τα πολύ παλαιότερα αποτελέσματα θα επηρέαζαν σημαντικά τους βαθμούς Elo της ομάδας. Από την άλλη, μια μεγάλη τιμή θα κατέληγε να αξιολογήσει τις ομάδες σύμφωνα με την τωρινή κατάστασή τους και τα πιο πρόσφατα αποτελέσματά τους. Οι διάφορες δοκιμές κι εξομοιώσεις του δείκτη βαρύτητας έδειξαν πως όταν αυτός ισούται με 20, η διαφορά μεταξύ των πραγματικών αποτελεσμάτων και της προσδοκίας αποτελέσματος ελαχιστοποιείτο (μέθοδος ελαχίστων τετραγώνων). Αυτό φαίνεται από το παρακάτω γράφημα του δείκτη βαρύτητας, που προκύπτει από την ανάλυση όλων των αγώνων της βάσης δεδομένων.

elo-ratings-deiktis-varytitas-W-grafima

Σχετικά με τις ομάδες που ανεβαίνουν ή πέφτουν κατηγορία στα εθνικά τους πρωταθλήματα – ειδικά τώρα το καλοκαίρι – ή εκείνες που αποκλείονται από τα Ευρωπαϊκά κύπελλα (Champions League και Europa League) θα πρέπει να οριστεί μια αρχική τιμή Elo για αυτές. Προτείνεται λοιπόν οι νεοεισαχθείσες ομάδες σε ένα πρωτάθλημα να αποκτούν το μέσο όρο των βαθμών Elo των ομάδων που πέφτουν κατηγορία. Μια άλλη λεπτομέρεια υφίσταται στην περίπτωση των Ευρωπαϊκών διοργανώσεων όπου ομάδες από διαφορετικά πρωταθλήματα έρχονται αντιμέτωπες ανταλλάζοντας βαθμούς Elo. Αυτό σημαίνει αυτόματα πως βαθμοί Elo ανταλλάσσονται και για τα ίδια πρωταθλήματα, ώστε να προκύψει η αξιολόγησή τους όπως είδαμε στο προηγούμενο άρθρο. Επειδή όμως δεν είναι δίκαιη η ανταλλαγή αυτή μεταξύ πολύ δυνατών και αδύναμων πρωταθλημάτων – θα χρειαζόταν δεκαετίες μέχρι τα αδύναμα να φτάσουν τα δυνατά – ο Lars μελέτησε πόσους επιπλέον βαθμούς θα πρέπει να ανταλλάξουν τα πρωταθλήματα μεταξύ τους και βασίστηκε στην πρόβλεψη των Ευρωπαϊκών κυπέλλων. Έτσι προέκυψε ο παρακάτω πίνακας:

Elo points factor: Team + LeagueNLOP1L2L
Team’s league not covered2+02+02+02+0
Only national playoff matches covered1½+½1½+1½1½+1½1½+4½
One League from team’s assossiation covered1+11+21+51+5
Two Leagues from team’s assossiation covered1+11+51+51+11

Όταν μια ομάδα συμμετέχει σε ένα πρωτάθλημα που δεν παρακολουθείται από τη βάση δεδομένων, η ομάδα κερδίζει ή χάνει διπλάσιους πόντους Elo, επειδή η ομάδα έχει πολύ λίγους αγώνες καταγεγραμμένους. Αντίστοιχα εφόσον υπάρχουν πολύ λίγοι αγώνες του εγχώριου πρωταθλήματός της, οι πόντοι που χάνει ή κερδίζει είναι 1.5 φορά περισσότεροι. Στην περίπτωση που συμμετέχει ενεργά σε ένα πρωτάθλημα, οι βαθμοί Elo που κερδίζει ή χάνει σε διεθνές επίπεδο 6πλασιάζονται, ενώ εάν και οι δύο ομάδες συμμετέχουν σε πρωταθλήματα, οι βαθμοί 12πλασιάζονται. Σε όλες τις περιπτώσεις οι βαθμοί αυτοί μοιράζονται εξίσου σε όλες τις ομάδες του πρωταθλήματος της εκάστοτε ομάδας.

Αυτή η μέθοδος έχει πιο γρήγορη αντίδραση στην εξισορρόπηση της δυναμικής στο Ευρωπαϊκό ποδόσφαιρο, ώστε να έχουμε καλύτερη πρόβλεψη του τελικού αποτελέσματος. Κάπως έτσι οδηγούμαστε στην ακόλουθη ερώτηση.

Πόσο ακριβής είναι η πρόβλεψη με τα Elo ratings;

Πολλές ιστοσελίδες προσφέρουν προβλέψεις για αγώνες ποδοσφαίρου, πολύ λίγες όμως εξ αυτών δημοσιεύουν τα αποτελέσματα και τις αναλύσεις των προβλέψεών τους, λέει ο Lars και θα συμφωνήσω απόλυτα. Με μια τόση μεγάλη βάση δεδομένων που έχει στη διάθεσή του (260,000+ αγώνες) θέλησε να εξετάσει πόσο ακριβείς προβλέψεις προκύπτουν από το σύστημά του. Αγνοώντας τους επαναληπτικούς αγώνες των κυπέλλων, αφού μια μεγάλη νίκη στον πρώτο θα επέτρεπε στην ομάδα να δεχθεί μια πιθανή ήττα με μικρότερο σκορ, συγκέντρωσε τους υπόλοιπους αγώνες και τους κατηγοριοποίησε ανάλογα με την πιθανότητα να κερδίσει η γηπεδούχος, όπως αυτή προέκυπτε από τα Elo ratings. Στη συνέχεια υπολόγισε το μέσο όρο των αποτελεσμάτων για κάθε πιθανότητα και κατέληξε στο παρακάτω γράφημα.

elo-ratings-aksiopistia-provlepsis-grafima

Η ιδανική καμπύλη με γκρι φανερώνει τα πραγματικά αποτελέσματα. Εφόσον η λευκή καμπύλη έπεφτε ακριβώς επάνω, θα είχαμε ένα τέλειο σύστημα πρόβλεψης των αγώνων ποδοσφαίρου. Ωστόσο η καμπύλη του συστήματος Elo παρεκκλίνει από την ιδανική. Διαπιστώνεται πως στην περίπτωση όπου υπάρχει φαβορί 80-20% υπάρχει σημαντική απόκλιση της πρόβλεψης, η οποία θα έπρεπε να προσεγγίζει το 75-25. Ωστόσο η καλύτερη πρόβλεψη υφίσταται σε αγώνες όπου το φαβορί είναι στο 60%.

Θα συνεχίσουμε στο επόμενο άρθρο με το πλεονέκτημα της έδρας, όπως αυτό ερμηνεύεται από τα Elo ratings.

Μοιράσου

Για τον αρθρογράφο

Ο Jim συνηθίζει να μετράει φύλλα στο Blackjack, να παίζει στοίχημα και πόκερ, αλλά και να επενδύει στις χρηματιστηριακές αγορές του κόσμου. Συνδεθείτε με τον Jim: StockTwits | TradingView | LinkedIn | Vimeo | YouTube