Λίγα μαθηματικά για την μπάλα, πάλι…

2010 FIFA World Cup logoΠρόπερσι, στο Euro 2008, είχα επιχειρήσει να παρουσιάσω την εφαρμογή του συστήματος αξιολόγησης ELO, γνωστού από το σκάκι, στο ποδόσφαιρο, πιο συγκεκριμένα στις αναμετρήσεις μεταξύ εθνικών ομάδων ποδοσφαίρου (ο σέρβερ του elorating.net δεν απαντάει αυτήν την στιγμή).

Φέτος, λέω να δώσω πάλι μια σύντομη εναλλακτική ματιά, αυτή τη φορά αυθαιρετώντας λίγο περισσότερο, στο Μουντιάλ. Εξακολουθώ να πιστεύω ότι το πιο αξιόπιστο σύστημα αξιολόγησης είναι το ELO, με τις επιφυλάξεις που είχα εκφράσει και πριν δυο χρόνια.

Αλλά ας κάνουμε για μια στιγμή την ακόλουθη υπόθεση. Η σχετική υπεροχή κάθε ομάδας απέναντι στις υπόλοιπες κατά την έναρξη του τουρνουά ελήφθη υπόψη στην κατάρτιση των ομίλων, που έγινε βάσει της δυναμικότητας των ομάδων και με στόχο την ισοκατανομή ισχυρών και αδυνάτων. Από το σημείο αυτό, λοιπόν, και μετά, ας υποθέσουμε ότι όλες οι ομάδες είναι εξίσου ικανές για το καλύτερο και το χειρότερο. Το πρόβλημα που έχουμε στη λήξη του γύρου των ομίλων, είναι να αποφανθούμε ποιες υπήρξαν οι καλύτερες, βάσει των κριτηρίων κατάταξης· δηλαδή, με σειρά σημαντικότητας, βάσει πόντων, διαφοράς τερμάτων, επίθεσης, και μεταξύ των αποτελεσμάτων. Και το προφανές εμπόδιο που συναντάμε είναι ότι δεν έπαιξαν όλοι με όλους, οπότε πώς θα συγκρίνω όλους με όλους;

Μια από τις απαντήσεις, λοιπόν, που μας δίνει η στατιστική, είναι να κανονικοποιήσω τα κριτήρια βαθμολόγησης, ώστε να αμβλύνω, κατά το δυνατόν, διαφορές που οφείλονται σε καταστάσεις, όπως η ύπαρξη μιας ομάδας σε ένα όμιλο που απλά μαζεύει γκολ από τις υπόλοιπες, ή ο ισχυρότερος (ή ασθενέστερος) συναγωνισμός σε κάποιους ομίλους.

Παίρνω, λοιπόν, τις τιμές z των βαθμών και της διαφοράς τερμάτων κάθε ομάδας και ομίλου (τα υπόλοιπα κριτήρια δεν μου χρειάζονται, καθώς δεν έχω ισοκατατάξεις) και πλέον έχω την ακόλουθη τελική κατάταξη μετά τη φάση των ομίλων:


Rank Team GD N_GD pts N_pts Rank Team GD N_GD pts N_pts
1 Argentina 6 1,470 9 1,396 17 South Africa -2 -0,632 4 0,000
2 Germany 4 1,359 6 1,391 18 South Korea -1 -0,245 4 -0,073
3 Uruguay 4 1,265 7 1,225 19 Switzerland 0 0,000 4 -0,106
4 Paraguay 2 1,414 5 1,162 20 Ghana 0 0,000 4 -0,199
5 Netherlands 4 1,124 9 1,162 21 Australia -3 -1,019 4 -0,199
6 Brazil 3 0,387 7 1,019 22 Greece -3 -0,735 3 -0,367
7 Spain 2 0,926 6 0,741 23 New Zealand 0 0,000 3 -0,387
8 Chile 1 0,463 6 0,741 24 Denmark -3 -0,843 3 -0,387
9 USA 1 0,707 5 0,660 25 Nigeria -2 -0,490 1 -0,955
10 England 1 0,707 5 0,660 26 Serbia -1 -0,340 3 -0,993
11 Japan 2 0,562 6 0,387 27 Italy -1 -0,707 2 -1,162
12 Slovakia -1 -0,707 4 0,387 28 Cameroon -3 -0,843 0 -1,162
13 Portugal 7 0,904 5 0,340 29 France -3 -0,949 1 -1,225
14 Slovenia 0 0,000 4 0,132 30 North Korea -11 -1,420 0 -1,359
15 Mexico 1 0,316 4 0,000 31 Honduras -3 -1,389 1 -1,375
16 Ivory Coast 1 0,129 4 0,000 32 Algeria -2 -1,414 1 -1,453

Και τι έγινε, θα πει κάποιος; Αφού οι κανόνες είναι δεδομένοι. Δεν διαφωνώ. Τα μαθηματικά, απλώς, μου δίνουν περισσότερη πληροφορία (υπό τις προϋποθέσεις που τέθηκαν πιο πάνω), κι είναι κι αυτά ένα παιχνίδι.

Διαπιστώνει κανείς, για παράδειγμα, ότι η Χιλή μάλλον φάνηκε λίγο ανώτερη των ΗΠΑ, παρότι βγήκε στους «αδύνατους» της Β΄ φάσης. Παρόμοια, Σλοβενία, Ακτή του Ελεφαντόδοντος και Νότια Αφρική, παρότι αποκλείστηκαν, ίσως ήταν πιο δυνατές από τη Νότια Κορέα και την Γκάνα που συνεχίζουν.

Η Ελλάδα φτάνει στην τιμητική 22η θέση, ενώ τελευταίες δεν κατατάσσονται ούτε η Βόρεια Κορέα, ούτε το Καμερούν, που δεν κατάφεραν να μαζέψουν ούτε ένα βαθμό, αλλά η Αλγερία, κι από πάνω της η Ονδούρα.

Στην κορυφή, και προς έκπληξη, ίσως -αλλά θυμηθείτε τις υποθέσεις που κάναμε, και κυρίως τον «μηδενισμό του πρότερου βίου», Αργεντινή, Γερμανία και Ουρουγουάη αποδεικνύονται καλύτερες ως τώρα μηχανές.

Πριν κλείσω, με βάση τα παραπάνω, ας δούμε τα ζευγάρια της φάσης των 16. Οι αριθμοί δείχνουν ως περισσότερο αμφίρροπο τον αγώνα Βραζιλία-Χιλή (διαφορά περίπου 0,28), και μετά, Ισπανία-Πορτογαλία (0,4). Στη συνέχεια είναι Γερμανία-Αγγλία (0,73), Ολλανδία-Σλοβακία (0,78), Παραγουάη-Ιαπωνία (0,78) και ΗΠΑ-Γκάνα (0,86). Ακόμη λιγότερο αμφίρροπες δείχνουν οι συναντήσεις Ουρουγουάη-Νότια Κορέα (1,3) και Αργεντινή-Μεξικό (1,4).

Ο κυριότερος λόγος που το ποδόσφαιρο αποτελεί το πιο ενδιαφέρον ομαδικό άθλημα είναι ότι στην πράξη όλοι οι αριθμοί μπορούν να πάνε περίπατο. Επιπλέον, όπως μπορεί να βεβαιώσει και ο Άγγελος -που πιθανόν να βρει «τρύπες»* στα παραπάνω, η συγκεκριμένη μέθοδος αφήνει απέξω κι ένα σωρό άλλους «κρυφούς» παράγοντες, από τη ζέστη ή το κρύο, μέχρι την ώρα έναρξης, τις κάρτες, ή το αν είναι μαλωμένοι κάποιοι παίκτες. Σκοπίμως δεν ανέπτυξα καθόλου τι σημαίνει (εδώ) κανονικοποίηση, ή τιμές z, το άρθρο της wikipedia και πλήθος άλλες πηγές (στην τύχη, παράδειγμα με πρακτική εφαρμογή) τα εξηγούν καλύτερα από μένα.

 
Μια τέτοια πιθανή τρύπα είναι ότι οι βαθμοί που κέρδισε κάθε ομάδα στον όμιλο χάθηκαν από κάποιες άλλες…

 
Ευκαιρία να παινέψω άλλη μια φορά το ASAP Utilities, εδώ για τη λειτουργία του HTML Table Export.

#2010-fifa-world-cup, #%cf%83%ce%ba%ce%ac%ce%ba%ce%b9, #maths, #ranking, #statistics

Χάθηκα, Κατινιώ και σκάκι στα Χανιά


Αυτό ίσως θα ταίριαζε καλύτερα σ’ ένα σκακιστικό μπλογκ, αλλά ευκαιρία να δηλώσω ότι είμαι ζωντανός, και να τιμήσω κι εγώ το σκακιστικό μου παρελθόν… Το κάνουμε πού και πού.

Εδώ είμαι. Αλλά είμαι πολύ οργισμένος, και δεν θέλω να ξεθυμώσω πάνω στο πληκτρολόγιο.

#giannis-theodorakis, #%cf%83%ce%ba%ce%ac%ce%ba%ce%b9, #%ce%b3%ce%b9%ce%ac%ce%bd%ce%bd%ce%b7%cf%82-%ce%b8%ce%b5%ce%bf%ce%b4%cf%89%cf%81%ce%ac%ce%ba%ce%b7%cf%82, #%ce%bc%ce%af%ce%ba%ce%b7%cf%82-%ce%b8%ce%b5%ce%bf%ce%b4%cf%89%cf%81%ce%ac%ce%ba%ce%b7%cf%82, #mikis-theodorakis, #youtube

Νάτανε η μπάλα σκάκι (τέλος)

Καθώς ανακοινώθηκε από την FIFA η βαθμολογία των εθνικών ομάδων για την 1η Ιουλίου, ολοκληρώνεται και η αναφορά στο σύστημα βαθμολόγησης ELO που ξεκίνησε εδώ και συνεχίστηκε εδώ, με την παράθεση των σχετικών πινάκων Ιουνίου και Ιουλίου για τα δύο συστήματα βαθμολόγησης – κατάταξης. Αυτή τη φορά οι πίνακες είναι σε φθίνουσα ταξινόμηση με βάση τη βαθμολογία /θέση. Για λόγους σύγκρισης, παρουσιάζονται οι πίνακες ELO της 1ης Ιουνίου και όχι της αρχής του Euro 2008 (πριν, δηλαδή, τα τελευταία φιλικά προετοιμασίας του Ιουνίου).

Η διάταξη – βαθμολόγηση αντικειμένων με βάση κάποια κριτήρια ή παρατηρήσεις είναι ένα ενδιαφέρον πρόβλημα που απασχολεί εδώ και περίπου ένα αιώνα την κοινότητα των κοινωνικών επιστημών, τουλάχιστον 50 χρόνια αυτή των οικονομικών επιστημών, ενώ εδώ και μια εικοσαετία αποτελεί hot topic σε περιοχές όπως η Λογική, ο Σημασιολογικός Ιστός και οι Βάσεις Δεδομένων της Επιστήμης Υπολογιστών.

Είτε έχουμε να κάνουμε με μία εκλογική διαδικασία, όπου οι προτιμήσεις ενός συνόλου ψηφοφόρων θα πρέπει να αντιστοιχιστούν σε μια τελική διάταξη των υποψηφίων, κατά το δυνατόν δικαιότερη και πιο κοντά στη λεγόμενη «λαϊκή εντολή», είτε πρόκειται να αποφασίσουμε την παραγωγή ενός εργοστασίου βάσει των προτιμήσεων των καταναλωτών, είτε ένα υπολογιστικό σύστημα πρέπει να προτείνει το κατάλληλο υλικό σε κάποιο χρήστη, βάσει των εκπεφρασμένων ή εγγενών προτιμήσεών του, είτε, τέλος, πρέπει να αποφασισθεί η ακριβής θέση μιας κινητής συσκευής, βάσει των ενδείξεων ενός συνόλου από σχετικούς αισθητήρες, το πρόβλημα είναι ανάλογο με αυτό της βαθμολόγησης και διάταξης αθλητών – ομάδων βάσει της απόδοσής των.

Μόνο κατά περίπτωση, και με συγκεκριμένες παραδοχές, υπάρχει μία μοναδική -αντικειμενικά αληθής- λύση· για παράδειγμα, η Πορτογαλία μπορεί να κέρδισε την Τουρκία, και αυτή την Ελβετία, ωστόσο, η τελευταία κέρδισε την πρώτη, δημιουργώντας έναν κύκλο, που ταλαιπωρεί χρόνια όσους ασχολούνται σχετικά.

Σχετικές λέξεις – φράσεις κλειδιά: preference, Arrow’s impossibility theorem, Condorcet’s paradox, utility function, partial order, cardinal, ordinal, ranking

#euro-2008, #%cf%83%ce%ba%ce%ac%ce%ba%ce%b9, #maths, #statistics

Νάτανε η μπάλα σκάκι (συνέχεια)

Για να δούμε, λοιπόν, τί είπαν οι αριθμοί στο τέλος του τουρνουά… Ισχύουν οι ίδιες προειδοποιήσεις με το αρχικό μήνυμα.

Ο τελικός πίνακας, έχει ως εξής:

Η αποτυχία της Εθνικής, μεγαλύτερη όλων στο  τουρνουά, αποτυπώνεται εύγλωττα και στους αριθμούς· απώλεια 80 βαθμών και κατρακύλα 16 θέσεων. Μεγαλύτερη σε βαθμούς η πτώση της Γαλλίας, ενώ σε πτώση θέσεων μας ακολούθησε η Πολωνία, κατεβαίνοντας 12. Στον αντίποδα, οι 92 πόντοι της Ισπανίας την εκτόξευσαν στην κορυφή, ενώ εντυπωσιακή ήταν και η άνοδος της Ρωσίας: οι 76 πόντοι την ανέβασαν κατά 10 θέσεις.

#euro-2008, #%cf%83%ce%ba%ce%ac%ce%ba%ce%b9, #maths, #ranking, #statistics

Νάτανε η μπάλα σκάκι… ή μήπως είναι, λίγο;

Προειδοποίηση 1: Οι αλλεργικοί με τους αριθμούς μπορούν να σταματήσουν την ανάγνωση. Ό,τι ακολουθεί είναι τίγκα από αριθμούς.

Προειδοποίηση 2: Ναι, με τους αριθμούς μπορείς να λες και ψέματα· το γοητευτικό είναι ότι μπορείς και να προσεγγίσεις την αλήθεια, ή καλύτερα, να αναπαραστήσεις την αλήθεια, όσο το δυνατόν πιο πιστά. Σε όλες τις περιπτώσεις μετρά η μέθοδος, οι παραδοχές, και οι περιορισμοί.

Προειδοποίηση 3, και τελευταία: Ναι, το παραδέχομαι, το ποδόσφαιρο δεν είναι σκάκι, όπου ο αξιολογούμενος παίκτης είναι σταθερός, το ίδιο μυαλό, ψυχολογία, γνώση, ασχέτως αν αλλάζει η απόδοσή του. Στο ποδόσφαιρο, έχεις εξασφαλίσει την πρόκριση, και στο τελευταίο ματς κατεβάζεις ταχύτητα, ή κατεβάζεις τα δεύτερα. Χάνεις από την Ελβετία 2-0, κι επειδή λέγεσαι Πορτογαλία και το ματς είναι επίσημο, υποχρεωτικά παραχωρείς 48 βαθμούς αξιολόγησης, όπως θα γινόταν και αν το ματς, αντί να ήταν αδιάφορο, έκρινε την πρόκριση.

Πάμε, λοιπόν:

Η FIFA εφαρμόζει ένα σύστημα βαθμολόγησης και κατάταξης των εθνικών ομάδων βάσει των αποτελεσμάτων τους στους αγώνες των 4 προσφάτων ετών, όπου συνυπολογίζεται η δυναμικότητα των εκάστοτε αντιπάλων, μαζί με την σπουδαιότητα του κάθε αγώνα (τουρνουά, φιλικός, κ.ο.κ.). Η ενημέρωση είναι μηνιαία, στην αρχή κάθε μήνα. Πρόκειται, λοιπόν, για ένα σύστημα, το οποίο σε κατατάσσει με βάση το ιστορικό σου, το οποίο, ωστόσο, πιθανόν, να ήταν διαφορετικό, αν, για παράδειγμα, στον όμιλο σου δεν είχες Τούρκους, και Ουκρανούς, αλλά Εγγλέζους και Ισπανούς.

Στο σκάκι, το σύστημα που χρησιμοποιείται είναι το Elo, όνομα του Ουγγροαμερικανού καθηγητή Φυσικής που το επινόησε, και όχι αρκτικόλεξο, όπως, ίσως, φανταζόταν κάποιος.

Στο σύστημα αυτό κεντρική ιδέα αποτελεί η παραδοχή ότι η απόδοση κάθε παίκτη περιγράφεται από μια τυχαία μεταβλητή που ακολουθεί κανονική κατανομή. Ζητούμενο αποτελεί η μέτρηση μιας ποσοτικής ένδειξης της μεταβλητής αυτής μέσα στο χρόνο, όπου ως γεγονότα λογίζονται οι αγώνες. Με δυο λόγια, η απόδοση ενός παίκτη μπορεί να εξαχθεί μόνο από τα αποτελέσματά του, έναντι των υπολοίπων παικτών· σε μια κερδισμένη παρτίδα, είναι ασφαλές να υποθέσει κανείς ότι ο νικητής είχε απόδοση υψηλότερη του αντιπάλου του, και αντίστροφα, ενώ σε μια ισοπαλία η απόδοση μπορεί να θεωρηθεί σχεδόν ίδια για τους δύο αντιπάλους. Προφανώς, όσο (σχετικά, αλλά και απόλυτα) δυνατός είναι ο αντίπαλος, τόσο καλύτερη απόδοση απαιτεί μια νίκη.

Γύρω από την παραπάνω κεντρική ιδέα, υπάρχει εφαρμοσμένη Θεωρία Πιθανοτήτων και Στατιστικής, πολύπλοκοι υπολογισμοί, απλούστερες εκδοχές τους (βάσει των οποίων κάθε σκακιστής μπορεί να υπολογίσει και ο ίδιος το Elo του, μετά από κάθε αγώνα), για να φτάσουμε τελικά σε έναν αριθμό. Έτσι, ο Bobby Fisher στο απόγειο της καριέρας του είχε Elo 2785, ενώ ο τωρινός κορυφαίος παίκτης Ινδός Άναντ είναι στο 2803.

Αντίθετα, λοιπόν, με τη μέθοδο της FIFA, η οποία αποτελεί στατική αποτίμηση της παρελθούσας απόδοσης, το Elo αποτελεί εκτίμηση της τρέχουσας φόρμας κάθε παίκτη.  Παράλληλα, με το σύστημα της FIFA, συντηρείται και ένα σύστημα Elo, με τις εγγενείς αδυναμίες της προειδοποίησης 3, πιο πάνω.

Ο παρακάτω πίνακας δείχνει την αξιολόγηση (και κατάταξη) των ομάδων του Euro 2008 σε ζευγάρια στηλών που αφορούν (α) το σύστημα της FIFA την 1η Ιουνίου (β) το Elo την 1η Ιουνίου (για λόγους σύγκρισης) (γ) το Elo στην αρχή του τουρνουά (μετά και τα τελευταία φιλικά προετοιμασίας) και (δ) το Elo στο τέλος της φάσης των ομίλων , σήμερα το πρωί, και μετά το Χ και της Βραζιλίας με την Αργεντινή.


Στον πίνακα αυτό μπορεί κάποιος να κάνει διάφορες διαπιστώσεις, μελετώντας τον ώρες (ξανακοιτάζοντας και την προειδοποίηση 3).

Η Ολλανδία, για παράδειγμα, μπήκε ως νούμερο 4 του τουρνουά, βάσει Elo, όχι όμως και για την FIFA, που την αξιολογούσε . Έγινε νούμερο 1 μετά τη λήξη της φάσης των ομίλων, μαζεύοντας άλλους 116 βαθμούς (όντας και στον δυσκολότερο όμιλο, όπως φαίνεται παρακάτω· δεύτερη σε συγκομιδή η Κροατία με 60), ανταμείβεται όμως στη συνέχεια, καθώς θα συναντήσει αντίπαλο με τη μεγαλύτερη διαφορά δυναμικότητας· 244 βαθμούς Elo παρακάτω έχει η Ρωσία.

Η Ελλάδα, αντιστοίχως, σε πείσμα της κατάταξης της FIFA, που την ήθελε , μπήκε ως νούμερο 10 στο τουρνουά, κατάφερε να απωλέσει 81 βαθμούς (πρώτη σε απώλειες η Γαλλία με 84), σε ένα όμιλο δεύτερο σε δυναμικότητα -λόγω Ισπανίας, αλλά με καλύτερη κατάταξη από Ρωσία και Σουηδία. Ωστόσο, διέπρεψε…

Ας δούμε τους τέσσερις ομίλους με τη σειρά τελικής κατάταξης και τα Elo στη αρχή και στο τέλος της φάσης αυτής.

Τέλος, να, και οι προημιτελικοί, με το άθροισμα και τη διαφορά των Elo των αντιπάλων.

Ευκολότερος φαίνεται ο αγώνας για την Ολλανδία, σημαντικό το προβάδισμα για Γερμανία και Κροατία, και πλέον ισορροπημένη η αναμέτρηση Ισπανίας-Ιταλίας.

Όσοι φτάσατε ως εδώ, θα συμφωνήσετε, ωστόσο:

Η μπάλα παίζεται στο χορτάρι, ένδεκα εναντίον ένδεκα, μαζί κι οι διαιτητές, κι αυτό είναι που την κάνει απρόβλεπτη και μαγική, ενίοτε και μέγιστη πόρνη, κατά το ρηθέν. Η συνέχεια επί της οθόνης…

Αναφορές:
http://en.wikipedia.org/wiki/FIFA_World_Rankings
http://en.wikipedia.org/wiki/Elo_rating_system
http://en.wikipedia.org/wiki/World_Football_Elo_Ratings
http://www.eloratings.net/world.html
http://en.euro2008.uefa.com/index.html

#euro-2008, #%cf%83%ce%ba%ce%ac%ce%ba%ce%b9, #maths, #ranking, #statistics