Λίγα μαθηματικά για την μπάλα, πάλι…

2010 FIFA World Cup logoΠρόπερσι, στο Euro 2008, είχα επιχειρήσει να παρουσιάσω την εφαρμογή του συστήματος αξιολόγησης ELO, γνωστού από το σκάκι, στο ποδόσφαιρο, πιο συγκεκριμένα στις αναμετρήσεις μεταξύ εθνικών ομάδων ποδοσφαίρου (ο σέρβερ του elorating.net δεν απαντάει αυτήν την στιγμή).

Φέτος, λέω να δώσω πάλι μια σύντομη εναλλακτική ματιά, αυτή τη φορά αυθαιρετώντας λίγο περισσότερο, στο Μουντιάλ. Εξακολουθώ να πιστεύω ότι το πιο αξιόπιστο σύστημα αξιολόγησης είναι το ELO, με τις επιφυλάξεις που είχα εκφράσει και πριν δυο χρόνια.

Αλλά ας κάνουμε για μια στιγμή την ακόλουθη υπόθεση. Η σχετική υπεροχή κάθε ομάδας απέναντι στις υπόλοιπες κατά την έναρξη του τουρνουά ελήφθη υπόψη στην κατάρτιση των ομίλων, που έγινε βάσει της δυναμικότητας των ομάδων και με στόχο την ισοκατανομή ισχυρών και αδυνάτων. Από το σημείο αυτό, λοιπόν, και μετά, ας υποθέσουμε ότι όλες οι ομάδες είναι εξίσου ικανές για το καλύτερο και το χειρότερο. Το πρόβλημα που έχουμε στη λήξη του γύρου των ομίλων, είναι να αποφανθούμε ποιες υπήρξαν οι καλύτερες, βάσει των κριτηρίων κατάταξης· δηλαδή, με σειρά σημαντικότητας, βάσει πόντων, διαφοράς τερμάτων, επίθεσης, και μεταξύ των αποτελεσμάτων. Και το προφανές εμπόδιο που συναντάμε είναι ότι δεν έπαιξαν όλοι με όλους, οπότε πώς θα συγκρίνω όλους με όλους;

Μια από τις απαντήσεις, λοιπόν, που μας δίνει η στατιστική, είναι να κανονικοποιήσω τα κριτήρια βαθμολόγησης, ώστε να αμβλύνω, κατά το δυνατόν, διαφορές που οφείλονται σε καταστάσεις, όπως η ύπαρξη μιας ομάδας σε ένα όμιλο που απλά μαζεύει γκολ από τις υπόλοιπες, ή ο ισχυρότερος (ή ασθενέστερος) συναγωνισμός σε κάποιους ομίλους.

Παίρνω, λοιπόν, τις τιμές z των βαθμών και της διαφοράς τερμάτων κάθε ομάδας και ομίλου (τα υπόλοιπα κριτήρια δεν μου χρειάζονται, καθώς δεν έχω ισοκατατάξεις) και πλέον έχω την ακόλουθη τελική κατάταξη μετά τη φάση των ομίλων:


Rank Team GD N_GD pts N_pts Rank Team GD N_GD pts N_pts
1 Argentina 6 1,470 9 1,396 17 South Africa -2 -0,632 4 0,000
2 Germany 4 1,359 6 1,391 18 South Korea -1 -0,245 4 -0,073
3 Uruguay 4 1,265 7 1,225 19 Switzerland 0 0,000 4 -0,106
4 Paraguay 2 1,414 5 1,162 20 Ghana 0 0,000 4 -0,199
5 Netherlands 4 1,124 9 1,162 21 Australia -3 -1,019 4 -0,199
6 Brazil 3 0,387 7 1,019 22 Greece -3 -0,735 3 -0,367
7 Spain 2 0,926 6 0,741 23 New Zealand 0 0,000 3 -0,387
8 Chile 1 0,463 6 0,741 24 Denmark -3 -0,843 3 -0,387
9 USA 1 0,707 5 0,660 25 Nigeria -2 -0,490 1 -0,955
10 England 1 0,707 5 0,660 26 Serbia -1 -0,340 3 -0,993
11 Japan 2 0,562 6 0,387 27 Italy -1 -0,707 2 -1,162
12 Slovakia -1 -0,707 4 0,387 28 Cameroon -3 -0,843 0 -1,162
13 Portugal 7 0,904 5 0,340 29 France -3 -0,949 1 -1,225
14 Slovenia 0 0,000 4 0,132 30 North Korea -11 -1,420 0 -1,359
15 Mexico 1 0,316 4 0,000 31 Honduras -3 -1,389 1 -1,375
16 Ivory Coast 1 0,129 4 0,000 32 Algeria -2 -1,414 1 -1,453

Και τι έγινε, θα πει κάποιος; Αφού οι κανόνες είναι δεδομένοι. Δεν διαφωνώ. Τα μαθηματικά, απλώς, μου δίνουν περισσότερη πληροφορία (υπό τις προϋποθέσεις που τέθηκαν πιο πάνω), κι είναι κι αυτά ένα παιχνίδι.

Διαπιστώνει κανείς, για παράδειγμα, ότι η Χιλή μάλλον φάνηκε λίγο ανώτερη των ΗΠΑ, παρότι βγήκε στους «αδύνατους» της Β΄ φάσης. Παρόμοια, Σλοβενία, Ακτή του Ελεφαντόδοντος και Νότια Αφρική, παρότι αποκλείστηκαν, ίσως ήταν πιο δυνατές από τη Νότια Κορέα και την Γκάνα που συνεχίζουν.

Η Ελλάδα φτάνει στην τιμητική 22η θέση, ενώ τελευταίες δεν κατατάσσονται ούτε η Βόρεια Κορέα, ούτε το Καμερούν, που δεν κατάφεραν να μαζέψουν ούτε ένα βαθμό, αλλά η Αλγερία, κι από πάνω της η Ονδούρα.

Στην κορυφή, και προς έκπληξη, ίσως -αλλά θυμηθείτε τις υποθέσεις που κάναμε, και κυρίως τον «μηδενισμό του πρότερου βίου», Αργεντινή, Γερμανία και Ουρουγουάη αποδεικνύονται καλύτερες ως τώρα μηχανές.

Πριν κλείσω, με βάση τα παραπάνω, ας δούμε τα ζευγάρια της φάσης των 16. Οι αριθμοί δείχνουν ως περισσότερο αμφίρροπο τον αγώνα Βραζιλία-Χιλή (διαφορά περίπου 0,28), και μετά, Ισπανία-Πορτογαλία (0,4). Στη συνέχεια είναι Γερμανία-Αγγλία (0,73), Ολλανδία-Σλοβακία (0,78), Παραγουάη-Ιαπωνία (0,78) και ΗΠΑ-Γκάνα (0,86). Ακόμη λιγότερο αμφίρροπες δείχνουν οι συναντήσεις Ουρουγουάη-Νότια Κορέα (1,3) και Αργεντινή-Μεξικό (1,4).

Ο κυριότερος λόγος που το ποδόσφαιρο αποτελεί το πιο ενδιαφέρον ομαδικό άθλημα είναι ότι στην πράξη όλοι οι αριθμοί μπορούν να πάνε περίπατο. Επιπλέον, όπως μπορεί να βεβαιώσει και ο Άγγελος -που πιθανόν να βρει «τρύπες»* στα παραπάνω, η συγκεκριμένη μέθοδος αφήνει απέξω κι ένα σωρό άλλους «κρυφούς» παράγοντες, από τη ζέστη ή το κρύο, μέχρι την ώρα έναρξης, τις κάρτες, ή το αν είναι μαλωμένοι κάποιοι παίκτες. Σκοπίμως δεν ανέπτυξα καθόλου τι σημαίνει (εδώ) κανονικοποίηση, ή τιμές z, το άρθρο της wikipedia και πλήθος άλλες πηγές (στην τύχη, παράδειγμα με πρακτική εφαρμογή) τα εξηγούν καλύτερα από μένα.

 
Μια τέτοια πιθανή τρύπα είναι ότι οι βαθμοί που κέρδισε κάθε ομάδα στον όμιλο χάθηκαν από κάποιες άλλες…

 
Ευκαιρία να παινέψω άλλη μια φορά το ASAP Utilities, εδώ για τη λειτουργία του HTML Table Export.

Advertisements

#2010-fifa-world-cup, #%cf%83%ce%ba%ce%ac%ce%ba%ce%b9, #maths, #ranking, #statistics