Κι άλλα μαθηματικά για την μπάλα…

Euro 2012 venuesΠριν τέσσερα χρόνια -πότε πέρασαν;- σου είχα πει για την εφαρμογή του ELO στο Ευρωπαϊκό της Αυστροελβετίας. Είχα και δεδομένα, σούβαλα και πινακάκια.

Τώρα δεν έχω δεδομένα*, αλλά θα σου περιγράψω μια άλλη κατάταξη που σκαρφίστηκα, που μπορεί να δείχνει και τα φαβορί.

Ας πούμε, λοιπόν, ότι η ποιότητα και η δυναμικότητα κάθε εθνικής βγαίνει από το άθροισμα των στοιχείων αυτών για κάθε παίκτη της. Εδώ έχουμε ένα πρόβλημα ότι παίζουν 11 στους 23 και δεν ξέρουμε ποιοι, κάθε φορά, οπότε μια πρώτη παραδοχή θα είναι να δουλέψουμε υποχρεωτικά με αθροίσματα και των 23 παικτών. Εκ των υστέρων, μετά τη λήξη του τουρνουά, μπορούμε να φτιάξουμε ζυγισμένα αθροίσματα, χρησιμοποιώντας τα ποσοστά χρόνου συμμετοχής καθενός από τους 23 παίκτες.

Αναζητώντας, λοιπόν, μια αντικειμενική μέτρηση για κάθε παίκτη, πάμε στη δεύτερη παραδοχή: να χρησιμοποιήσουμε μόνο το πρωτάθλημα στο οποίο έλαβε μέρος τη σεζόν που έληξε. Καμιά άλλη εγχώρια ή ευρωπαϊκή διοργάνωση, ούτε διοργανώσεις εθνικών ομάδων. Θα μπορούσε κάποιος να ενσωματώσει κι άλλες διοργανώσεις, αλλά θα αναγκαζόταν να πάρει κι άλλες ψιλοαυθαίρετες αποφάσεις. Προβληματάκι, εδώ, ότι δεν έχουν όλες οι χώρες που συμμετέχουν, πρωτάθλημα που μόλις έληξε. Σε κάποιες είμαστε στην αρχή ή τα μισά νέου πρωταθλήματος.

Η φόρμα, λοιπόν, κάθε παίκτη μπορεί να κριθεί ποσοτικά με το κλάσμα των λεπτών συμμετοχής του στο πρωτάθλημα όπου συμμετείχε, προς το μέγιστο χρόνο που θα μπορούσε να έχει πάρει· για παράδειγμα, 2.400/3.420 για έναν παίκτη που έπαιζε σε πρωτάθλημα με 20 ομάδες (38×90 ο μέγιστος χρόνος συμμετοχής). Ας ονομάζουμε το κλάσμα αυτό ti, για κάθε παίκτη i μιας εθνικής.

Φυσικά δεν φτάνει να παίζεις, αλλά να νικάει κι η ομάδα σου. Το προηγούμενο κλάσμα θα το πολλαπλασιάσουμε με ένα ακόμη που θα το πούμε pi. Οι πόντοι που πήρε συνολικά η ομάδα του παίκτη i στο πρωτάθλημά της, προς τους πόντους του πρώτου· για παράδειγμα, 74/88 για έναν παίκτη που η ομάδα του μάζεψε 74 πόντους, ενώ ο πρωταθλητής 88.

Κι εννοείται ότι το ελληνικό με το ισπανικό, ή το γερμανικό πρωτάθλημα δεν είναι ίδια, οπότε πώς να τα συγκρίνεις ευθέως. Θαρρώ υπάρχει κάποιος πίνακας της ΟΥΕΦΑ με συγκριτική αξιολόγηση και κατάταξη πρωταθλημάτων, οπότε ας πούμε ότι αυτοί οι δείκτες είναι οι ci. Αν η απόλυτη τιμή τους δεν βολεύει, μπορούμε να τους σχετικοποιήσουμε, κι αυτούς παίρνοντας το κλάσμα τους προς τον δείκτη του καλύτερου πρωταθλήματος. Έτσι ή αλλιώς, αυτός ο δείκτης είναι κι ο λιγότερο αντικειμενικός, μιας και δεν είναι ξεκάθαρες οι τιμές του για κάθε πρωτάθλημα.

Τώρα, μπορούμε να φτιάξουμε τον τελικό δείκτη κάθε χώρας:

\sum_{i=1}^{23}c_{i}\cdot p_{i}\cdot t_{i}


Κι έτσι βγάζουμε κατάταξη και για τις 16 ομάδες -νάχαμε μόνο τα δεδομένα… Για παράδειγμα, η Αγγλία, παρότι με πρωτάθλημα υψηλού βάρους, δύσκολα θα περνούσε τη μέση: Λίγοι Εγγλέζοι απ’ την πρωταθλήτρια, πολλοί από μικρομεσαίες, λίγος σχετικά ο χρόνος συμμετοχής των Εγγλέζων, κανείς ξενιτεμένος σε άλλο καλό πρωτάθλημα.

Μόνο που η μπάλα δεν είναι επιστήμη, αλλά τέχνη θα πουν δικαίως κάποιοι, ή πόρνη, αν θυμηθούμε τον συχωρεμένο τον Όσιμ. Football, bloody hell, που λέει κι ο Sir Alex.

 
 
*το σφύριξα και στην infostrada, το ζητάω κι εδώ: παίζουν πουθενά ελεύθερα τα δεδομένα αυτά;

Συντάκτης: Stazybο Hοrn

I am what I publish; so you are to me.

10 thoughts on “Κι άλλα μαθηματικά για την μπάλα…”

  1. Δεν ξέρω, αλλά ίσως να μπορούμε να ξεκινήσουμε ένα campaign για να βγουν. Αυτό που ξέρω είναι πως υπάρχουν paper που κοιτάζουν το «social network» μιας ομάδας κοιτώντας τις κοινές τους συμμετοχές σε αποστολές, αγώνες και τις ανταλλαγές σε πάσες μεταξύ τους.

    Μου αρέσει!

    1. Νομίζω τα πουλάνε αυτά τα στατιστικά 5-6 εταιρείες του χώρου· πελάτες τους ομοσπονδίες, ομάδες, μπουκάδικα, προπονητές, τύπος. Δεν πρόσεξες ότι γίνανε όλοι Σωτηρακόπουλοι (όταν φτάνουν τα αγγλικά τους -όχι πάντα) με το δωρεάν δείγμα της infostrada.

      Κι εντάξει, όλοι οι δείκτες που μπορεί κανείς να σκαρφιστεί έχουν μια μικρή ή μεγαλύτερη δόση αυθαιρεσίας. Παράδειγμα: http://www.euroclubindex.com/asp/Methodology.asp

      Μου αρέσει!

  2. Ωραία η ιδέα της κατάταξης. Μια μικρή παρατήρηση αν και με το ποδόσφαιρο δεν τα πάω και πολύ καλά (οτι «πιάνω» απο τον Αλέφαντο (!) :-D ) οπότε μπορέι να είναι και άκυρη. Ο χρόνος που συμμετέχει ένας αθλητής σε ένα πρωτάθλημα δεν έχει σχέση με α) το αν τραυματίστηκε εκείνη τη περίοδο (άρα πρέπει να έχεις και αυτή τη παράμετρο) β) την τακτική που ακολουθεί ο προπονητής ανάλογα με το πως εκτίμησε το παιχνίδι; Για παράδειγμα, ένας γρήγορος παίκτης να τίνει να χρησιμοποιείται για λίγο. (Βέβαια αυτές οι επιρροές μπορεί να είναι πολύ μικρές όταν κοιτάς ένα μεγάλο χρονικό διάστημα.)

    To UK Wired έχει ένα πολύ καλό άρθρο για το «σύστημα αυτομάτου ελέγχου» που δημιουργείται ανάμεσα στον αθλητή και τον προπονητή ο οποίος αλλάζει τη προπόνηση ανάλογα με μετρήσιμα δεδομένα που λαμβάνονται ΑΠΟ τον αθλητή. Πολλές παράμετροι, πολύ τεχνολογία……(και -προφανώς- πολλά λεφτά στη μέση). (Κάποια στιγμή θα βγεί όλο το άρθρο)

    Για τα δεδομένα, δεν είμαι σίγουρος οτι μπορούν να διατεθούν δωρεάν. Ίσως κάποια δεδομένα εθνικών ομάδων (; ). Μερικές παράμετροι που καταγράφονται είναι πολύ δύσκολο να έχουν υπολογιστεί αυτόματα (Για παράδειγμα, τι επιτυχία έχει ένας παίκτης ανάλογα με την απόσταση του απο το στόχο (γκόλ, πάσες, κλπ). Αυτό σημαίνει οτι τις μαζεύει (ή υπολογίζει) άνθρωπος….επι πληρωμή… που απο κάπου πρέπει να βγεί.

    Μου αρέσει!

    1. Το (α) ισχύει· αλλά επειδή ακριβώς ισχύει, είναι απόλυτα συμβατό με το δείκτη. Δηλαδή, αν κάποιος έχει χάσει αγώνες λόγω τραυματισμών, δεν μπορεί να είναι και στην καλύτερη φόρμα. Για το (β), ναι αδικούνται μερικοί παίκτες «ειδικών αποστολών», επιθετικοί, κατά κύριο λόγο -«χρυσές αλλαγές». Σαν τον Σόλσιερ.

      Για το ρόλο των στατιστικών στην προπονητική τακτική και στρατηγική, είχα την τύχη να ανακατευτώ λίγο στα ερευνητικά γεννοφάσκια της στην Ελλάδα (αρκετά χρόνια μετά το NBA, κι άλλα τριγράμματα αρκτικόλεξα N??). Και στο κομμάτι της καταγραφής από κάμερες (pattern recognition) -ποιος παίκτης έκανε τι σε όλον τον αγώνα, και στην εφαρμογή στην προπονητική ομαδικών σπορ (ποδόσφαιρο και μπάσκετ), ξεκινώντας από Bayes και καταλήγοντας σε Markov. Βέβαια, η έρευνα και κάποιες διπλωματικές που βγήκαν τότε, τη δεκαετία του 90, αποτελούν αρχαιολογία σήμερα…

      Μου αρέσει!

      1. Α! Δίκιο για το (α)…Το έμπλεξα περισσότερο σκεπτόμενος οτι αφού δεν παίζει ο τραυματισμένος παίκτης, τότε δεν έχεις ακριβή εικόνα για αυτόν, αλλά δεν σε νοιάζει η εικόνα του συγκεκριμένου εδώ, σε νοιάζει η συμβολή του στο αποτέλεσμα.

        Ενδιαφέρον ερευνητικό κομμάτι. Τέτοια πράγματα μπορείς σίγουρα να μαζέψεις (για παράδειγμα)

        (Όμως χρήσιμες παράμετροι που θέλουν λίγο ερμηνεία τις βλέπω πιο δύσκολες να τις «πιάσεις» αυτόματα με if then else απο ένα stream απο video / image features (θέλει μάτι και εγκέφαλο (ακόμα :-) ) ….Και βέβαια είναι ακριβές….Για παράδειγμα (απο εδώ (σχόλια))

        Μου αρέσει!

  3. Νομίζω τα δεδομένα που ψάχνεις σχετικά με τον χρόνο συμμετοχής μπορείς να τα βρεις στο http://www.footballdatabase.eu
    π.χ. δες την καρτέλα «min.» του De Rossi http://www.footballdatabase.eu/football.joueurs.daniele.de-rossi.1539.en.html

    Θα είχε ενδιαφέρον να γράψεις κάτι για την εμπλοκή που είχες στην στατιστική ανάλυση δεδομένων από αθλητικούς αγώνες. Εμένα, τουλάχιστον, θα με ενδιέφερε πολύ.

    Μου αρέσει!

Τι είπες;

Εισάγετε τα παρακάτω στοιχεία ή επιλέξτε ένα εικονίδιο για να συνδεθείτε:

Λογότυπο WordPress.com

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό WordPress.com. Αποσύνδεση / Αλλαγή )

Φωτογραφία Twitter

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Twitter. Αποσύνδεση / Αλλαγή )

Φωτογραφία Facebook

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Facebook. Αποσύνδεση / Αλλαγή )

Φωτογραφία Google+

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Google+. Αποσύνδεση / Αλλαγή )

Σύνδεση με %s