Analýza údajov o futbalistoch
Po dlhých kapitolách sme sa dostali na koniec a máme všetky potrebné nástroje štatistiky. Poznáme miery polohy, miery variability aj koreláciu. Ideme ich teda teraz aplikovať na futbalové tímy a konečne vyberieme jeden z nich.
Názov klubu | $\overline{x}$ | $\tilde{x}$ | $R$ | $\overline{d}$ | $s^2$ | $s$ | $v$ |
---|---|---|---|---|---|---|---|
FC Bayern München | 81.304 | 84 | 26 | 5.402 | 45.516 | 6.746 | 8.297 |
Real Madrid | 80.121 | 82 | 29 | 6.405 | 61.682 | 7.853 | 9.802 |
Juventus | 80.060 | 83 | 27 | 5.922 | 50.299 | 7.092 | 8.858 |
FC Barcelona | 78.363 | 82 | 30 | 8.849 | 85.140 | 9.227 | 11.774 |
Bayer 04 Leverkusen | 77.280 | 78 | 20 | 4.108 | 25.881 | 5.087 | 6.583 |
Ako prvý sme vypočítali priemer pre každý zo 668 klubov a zoradili sme ich podľa neho od najlepšieho po najhorší. Sem do tabuľky sme si vybrali prvých päť najlepších klubov podľa priemeru. Vedľa priemeru sme vypočítali medián. Chceli sme si overiť, že priemer je správny. Teda že nemáme medzi klubmi nejaký, ktorý má samých slabých hráčov a jedného úplne geniálneho, ktorý potiahne priemer vysoko. Vidíme, že priemer a medián sa nám veľmi nelíšia, takže outlierov v kluboch nemáme.
Možno Juventus má jedného alebo zopár slabších hráčov, pretože má priemer 80,060, čo ho v priemeroch dalo na tretie miesto, ale medián má 83, teda druhý najlepší. Títo slabší hráči mohli potiahnuť priemer Juventusu viac dole. Najmenší rozdiel medzi mediánom a priemerom má Leverkusen. To znamená, že nemá niektorých hráčov výrazne slabších alebo silnejších (teda nemá outlierov).
Ďalšie na rade sú miery variability. Tie nám hovoria o tom, ako veľmi sú hráči rozdielny. Či je ich overall zhruba na rovnakej úrovni alebo sú tam lepší a horší. Asi chceme tím s čo najmenšou variabilitou, pretože hráčom na jednej úrovni sa hrá spolu lepšie ako hráčom, kde sú niektorí príliš slabý a niektorí príliš silný.
Prvé, najľahšie čo môžeme vypočítať je variačné rozpätie. Najmenej rozdielny hráči vyzerajú byť v Leverkusene, ale stále treba mať na pamäti, že variačné rozpätie je citlivé na outlierov, tak sme pre istotu vypočítali aj priemernú absolútnu odchýlku, rozptyl a smerodajnú odchýlku. Všetky tri nám potvrdili, že najmenej rozdielny sú hráči Leverkusenu. Po započítaní veľkých odchýlok od priemeru vyšla smerodajná odchýlka ani nie o 1 menšia od priemernej absolútnej chyby. Ani pri ostatných tímoch sa smerodajná odchýlka veľmi nelíšili od priemernej absolútnej odchýlky. Veľké rozdiely tam nie sú, tak aj miery variability potvrdili, že v tímoch sú vyrovnaný hráči.
Ak by si vedel, z akých dát sme počítali štatistiky, tak tu sú overall pre tímy:
FC Bayern München: 89, 88, 87, 86, 86, 86, 85, 85, 84, 84, 84, 84, 84, 84, 84, 83, 79, 79, 75, 72, 72, 67, 63
Real Madrid: 91, 90, 89, 88, 88, 87, 87, 87, 86, 85, 85, 85, 85, 85, 83, 83, 82, 81, 81, 80, 80, 79, 79, 77, 76, 74, 73, 70, 69, 66, 66, 65, 62
Juventus: 93, 89, 88, 86, 86, 86, 85, 85, 85, 85, 84, 84, 83, 83, 83, 83, 83, 83, 82, 82, 81, 79, 79, 77, 75, 74, 72, 71, 69, 68, 67, 66, 66
FC Barcelona: 94, 90, 89, 89, 89, 88, 87, 86, 86, 85, 85, 85, 84, 84, 84, 82, 82, 81, 79, 76, 71, 71, 71, 70, 70, 68, 67, 67, 67, 65, 65, 65, 64
Bayer 04 Leverkusen: 84, 83, 83, 83, 82, 82, 82, 82, 80, 80, 79, 78, 78, 77, 77, 77, 75, 75, 75, 74, 72, 71, 71, 68, 64
Štatistika nám povedala, že najlepší priemer má FC Bayern München, ale zasa najvyrovnanejší hráči sú v Bayer 04 Leverkusen. Rozhodujeme sa teda medzi týmito dvomi klubmi. My sme si na to vybrali kvantily. Spravíme to tak, že si všetkých 18 278 hráčov zoradíme od najhoršieho po najlepší. Potom ich rozdelíme do skupín zhruba po 30 (v jednom tíme je zhruba 30 hráčov).Počet skupín bude 18 278/30=609. Dáta rozdelíme do 609 skupín pomocou kvantilov. Kvantilov bude 608. Keď budeme mať dáta v skupinách, tak sa pozrieme, koľko hráčov z oboch tímov patrí do najlepšej skupiny. Vyberieme si ten, kde ich bude najviac. Najlepšia skupina sú tí hráči, ktorí sú väčší ako posledný šesto ôsmi kvantil. Ako sa kvantil ráta, to už napísané je, tak si teraz povieme len výsledok. Je to 88. V Leverkusene nie je nikto lepší ako 88 a v Mníchove je jeden. Tak si definitívne vyberáme FC Bayern München.
Aby si vedel, že do štatistiky patria aj grafy, tak sme ich zopár spravili pre FC Bayern München.
![Graf závislosti ceny od overallu](assets/images/stat_linearGraph.png)
![Porovnanie schopností pravákov a ľavákov](assets/images/stat_barGraph.png)
![Histogram overallov](assets/images/stat_histGraph.png)
![Rozdelenie hráčov podľa veku](assets/images/stat_pieGraph.png)
![Korelácia medzi schopnosťou strieľať a brániť](assets/images/stat_scatterGraph.png)