Zaawansowana statystyka i sztuczna inteligencja – dlaczego skauci NBA mylą się rzadziej?

Myślałeś, że proces rekrutacji pracowników jest trudny?

Co roku w drafcie NBA (procedurze naboru do najlepszej ligi koszykarskiej świata) zostaje wybranych 60 zawodników. Pod okiem skautów znajduje się 350 zespołów pierwszej dywizji akademickiej oraz 308 z drugiej dywizji. Do tego dochodzą zawodnicy z Europy, Ameryki Południowej i Azji. Łącznie jest to około 10.000 zawodników w wieku od 18 do 21 lat. Spośród nich, każdy zespół zazwyczaj może wybrać dwóch. Jest to jeden koszykarz na każde 5000 zawodników zainteresowanych grą w najlepszej lidze świata.

Przez lata fani koszykówki skupiali się na statystykach podstawowych, takich jak punkty, asysty i zbiórki – na tej podstawie wybierali potencjalne przyszłe gwiazdy swoich zespołów. Dzisiaj praktycznie żaden wybór w drafcie nie może obejść się bez użycia sztucznej inteligencji i zaawansowanych danych. Dlaczego tak się dzieje?

Stworzone w ostatnich latach modele pozwalają oszacować m.in. prawdopodobieństwo poważnej kontuzji czy potencjał rozwoju fizycznego. Obecnie furorę robi PER (player efficiency rating), który pozwala ocenić efektywność zawodników przy założeniu optymalnej, wyznaczonej przez silnik komputera roli, jaką mają pełnić w danej akcji. Dzieje się to przy zachowaniu wszelkich proporcji – podobnie jak w szachach – gdzie silnik ocenia optymalny ruch w danej pozycji.

Czy zatem wszystko w zawodowej koszykówce to już tylko komputery? W tym miejscu warto oddać głoś Rafałowi Juciowi, polskiemu skautowi ekipy Denver Nuggets, który do pracy w NBA trafił mając zaledwie 21 lat. Został on zauważony na Twitterze, stając się tym samym najmłodszym pracownikiem w historii ligi. To on w 2013 roku znalazł Nikolę Jokića, 18-letniego Serba, którego drużyna z Denver wybrała z 41 numerem w drafcie. W 2020 roku eksperci wybrali Jokića najwartościowszym zawodnikiem NBA.

Wszyscy myślą, że jako skaut koszykarski skupiam się na koszykówce, ale same umiejętności techniczno-taktyczne są najmniej istotne. Aspektem, na który zwracamy uwagę jest loteria genetyczna, czyli wzrost, warunki fizyczne. Druga sprawa to jest aspekt mentalny, czyli to, jak podchodzi do sportu dana osoba i jego otoczenie. Skaut to trochę wywiadowca.[1] – mówił w wywiadzie dla Dzień Dobry TVN Juć.

Odkąd pracuję w Denver, czyli 2013 roku, mamy jasno określone cechy charakterystyczne. Wiemy, jakich zawodników szukamy. Jokić idealnie się w nasz profil wpasowywał.[2] – dodaje.

Czym zatem są te cechy charakterystyczne, których poszukują poszczególne zespoły? W jaki sposób można minimalizować ryzyko i dokonać optymalnego wyboru zawodnika? Tutaj właśnie z pomocą przychodzi sztuczna inteligencja, a konkretnie narzędzia służące do modelowania pozycji zawodników NBA na podstawie porównań z optymalnymi wzorcami. Brzmi skomplikowanie? Zatem wyjaśnijmy.

Model zakłada, że pierwszym etapem ewaluacji jest znalezienie odpowiednich danych wyjściowych, to jest kilku zawodników, których charakterystyka na danej pozycji jest naszym zdaniem optymalna, a przynajmniej najbliższa temu, czego szukamy u zawodnika, którego chcielibyśmy w naszym zespole. Następnie określa się cechy fizyczno-motoryczne, które komputer powinien dla nas przeanalizować. Na podstawie analizy i otrzymanych wartości optymalnych dla wyznaczonych zawodników-wzorców otrzymujemy prototypowego koszykarza na danej pozycji. Cechy fizyczno-motoryczne prototypu porównujemy z bazą zawodników, spośród których chcemy dokonać wyboru. W ten sposób wiemy, którzy z dostępnych koszykarzy są najbardziej zbliżeni do ustalonego wzoru.

Cechy fizyczne są łatwo mierzalne, ale co zrobić w sytuacji, kiedy interesuje nas sprawdzenie, który z dostępnych zawodników rzuca najlepiej? Tutaj z pomocą znów przychodzi sztuczna inteligencja. Dzięki analizie tysięcy meczów i milionów rzutów udało się opracować optymalny model wyrzucania piłki. Ale po co opracowywać modele, skoro można użyć prostych, znanych od lat danych, czyli skuteczności? Przecież logicznym jest, że zawodnik, który trafia 8 na 10 rzutów w meczu jest lepszym strzelcem niż zawodnik trafiający ze skutecznością 40%. Nie do końca tak jest.

Model amerykańskich naukowców zawiera bardziej skomplikowane dane – są to np. kąt pod jakim zawodnik wyrzuca piłkę, ilość obrotów jakie wykonuje piłka w powietrzu, ułożenie stóp względem ułożenia optymalnego, czy też pozycja z jakiej rzut został oddany względem optymalnej pozycji, jaką powinien w danej akcji obrać zawodnik. W tym przypadku, podobnie jak wcześniej, dokonujemy analizy porównawczej względem optimum. W efekcie otrzymujemy kilka grup. Po pierwsze, jesteśmy w stanie bezbłędnie wyróżnić zawodników, którzy oddają najlepsze rzuty pod względem technicznym. Po drugie, można wskazać tych, którzy muszą popracować nad znalezieniem optymalnej pozycji, z jakiej powinni rzucać. Wreszcie jesteśmy w stanie wskazać zawodników, którzy pomimo rzutów wykonywanych niepoprawnie pod względem technicznym i z nieoptymalnych pozycji – trafiają, a co za tym idzie, można przyjąć, że o ich powodzeniu w dużym stopniu decyduje szczęście.

Kolejnym niezbędnym narzędziem, chętnie używanym w NBA, jest monitorowanie tendencji do doznawania kontuzji. Zawodnicy już na etapie szkoły średniej poddawani są drobiazgowym badaniom lekarskim, które określają ich stan zdrowia, w tym zbierają tak szczegółowe informacje jak tendencja do mikrourazów. Elektroniczna kartoteka zawiera również dane dotyczące wcześniej przebytych kontuzji. Na podstawie posiadanych danych program określa prawdopodobieństwo, z jakim zawodnik może odnosić kontuzje w przyszłości. Wielokrotnie zdarzało się, że nawet największe talenty koszykarskie nie zostały wybrane w pierwszej dziesiątce draftu, ponieważ system wskazywał na duże prawdopodobieństwo odniesienia poważnej kontuzji (np. zerwania więzadła krzyżowego). W wielu przypadkach te predykcje okazywały się poprawne – zawodnik określany mianem wielkiego talentu po 2-3 sezonach przepełnionych kontuzjami zmuszony był do zakończenia kariery. Dość znana jest również historia jednego ze skautów, który „wygadał się” podczas wywiadu, że konkretny zawodnik nie został wybrany, ponieważ system wskazał, że ma on znaczącą tendencję do mikrourazów, przez co każdego sezonu najprawdopodobniej będzie opuszczał od 20 do 30 spotkań. Po kilku latach dziennikarze wrócili do tego wywiadu i okazało się, że ten skaut miał całkowitą rację.

Podstawą do przeprowadzenia głębszych analiz podatności na kontuzje była niespodziewana przegrana w finałach 2019 naszpikowanych gwiazdami Golden State Warriors z Toronto Raptors. Kontuzje były jednym z kluczowych elementów porażki zespołu, który na kolejne lata miał totalnie zdominować rozgrywki NBA.

W 2020 roku Wangwei Wu z Guangzhou w Chinach przedstawił wyniki badań podatności na kontuzje[3]. Wu przeanalizował wcześniejsze badania, którym poddano 481 młodych miotaczy uprawiających baseball, w wieku od 9 do 13 lat. Badania trwały 10 lat i okazało się, że już w tym wieku zawodnicy, którzy byli częściej eksploatowani na boisku (rzucali w minimum 100 rundach rocznie) byli średnio 3,5 razy bardziej podatni na odniesienie poważnej kontuzji. W przypadku piłki nożnej badacze stwierdzili, że wskaźnik urazów mięśniowych jest znacznie wyższy u osób z nieleczonymi zaburzeniami równowagi siły w porównaniu z graczami nie wykazującymi tej tendencji w okresie przedsezonowym.

Natomiast w NBA nie udało się znaleźć żadnej korelacji między częstością kontuzji a wiekiem, wzrostem, wagą czy doświadczeniem graczy. Wu uznał jednak, że związek przyczynowo-skutkowy musi istnieć i posłużył się danymi dotyczącymi kontuzji zawodników w sezonie 2015-2016. Dane wskazały na 277 zawodników, którzy odnieśli 824 urazy, ale tylko 27 z tych kontuzji miało miejsce podczas meczu. Wu skupił się zatem na zebraniu pogłębionych danych dotyczących sezonu przygotowawczego oraz treningów, a także danych fizycznych zawodników, co pozwoliło na przeprowadzenie głębszej analizy. Wyniki badań zaskoczyły zdecydowaną większość ekspertów:

  • Jeśli zawodnik częściej rzuca z dystansu, prawdopodobieństwo odniesienia kontuzji zdecydowanie rośnie.
  • Im zawodnik jest bardziej zaangażowany w grę w obronie i podnoszenie swoich umiejętności w tym zakresie na treningach, tym bardziej prawdopodobne jest to, że odniesie kontuzję.
  • Wzrost i waga nie mają żadnego znaczenia.
  • Częstotliwość spotkań nie ma znaczenia dla wzrostu wskaźnika odniesienia kontuzji.

Wyniki badań Wu były dla świata koszykarskiego swoistym szokiem, ponieważ od lat powtarzano, że konieczna jest redukcja ilości spotkań, ponieważ to ich nadmierna ilość jest przyczyną zdecydowanej większości kontuzji. W efekcie liga NBA zdecydowała jednak, że zamiast skracać rozgrywki i redukować ilość spotkań, konieczne jest chronienie zawodników, którzy są najbardziej narażeni na kontuzje. Przed sezonem 2021-2022 zmieniono przepisy dotyczące wymuszania fauli przy rzutach – z tego powodu zdecydowanie zmniejszyła się ilość kontaktów między obrońcami a zawodnikami rzucającymi za 3 punkty. Ponadto NBA zwróciła zespołom uwagę, aby bardziej dbali o zawodników podczas treningu. Jeśli tylko 3% kontuzji ma miejsce w trakcie meczów, to większy nacisk należy kłaść na przygotowanie fizyczno-motoryczne, tak aby zapobiegać kontuzjom w trakcie treningu.

Talenty koszykarskie są obserwowane od kiedy skończą 12-13 lat, czyli relatywnie wcześnie. Najlepsi ze skautów potrafią już wtedy oszacować potencjał koszykarski zawodnika, coraz częściej używając do tego sztucznej inteligencji i machine learning. Na tym etapie sztuką jest odpowiednia ewaluacja potencjału i (co pewnie jeszcze ważniejsze) predykcja postępów, jakie dany zawodnik poczyni w kolejnych 7–8 latach. Stosowane przez komputery algorytmy robią dokładnie to samo, co skauci przez lata robili ręcznie – analizują materiały wideo oraz statystyki w poszukiwaniu określonych wzorców, tak by finalnie przedstawić model obserwowanego zawodnika z uwzględnieniem predykcji rozwoju, opartej o szybkość uczenia się danego gracza oraz jego rozwój fizyczny w określonym przedziale czasowym. Przekładając to na język mniej naukowy – dzięki użyciu specjalistycznych narzędzi skaut otrzymuje raport o zawodniku X, który mając 13 lat mierzy 175 cm wzrostu i można go sklasyfikować na 28 miejscu w kraju, jeśli chodzi o umiejętności koszykarskie. Druga część raportu to predykcja – X w wieku 20 lat będzie miał 203 cm wzrostu, i jeśli przyjąć oszacowaną szybkość uczenia się koszykarskiego rzemiosła, będzie sklasyfikowany na 7 miejscu wśród 20-latków w kraju.

Podsumowując, trudno oprzeć się wrażeniu, że w Polsce zdecydowanie za mało korzystamy z nauki w sporcie. Jeśli dość precyzyjnie da się określić potencjał w relatywnie skomplikowanym sporcie, jakim jest koszykówka, to nic nie stoi na przeszkodzie, żeby z bardzo podobnych metod korzystać w kluczowych dla Polski dyscyplinach sportu – piłce nożnej, siatkówce czy skokach narciarskich. Wydaje się, że głębsze sięgnięcie do osiągnięć nauki pozostaje kwestią czasu, ale kluczowe w tym przypadku jest to, żeby znaleźć się na czele tego wyścigu, a nie gonić liderów


[1] Nastazja Bloch, Rafał Juć – polski łowca talentów dla NBA: “Same umiejętności techniczno-taktyczne są najmniej istotne”, Dzień Dobry TVN
[2] Kamil Warzocha, Jokić wyprzedza swoją epokę. Jego droga na szczyt jest wyjątkowa, weszlo.com
[3] Wu Wangwei, Injury Analysis Based on Machine Learning in NBA Data, Journal of Data Analysis and Information Processing 08(04), 2020, s. 295-308.