12 мин.

Новая метрика, которая может заменить xG. Знакомьтесь, xT

От редакции sports.ru: всем привет, вы в блоге «Тактический борщ». Цифры, формулы, стрелочки – здесь разбирают все: от плейбука Гвардиолы до волшебной тактики «Бетиса». Набирайтесь новых знаний, благодарите автора плюсами и подписывайтесь!

Пока мы все рисовали стрелочки на картинках и гордо рассказывали про xG и другие похожие вещи, один сумасшедший индус из Фэйсбука (ну да, где бы он еще мог работать?) создал метрику xT (Expected Threat). Она показывает сценарии продвижения мяча, самые популярные решения игроков, любимые зоны голевых моментов и многое другое. Внизу будет ссылка на оригинальный текст, но для людей, не владеющих английским языком, я с удовольствием публикую перевод. Погнали!

Но если вы вдруг не совсем в курсе, что такое xG, прочите для начала этот гайд от Вадима Лукомского. 

Зачем нам новая метрика?

После нескольких замысловатых передач на правом фланге Месут Озил вскрывает оборону «Бернли» разрезающей передачей на Сеада Колашинаца, чья своевременная скидка мяча назад нашла Обамеянга, дав ему возможность забить.

Понятное дело, что на бумаге голевая передача была записана на Колашинаца. Но как аналитик вы могли бы задать (и правильно) вопрос о вкладе Озила. Где же та метрика, которая могла бы пропорционально разделить пользу Озила и Колашинаца для этого удара?

Какие метрики есть сейчас?

Существует несколько количественных подходов, которые можно использовать для решения задачи:

• посмотреть на ассисты, но тогда вклад вроде того, что сделал Озил, останется незамеченными;

• посмотреть на xGChain, но тогда xG финального удара (в данном случае = 0.13) будет поровну разделен между каждым игроком, участвующим в комбинации. Колашинац, Озил, Обамеянг, Ляказетт и Мэйтленд-Найлз были бы вознаграждены одинаковым количеством xGChain, что не отражает реальный вклад;

• посмотреть на разницу в xG, вызванную каждым действием в комбинации. Это уже лучше, но не всегда именно проникающий пас создает хороший голевой момент. Например: передача Озила вскрывает оборону, но она все еще не вывела Колашинаца на отличную позицию для взятия ворот. Передача Озила скорее вывела Колашинаца на позицию, с которой он может создать хороший голевой момент.

Можем ли мы справиться лучше?

На изъянах существующих метрик мы бы хотели получить подход, который может:

1. Вознаграждать индивидуальные действия: модель должна начислять очки за каждое действие игрока (передача или обводка) в зависимости от того, какой вклад в комбинационную игру оно внесло.

2. Оперировать данными на уровне событий. У нас нет доступа к любым учетным данным игроков; у нас есть лишь список последовательных событий вместе с базовыми атрибутами этих событий: игрок во владении, проведенное время на поле, начальное местоположение, конечное местоположение и так далее.

3. Вознаграждать действия независимо от финального результата владения мячом (например: вознаграждение Озила не должно зависеть от реализации Обамеянга). Каждое действие должно быть оценено в изоляции независимо от того, что произошло во владении до и после него. По мере поступления соответствующих вводных сигналов у нас фактически остаются только начальные и конечные точки действий. Как на основе этого мы можем начислять баллы? Можно по разнице в xG: если конкретное действие продвигает мяч из точки А в точку Б, баллы за действие просто будут значением равным Б минус А.

4. Вознаграждать продвижение мяча не только в высокие по xG позиции, но и в угрожающие позиции, которое потом может повлечь высокие по xG позиции с высокой вероятностью взятия ворот. Когда значение генерирует xG-модель, подразумевается, что следующим действием станет удар. Но на поле все еще много зон, из которых трудно забить напрямую, но из которых можно продвинуть мяч в локации с более высоким уровнем xG. Когда мы задаем значения действиям, нам нужно определять эти угрожающие позиции. Другими словами, xG нам дает только одно действие (удар) с одной позиции. Чтобы понять реальную угрозу действия, нужно оценивать его как часть цепочки действий.

 

Владение мячом

Когда команда владеет мячом, игроки могут либо ударить (и забить гол с определенной вероятностью), либо переместить мяч в другую зону с помощью передачи/дриблинга. Это продолжается до потери мяча или гола.

Если мы будем работать с этой упрощенной моделью игры, как будут выглядеть данные? По каждой позиции нам нужно знать: как часто футболисты бьют (и как часто забивают), как часто они передвигают мяч и куда они его передвигают. Следующая схема суммирует данные за все игры АПЛ в сезоне-2017/18.

Не поленитесь и поклацайте эту штуку в оригинальном посте. А для тех, кому лень, я записал видео. 

Поигравшись с этой таблицей, вы начнете замечать, что каждая зона (x, y) имеет определенные атрибуты:

• вероятность продвижения m(x, y): когда игрок находится с мячом в зоне (х, у), как часто он выбирает продвижение мяча в качестве следующего действия?

• вероятность удара s(x, y): когда игрок находится с мячом в зоне (х, у), как часто он выбирает удар в качестве следующего действия? В нашей вселенной по умолчанию у него есть только два варианта: продвинуть мяч (пас/дриблинг) и пробить по воротам. Получается, что m(x, y) + s(x, y) = 100%

• матрица продвижения t(x, y): в этом случае мы говорим о том, куда и с какой вероятностью футболисты продвигают мяч(x, y). На схеме сверху эти зоны обозначены разными оттенками зеленого цвета (чем зеленее цвет, тем чаще эта зона становится следующим пунктом назначения мяча).

• вероятность гола g(x, y): здесь уже о том, куда игроки бьют из зоны (х, у), какая вероятность, что удар закончится голом. Стоит подметить, что это очень простая реализация xG.

Взглянуть за пределы шахматной доски

Теперь у нас есть система вычисления, но чего мы хотим достичь? Когда дело доходит до комбинационной игры, много значимых действий сразу же не ведут к хорошим голевым возможностям – в этом проблема моделей, ориентированных на удары. Но они ведут к хорошим ситуациям для взятия ворот несколько действий спустя. Эту теорию очень красноречиво выдвинул Ден Сервон в контексте баскетбольной аналитики (хотя его цитаты очень даже применимы к футболу).

Как задавать зонам такие значения, которые оценивают не только сиюминутную значимость для гола, но и перспективность для продвижения мяча? Владея мячом в какой-то зоне (х, у), у тебя есть выбор: ты можешь ударить и забить с определенной вероятностью или передвинуть мяч в другую локацию.

Извлечение xT

Здесь я решил не заниматься переводом и оставить этот раздел самым большим статистическим гикам. В нем автор посвятил очень много текста объяснению своих алгоритмов и раздел получился очень специфическим. Пропустим его.

Визуализация xT

Теперь, когда у нас есть формула нахождения xT по всему полю, как будет выглядеть результат? Эта визуализация показывает нам как 2D-карту, так и 3D-модель, построенную с использованием всех данных сезона-2017/18. Круто, что просчитать вероятность гола можно на разное количество шагов вперед, просто двигая слайдер (от одной до пяти).

Что нужно закрепить:

• ожидаемые угрозы (xT) = 0.413: когда команда владеет мячом в выделенной зоне, вероятность, что они забьют гол за следующие пять действий составляет 41.3%;

• на нулевой точке карта плоская, так как итерация=0 является отправной точкой для дальнейших вычислений;

• на первом действии у нас уже есть просчитанная модель;

• при каждом следующем действии мы видим заполнение карты xT все дальше и дальше от выбранной точки (как мы уже посмотрели, каждый шаг позволяет просчитать еще одно действий в командной игре);

• показатели xT сливаются воедино после 4-5 действий.

Как использовать xT

Теперь можно измерять вклад игроков в комбинационную игру, если считать разницу в xT между начальными и конечным локациями. Другими словами, мы говорим, что любое действие, которое перемещает мяч из точки (х,у) в точку (z,w), имеет значение хТ(z,w) – хТ(х,у).

Еще раз: стоимость действия равняется % изменения в шансах команды забить за следующие пять итераций из-за этого действия (с учетом того, что мы сейчас говорим о пяти итерациях, мы используем понятие «следующие пять действий»).

Теперь попробуем решить проблему оценки действий Озила и Колашинаца, но уже используя формулу xT:

1. Пас Озила перемещает мяч из хТ=0.077 в хТ=0.158. Пас Озила делает разницу хТ=0.081.

2. Пас Колашинаца перемещает мяч из хТ=0.158 в хТ=0.171. Пас Колашинаца делает разницу хТ=0.013.

Смотря на эти цифры, мы видим, что Озил наиграл на 0.81/(0.81+0.013)=86% в разнице хТ, а Колашинац, несмотря на ассист, всего на 14%.

Лидеры по хТ

Чтобы проверить метрику, автор предлагает посмотреть на список лидеров по хТ в сезоне АПЛ-2017/18. Таблица показывает топ-15 игроков лиги, чьи действия принесли самую большую разницу по метрике хТ. Обратите внимание, что список упорядочен не на основе общего количества принятых решений, а на грубой сумме хТ. Автор это сделал преднамеренно, чтобы покрыть не только игроков, которые умеют обострять, но и тех, кто делает это постоянно и в больших объемах. Нахождение Холебаса на третьем месте может вызвать удивление, но левый защитник «Уотфорда» в том сезоне зарекомендовал себя как самый стабильный и опасный созидатель команды.

Кроме простого начисления очков в командной игре, систему хТ можно использовать и по-другому. Например, пока мы только посмотрели хТ-результаты всех команд АПЛ сезона-2017/18, но прошли мимо конкретных данных по командам. Нет никаких сомнений, что клубы по-разному ведут себя во время владения, отдают приоритет разным участкам поля и идут разными путями к голам в зависимости от своих сильных сторон. Что происходит, когда вместо сбрасывания всей статистики в кучу мы просчитаем хТ по командам?

Визуализация хТ по командам

Это не что-то новое, но xT хорошо показывает разницу в стилях команд. Еще можно, обратить внимание на разницу в высоте. Например, у «Ман Сити» и «Тоттенхэма» примерно одинаковые изгибы (что означает, что у них похожая ценность продвижения мяча в тех же зонах), но линии хТ очень разные. Это означает, что в одних и тех же зонах игроки «Ман Сити» на порядок опаснее лондонских конкурентов (благодаря более высокой реализации).

 

xT можно использовать, когда нужно понять, с какого участка поля команда создает больше всего опасности.

В этом нам поможет хТ-карта команды и оценка действия из сыгранных ею матчей. Другими словами, на каждой ячейке схемы мы можем посмотреть на действия, который там зародились, и на сумму хТ этих действий. Так мы увидим, насколько опасен соперник на разных участках поля. Еще можно увидеть любимые направления соперника для продвижения мяча. Чтобы сделать все это еще более полезным для тактических установок команд, нам хотелось бы узнать, кто те самые игроки, которые создают угрозу.

Кто создает опасность и откуда?

Это видео работы очередного алгоритма попытается ответить на наш вопрос максимально точно. Подсвеченные зоны показывают, откуда чаще всего создается хТ. На отдельных участках видны опасные маршруты мяча, которые там рождаются, и самых активных игроков.  

Еще раз: зайдите на сайт автора и прощупайте все своими руками.

Что дальше?

xT поможет лучше анализировать контратаки. А еще – оценивать индивидуальный уровень решений футболистов и влияние этих решений на игру команды. Вероятнее всего, еще больше интересного в метрике найдут футбольные скауты.

Поддержите автора

Если у вас на уме есть какие-то направления, которые вы бы хотели изучить вместе с автором, вы можете с ним связаться в твиттере @karun1710 или напрямую по электронной почте karun.singh17@gmail.com

Ссылка на оригинал

Подписывайтесь, чтобы не пропустить следующий эпизод!

____________________________________________________________________

Телеграм

Твиттер

Фейсбук 

Фото: globallookpress.com/imago sportfotodienst, Simon Bellis/imago sportfotodienst; Gettyimages.ru/Shaun Botterill

Кое-что актуальное:Пост о тактике Шевченко в сборной Украины 

И кое-что познавательное

Expected Goals On Target – еще одна метрика, о которой должен знать каждый тактический гик