Почему Кейн – читер
Один из авторов свободно мыслящего подкаста про «Ливерпуль» Лукас-шоу «Thoughts off target» отказывается преклоняться перед величием лучшего бомбардира английского чемпионата.
Словно назойливая муха в 4:21 утра вторгается в твое личное пространство, так и разливается хайп по поводу величия Кейна, и все такое. Вот, наблюдая за очередным «не днем Кейна» в матче с «Вест Хэмом», я решил, что пора проверить ощущение, что Кейн – читер. Для меня всегда оставалось загадкой, почему с Кейном, лучшим бомбардиром Англии, «Тоттенхэм» по-настоящему не мог зацепиться хоть за что-то серебряное.
Надоевший xG проник уже в повседневную жизнь. Настало время оценить не только качество ударов, но и влияние самого гола на результат игры.
Нежно красным (лососевым) отмечены матчи, где нападающий не забил, но команда потеряла очки. Для этих же матчей были подсчитаны xG и xA ожидания гола или ассиста, чтобы как-то отразить опасность игрока.
Простите, но всерьез считать голы в матчах, когда не решается турнирное положение, не могу. Поэтому голам в этих матчах прикрепляется коэффициент 0,1. Матчи зеленые.
Ничего умнее весового коэффициента для голов не придумал. Вообще этот коэффициент стоило бы вычислить на исторической выборке, дабы точно определить влияние 3 или 4 гола в матче на зарабатывание очков. Я же ввожу их на глаз.
Единицу имеют голы при равном счете и проигрыше по ходу матча. Если гол делают разницу в 2 гола, то коэффициент 0.6 Если гол делают разницу в 3 гола, то коэффициент 0.3 Если гол делают разницу в 4 и более гола, то коэффициент 0.1
Закончили с пояснениями. Поехали!
Разбросали голы по ситуациям. 18 голов распределилось на 9 матчей из 21. Кейн не помог в 6 неудачных матчах для «Тоттенхэма» ничем, но в среднем по атаке работал на свой гол, о чем говорит средний показатель xG в этих играх (Average xG and xA in bad games). После корреляции всех голов Кейна в сезоне 2017/18 конечная цифра 11,3. Название этому показателю не придумал, но пусть пока будет dG – decisive goals.
Так, ну надо с чем-то сравнить. Никого лучшего в лиге нет, чем его фараоничество Мохамед Салах.
17 голов распределились на 13 игр из тех же 21. Салах не помог команде только в матчах с ВБА и МЮ, но даже там сумел накрутить xG и xA, последнее вообще в рудиментарном состоянии у Кейна. После поправки голов получилось 12,8, что больше, чем у пресловутого Кейна на полтора гола (от 2 до 6 очков). Голов, делающих первоначальную разницу у египтянина, также больше.
***
Давайте немного окунемся в историю. И сравним Кейна и Косту 2016/17.
13 матчей, чтобы забить 21 гол (смотрим без зеленой зоны). 9 матчей без голов из них потерями очков для «Тоттенхэма» закончилось 8 игр.
Обратите внимание на ничтожный вклад в атаку в неудачных матчах 0,03 на игру и четыре игры без ударов в створ вовсе. Поистине супернап, прячущийся за хрупкими спинами казаха Сона и гастарбайтера Эриксена.
Страшный и могучий Диего Коста:
Все 20 голов растянул на 18 матчей и провел 35 всего. Коста неплохо себя проявил в матчах потерь очков для «Челси» xG 0,62 на игру. dG = 14,9.
И напоследок сезон 2015/16, битва с Варди.
Варди помогал команде делать разницу голами больше, чем Кейн. Результат – dG=19,9.
Не так страшен ураган, как его прогнозируют. Будьте эффективными.
Редакция блога настоятельно рекомендует слушать Лукас-шоу «Thoughts off target» и зафолловить их во всех соцсетях (Telegram, Twitter, VK, Facebook). Реально клевые ребята!
"Почему Кейну, забившему больше Месси за год, плевать на все хG и хА".
конец.
А удобно подгонять спорные статистические показатели одного игрока к цифрам ТРЕХ РАЗНЫХ футболистов на среднесрочной дистанции много ума не надо. И объективности, аргументированных выводов тут, к вашему сожалению, не будет. Особенно позабавило преимущество Салаха в 1,5 мяча на микродистанции и статистический проигрыш(!) Косты в сравнении с Кейном.
Еще и плюсов убогому лже-исследованию накрутили)
КГ.
При этом автор проделал работу, весьма солидную, так что дальше вопросы по ней. Начну сразу с ошибки, в сезоне 16/17 гол Кейна в ворота МЮ банально не в той колонке. Это, в общем-то ничего страшного. Правда не очень понятно, почему у Кейна зеленая зона три матча, а у Косты - 1?
Сразу напрашивается вопрос - почему есть градация по весовому коэффициенту, когда счет становится больше, но нет в отрицательном случае? Получается, что гол при счете 0:5 ценится выше, чем при счете 2:1. Или гол при счете 0:2 (безусловно очень важный), тоже самое, что при счете 0:0. Очень странно и сомнительно.
Дальше, тут нет никакого учета времени, проведенного на поле. Против Суонси Кейн провел чуть больше 20 минут и оценивать их так же, как и полный матч тоже мне видится странным. Тоже относится и к перфомансам Салаха против Стока и Пэласа.
Кроме того, у Кейна в этом сезоне была травма и болезнь, Салах же мог ровно отыграть весь сезон, первый матч пропустив только в январе, если не ошибаюсь. То есть нет никаких внешних факторов, которые могли привести к снижению формы. В прошлом сезоне у Кейна были две серьезные травмы и вполне логично, что после них какое-то время уйдет на набор формы.
Тут я подхожу к вопросу дистанции. Очень удобно на каждом выбранном отрезке сравнивать с разными людьми, но это выглядит подгонкой задачи под ответ. Тут Варди, тут Коста, тут Салах. Ну, окей, мы сравниваем с лучшими форвардами, но при этом мы знаем, что в отдельный сезон может выстрелить любой.
Еще один очень важный вопрос - вот Коста размазал 20 голов на 18 матчей. Красавчик? Ну, вроде да. При этом он провел 35 матчей, то есть 17 матчей без мячей, вообще. Полчемпионата практически. И вот они не учитываются. Хотя для оценки качества нападающего это было бы полезно. Для оценки важности голов нападающего, возможно, нет, но тогда логично ввести критерий важности игр, который к примеру, зависел бы, от турнирного положения команд.
Кстати, по поводу того, что Коста был хорош в матчах где Челси терял очки. В среднем xG 0,62, вроде неплохо. Но если присмотреться, львиную долю составляют матчи с Пэлас (1,89) и Ливерпулем (0,76 и я так подозреваю сюда входит незабитый пенальти). Если взять оставшиеся 4 матча, то Коста уже не так уж хорош - 0,12 xG. За чьими он там спинами прятался?
Оценка важности голов, кажется очень условной и сомнительной. В таком случае, возможно, стоит как-то исходить из итогового счета игры. Ведь весь гола при 3:0 в матче, который завершился 6:1 – это один разговор, а весь гола при 3:0, в матче, который завершился 4:4, немного (ну так, самую малость) иной.
Но в любом случае в отрыве от команды, от качеств нападающего совершенно непонятно, что нам это дает. Окей, один сезон кто-то один забивает более важные голы, затем кто-то второй, потом кто-то третий. А дальше-то что?
Кстати, занятный момент для себя нашел, даже в этих таблицах. Кейн все равно прибавил относительно сезона 15/16 и держит очень хорошие цифры. Тот сезон был очень хорош, но и этот еще не закончен, уверен, Харри еще прибавит.
В современном футболе важно только одно - Результат прямо здесь и сейчас.
потом еще откуда-то возникла некая "зеленая зона", которая длится то первые два тура, то один, то три - как автору удобно. Кто вообще сказал автору, что первые туры чемпионата не важны? Франк Де Бур?
Даже в баскетболе уважающие себя аналитики более аккуратны в сопоставлении цифр и реальной командной игры. А там традиция все считать оттачивалась сильно дольше, чем в футболе. Измеряемых показателей больше, они удобнее, и прямее завязаны на конечный командный результат. И ценность индивидуальной игры выше: 5 человек не 11.
2. Для меня лично нет определяющей разницы в сравнении трех 0/0 Кейна и трех 0,1-/0 Косты. Это разница одного более-менее приличного удара со средней дистанции. На моей памяти, у "Тоттенхэма" в целом в последние 2,5 сезона было не меньше провальных матчей, чем лично у Кейна.
3. Сравнение по двум параметрам 2,5 отыгранных сезонов одного футболиста с 2,5 сезонами ТРЕХ ДРУГИХ футболистов - это не тренд, а дешевое впаривание псевдофактов. Для начала гореисследователям следует использовать бОльшую дистанцию, не менять переменные (футболистов для сравнения), добавить другие переменные (схемы игр команд, уровень партнеров по команде и др.), оценить (субъективно) влияние игроков на результат, которое не оценивается xG и прочими метриками. Вот тогда можно будет пообсуждать. Для примера есть соседняя статья про Коутиньо. Там анализ куда более глубокий и объективный, несмотря на определенные огрехи (по моему мнению).
***
Между двумя обновлениями страницы у статьи был рейтинг -12, через пару минут стал +15. Это не только я заметил, ниже есть минимум 1 аналогичный комментарий.
что светит ярче: Луна или Солнце? Луна, потому что Солнце светит днем, когда и без него светло.
1) что такое матчи, не влияющие на турнирное положение? В том, что в конце сезона есть ничего не решающие матчи, есть заслуга того самого напа, он забивал раньше, чтобы последние матчи не влияли.
2) Автор считает, что гол при равном счете стоит больше. Но когда ты забиваешь при лидерстве и +1, ты даешь команде спокойствие и уверенность, + право на ошибку
Весь анализ свёлся по сути к простому - как много забивал Кейн в важных матчах. Ну и так как он забивал меньше, чем игроки Х и У, то значит читер.
Хотя в реальности могут быть совсем другие причины, почему так происходит.
Уже миллион раз было доказано что xG - бесполезная ерунда, но фанатики (сектанты) продолжают её хайпить. Фанаты xG похожи на фанатов Спартака, хыыы
Как же я угараю когда лучшего бомбардира АПЛ три сезона подряд (в этом он тоже им станет, не сомневайтесь) пытаются упрекнуть в том,что ему везёт. Ладно первый сезон, второй, но он уже 4 сезона подряд является одним из лучших бомбардиров мира, а всякие неадекваты-хейтеры продолжают писать мол ему везёт и упорно доказывать это на примере абсолютно не работающей абсурдной системе xG.
И про игнорирование проведенных на поле минут.
Ну и учитесь отличать выбирать правильные средства выразительности. Наезд в заголовке ради кликбейта - это плохо.
Что касается подачи, то тут важно единое целое. Факты, расчеты и структура материала, а также средства подачи. Несмотря на большой труд в отдельной части, как единое целое статья - увы.
Блог растет, он занимает уже положение _почти_ отдельного СМИ. Слишком большая и разношерстная аудитория. Зачастую просто нет ощущения, что как с равными можно обсуждать тему глубоко, слишком далеко ушли от места встречи узкого круга ценителей.
Для пробных шаров можно и дочерний завести. На баскетбольной ветке, скажем, есть материалы Ромы Сприкута, которые попадают на главную, а есть (были) его же эксперименты с авторской интерпретацией статистики - в отдельном блоге, с предупреждением о том, какова цель и содержание материала.
Здесь не знаю, чья это подача: самого автора или кто-то с редакцией текста "помог", так получилось, что во главу самого текста встали не статистические расчеты, а именно их подача. Некорректные сопоставления, своеобразный подбор контекста и т.д. Как будто для автора важнее подогнать факты под идею, а не сначала собрать их и беспристрастно проанализировать. Это неприятно.
Статистикой очень легко манипулировать. Очень легко подсовывать факты в неподходящий контекст. А в сухом остатке выводы и будут обсуждать.
Особенно если процесс подхода к выводам не получилось превратить в увлекательное самоценное занятие.