7 мин.

Так ли трудно играть дождливым вечером в Стоке?

Добрый день! Перед вами первый текст Лаборатории исследований спорта НИУ ВШЭ. В данном блоге мы будем рассказывать как о действительно серьёзных исследованиях, так и делать небольшие вольные аналитические зарисовки по определённым темам.

Людям свойственно сравнивать. Мы сравниваем зарплаты, девушек, фильмы, команды, футболистов. Сравниваем и футбольные лиги. На просторах Трибуны можно найти как упоминания дождливого вечера в Стоке (есть даже такой блог) как символа сложности английской лиги, так и утверждения о том, что Месси/Роналду набивают статистику на "хихонах" или "дижонах". Кроме того, иногда можно увидеть утверждения о "лиге двух команд" или что "каждый может обыграть каждого". Как же сравнить уровень конкуренции внутри лиг? В этой статье мы рассмотрим несколько подходов к решению этой задачи. Кроме того, мы будем очень рады предложениям новых методов в комментариях и готовы подарить и доставить бейсболку с символикой НИУ ВШЭ за лучшее предложение (будет определено через неделю после публикации статьи).

Я начал с изучения уже имеющейся литературы и наткнулся на занимательный англоязычный отчёт немецкой консалтинговой компании Roland Berger совместно с известным в мире спортивной экономики Тимом Павловски из Университета Тюбингена. Авторы посчитали множество различных интересных показателей, посредством которых пытались ответить на вопрос, какая европейская лига наиболее интересна болельщикам и почему. Есть и другие работы по измерению уровня конкурентности внутри лиги: так, в работе Хамфриса лига называется более конкурентной, если в ней наблюдается много изменений в финальных таблицах от сезона к сезону. Далее проводится корреляционный анализ денежных результатов лиги и уровня конкуренции внутри неё. Помимо данной статьи, стоит упомянуть, например,  работу Кесенна "Revenue sharing and competitive balance in professional team sports" и совместную статью Кесенна и Шимански  "Competitive balance and gate revenue sharing in team sports".

В свою очередь, я решил несколько абстрагироваться от большого количества факторов вне футбольного поля и сконцентрироваться исключительно на анализе результатов в разных лигах. Для сравнения я взял данные по высшим дивизонам Англии, Испании, Франции и Италии с сезона 2010/2011 до сезона 2017/18. Германию я не рассматривал из-за меньшего количества команд в лиге, что дополнительно усложняет анализ.

Непредсказуемостью лиги в некотором смысле является частота, с которой андердоги обыгрывают фаворитов. Поэтому посмотрим на число «инверсий» в финальной таблице на конец сезона. Инверсией в данном случае я называю матч, в котором команда, занявшая более низкое место, обыграла команду, занявшую более высокое место. За ничью в аналогичной ситуации я даю 0.5 инверсии.

 

Для наглядности приведу такой гипотетический пример:

В такой табличке инверсий 0, так как команда, занявшая более высокое место, всегда обыгрывала команду, занявшую более низкое место.

Вот ещё один пример:

 

 

В таком турнире все три матча приносят по половине инверсии, так как в любом матче была команда, занявшая более низкое место и сыгравшая вничью с командой, занявшей более высокое место - всего в таком турнире 1.5 инверсии. 

Вооружившись этим определением, я провел расчеты для четырех сильнейших европейских лиг с 20 командами и пришёл к следующим результатам:

 

В первую очередь мы видим, что количество инверсий несколько падает со временем (заметнее всего во Франции), что говорит о сокращении количества сенсационных побед в чемпионатах в последние годы; вероятно, это связано с увеличением разрыва между условно слабыми и сильными командами. Однозначного вывода о соотношении уровня конкуренции в Ла Лиге и АПЛ сделать нельзя – более того, из всех приведённых лиг только Франция как-то качественно отличается от других.

Возможно, похожие показатели для Англии и Испании получились благодаря тому, что при данном подходе поражение Барселоны от Атлетико и поражение МЮ от Бёрнли идут с одним весом? Введём модернизированный показатель количества инверсий – взвешенные инверсии. Теперь для каждой инверсии (или половины инверсии) мы будем умножать это число на разницу итоговых мест между парами команд на конец сезона.

В уже известной нами таблице подсчёт будет таким:

Ничья между Челси и ЛА Гэлакси: 0.5 инверсий * (2-1) = 0.5, так как разница мест между Челси и ЛА Гэлакси равняется 1.

Ничья между Зенит-2 и ЛА Гэлакси: 0.5 инверсий * (3-2) = 0.5, так как разница мест между Зенит-2 и ЛА Гэлакси равняется 1.

Ничья между Челси и Зенит-2: 0.5 инверсий * (3-1) = 1, так как разница мест между Челси и ЛА Гэлакси равняется 2. Итого 2 инверсии.

Итог: 4 инверсии в нашем модифицированном примере (а раньше было всего 1,5).

 

На данном графике мы снова видим, что уровень конкуренции, подсчитанный таким образом, тоже в среднем падает. Снова невозможно сделать какого-то явного вывода относительно результата сравнения АПЛ, Ла Лиги и Италии.

Воспользуемся ещё одним методом: посчитаем коэффициент Джини, использующийся для сравнения расслоения уровня доходов в различных обществах. Данный коэффициент принимает значения от 0 до 1, где 0 соответствует одинаковому заработку всех жителей общества, а 1 означает всё богатство в руках одного человека в обществе (по данным ЦРУ на, этот показатель составлял 0.22 в Финляндии (2015), 0.38 в России (2015) и 0.52 в Бразилии (2012)). Понятно, что не совсем корректно сравнивать этот показатель лиг со странами, так как в футбольном мире одна команда не может отобрать очки у всей лиги и присвоить их себе (максимальное значение коэффициента будет около 0.35). Представим, что клубы - это граждане, а набранные ими очки - это их доходы, и рассчитаем коэффициент Джини.

 

С одной стороны, коэффициент расслоения внутри футбольных лиг невысок. С другой стороны, видим рост расслоения со временем, что, вероятно, вызвано тем, что сильные команды из года в год становятся только сильнее.  Кроме того, во Франции до сезона 2017-2018 был самый плотный и конкурентный чемпионат согласно этой метрике. Сделать однозначные выводы относительно Англии, Испании и Италии всё ещё не предоставляется возможным.

В завершение посчитаем, какой процент очков от общего числа набирают команды из разных квартилей разных чемпионатов (I квартиль – команды с 1 по 5 место, II квартиль – команды с 6 по 10 место и т.д.)

 

 

 

 

 

Ответить на поставленный вопрос об очевидном сравнении лиг всё ещё не представляется возможным. Выходит, очевидного показателя, по которому АПЛ была бы более конкурентной, чем другие лиги, нет. На основании этой методики мы можем сделать вывод только о более высоком уровне конкуренции во Франции. В Стоке же даже дождливым вечером играть не так и трудно. Из построенных графиков снова можно увидеть меньшее неравенство во Франции (топ-5 набирает относительно меньше команд из других чемпионатов, 16-20 набирают больше). Кроме того, бросаются в глаза близкие к топовым (6-10) команды в Англии и Италии, в то время как в Испании с её наибольшим процентом у топ-команд наблюдается очевидный провал.  Быть может, именно поэтому АПЛ нам кажется наиболее конкурентной?