Вернёмся к диаграмме футбольных трансферов, которую я взялась переделать с учётом принципов визуализации данных.

Всё началось вот с этой инфографики:

Для более интересного анализа я собрала более полный датасет, по всем переходам в топ‑лиги и из в топ‑лиг, а не только между топ‑лигами. И показала эти данные в виде флоу‑чарта и графика разброса:

Эта визуализация была информативной и многомерной, но нарушала важный принцип — понятности. И сколько я не крутила эти графики, не получалось добиться того, чтобы её не приходилось «расшифровывать». В конце концов я пришла к тому, что флоу‑чарт при всей «естественности» этой метафоры, либо слишком прост и недостаточно интересен — когда мы смотрим только на верхний уровень:

Либо становится сложным и запутанным — когда мы включаем переходы между лигами:

Подобрать наглядные обозначения для графика разброса так, чтобы чётко отделить трансферы из региональных лиг в топ‑лиги и из топ‑лиг в регионы тоже не получалось. Формально все измерения (тип перехода, регион) были проявлены, но график превращался в нечитаемую абракадабру:

А ведь за кадром оставались ещё такие интересные характеристики, как тип трансфера (постоянный и арендный), возраст и национальность игрока.

Запутанность на визуализации — это всегда проблема неудачного представления. Поэтому я решила поискать другое решение. И оно нашлось.

Визуализация футбольных трансферов, финальная версия. Лаборатория данных

Вместо того, чтобы показывать вообще все трансферы из датасета, я разделила их на три большие группы: пришли в клубы топ‑лиг, ушли из клубов топ‑лиг, перешли между клубами топ‑лиг. Интересно сравнивать эти группы между собой и футболистов внутри групп. Но сравнивать между собой трансфер из южно‑американского клуба в команду топ‑лиги и из команды топ‑лиги в азиатский клуб особого смысла нет. Из таких же соображений я отделила арендные трансферы от постоянных.

Такой подход не только распутал «клубок» флоу‑чарта, который превратился в две обычные столбиковые диаграммы, но и позволил добавить возраст и национальность игрока. Отдельный кайф в том, что у каждого трансфера есть своё лицо:

Поделюсь самыми интересными наблюдениями, которые у меня получилось сделать с помощью этой визуализации.

Если сравнить приходы в клубы топ‑лиг и уходы из клубов топ‑лиг (постоянные трансферы), самая значительная разница наблюдается в количестве бесплатных трансферов. На вход в топ‑лиги они составляют 51%, на выход — 74%. При этом значительной разницы между приходами и уходами в размере компенсации (fee) для платных трансферов не наблюдается.

Ещё одно важное отличие — разрез по регионам. В топ‑лигу попадают игроки в основном из европейских клубов (≈90%), из клубов Северной Америки приходят реже, чем из Южной, и совсем не приходят из клубов Азии и Африки. Уходят в европейские клубы всего 67%, в Северную Америку чаще, чем в Южную, в Азию аж 8,5%, и по графику видно, что именно эти трансферы самых дорогих игроков и с самыми крупными компенсациями. Главные лиги‑поставщики для топ‑лиг — британский Championship, итальянская молодёжная Primavera, немецкая 2.Bundesliga. Значительное количество игроков пришли не из клубов. Уходят чаще всего в никуда, а также в итальянскую Seria B, британский Championship и лигу Saudi Pro.

Распределение игроков по возрасту также значительно отличается по форме. Для приходящих пик приходится на 19 и 20 лет, при среднем 22.6 года. Для уходящих пика как такого нет, есть плато на 22...24 года и ещё одно пониже — на 25...33 года, при среднем 26.4 года. Что касается арендных трансферов, они достаточно редки среди приходов в топ‑лиги — всего 11%. Зато из 1117 исходящих из топ‑лиг трансферов, 45% составляют арендные, и возрастное распределение в них значительно отличается от постоянных уходов. В нём такой же выраженный пик на 20 годах и среднее составляет 22.9 года.

Обратимся теперь к переходам между клубами топ‑лиг.

Во‑первых, обратите внимание, как точки на графике занимаю правый верхний угол — здесь речь о больших деньгах. Средняя компенсация на 10 миллионов евро больше, чем для приходов и уходов, как и средняя стоимость игроков. Трансферные переходы составляют одну треть от всех. Постоянные переходы на треть бесплатные, тогда как трансферные бесплатны на две трети.

Возрастное распределение не похоже ни на приходы, ни на уходы, оно равномерно нарастает к яркому пику в 25 годах и потом быстро спадает. Ещё в таких переходах доля игроков не европейских национальностей (Африка, Южная и Северная Америка) заметно больше, чем в приходах и уходах.

Я недостаточно хорошо разбираюсь в теме, чтобы делать на основе этой визуализации осмысленные выводы. Но такие яркие и заметные различия скорее всего говорят об интересных закономерностях. Буду рада услышать в комментариях мысли и наблюдения уважаемых советчиков.

Визуализация данныхФутбольные трансферыФормат: график разбросаФормат: столбиковая диаграмма
Отправить
Поделиться
Запинить

Комментарии

Роман Тихонов

Комментарий по наблюдениям автора.

Клубы топ‑лиг приобретают перспективных и лучших игроков, поэтому процент бесплатных переходов меньше — 51% против 74%. Уходят из топ‑лиг «отработанные» игроки, которые попробовали себя в элите и «насытились» или которые не подошли по уровню и другим критериям (психология, культура, характер, климат и пр.).

Попадание в топ‑лиги из европейских стран (90%) обусловлен требованиями этих лиг по приглашению иностранцев. Есть различные лимиты: на иностранцев не из ЕС, на игроков с другим гражданством в границах ЕС, на воспитанников академии и т. д.

Всё это увязано ещё и с получением рабочих виз. Там много нюансов. Пример по ограничениям: чтобы перейти в АПЛ из‑за пределов Европы, нужно быть игроком сборной и сыграть определенный процент матчей за неё (процент зависит от рейтинга сборной). Поэтому большинство игроков не из ЕС сначала приходят в чемпионаты попроще (Португалия, Бельгия, Нидерланды, Швейцария), а лучших оттуда берут в клубы топ‑лиг. Исключение составляют очень талантливые исполнители.

Приходы «не из клубов» и уходы «в никуда» — это система «свободных агентов». Часто проще доиграть контракт до конца или досрочно прекратить его, чтобы потом спокойно найти подходящий вариант, чем увязывать этот сложный процесс с переговорами о трансфере между клубами.

По возрасту: клубы топ‑лиг покупают молодых талантливых игроков, а воспитанников академий и «тех, кто не подошёл» массово отправляют в аренды, чтобы набрались опыта.

Автор делится правильными наблюдениями. Но они все укладываются в логику трансферной политики клубов топ‑лиг. Всё логично и объяснимо. Спасибо за интересный материал!

30 мар 2024

Роман, спасибо за подробный разбор! А есть ли какие‑то закономерности на дашборде, которые вас как знатока темы удивили или были неожиданными?

1 апр 2024
Роман Тихонов

Таня, закономерностей по трансферам на дашборде, которые удивили или были неожиданными, не увидел. Ничего такого не бросилось в глаза. Но поделюсь некоторыми другими соображениями по теме вашего материала. Может быть, они будут полезны.
Ваш опыт с визуализацией трансферов наглядно демонстрирует насколько важно при работе с данными понимать контекст этих данных. И не менее важно понимать, зачем все это делается. Красиво упакованные статистические данные и цифры — это красиво, это опыт для дизайнера (бесспорно, это крутая практика для развития и роста), но что они дают на практике людям в футбольной теме?
К чему я это? Приведу пример, как круто, по моему мнению, можно предоставлять данные по выбранной теме с учетом понимания контекста цифр и целей. Рассуждать буду условно, без привязки к конкретным цифрам, исходя из своих ощущений и опыта в теме многолетнего «бессмысленного созерцания» футбольных трансферов)
Берем выборку по национальностям игроков, которые пришли между топ‑лигами. Нам важны молодые игроки, в возрасте до 22 лет. Мы видим, что за последние десять лет в Испанию, Италию, Англию и Германию кроме игроков с соответствующим гражданством (испанцев, итальянцев, англичан, немцев), больше всего приходит молодых французов. О чем это говорит? Этот показатель подтверждает факт о силе сборной Франции в разрезе последних десяти лет (сборная — это индикатор среднестатистической силы игроков с французским паспортом). Французы победители чемпионата Мира 2018 и финалисты чемпионата Мира 2022.
Если бы у нас была выборка по национальностям за последние пять–десять трансферных сезонов, мы бы увидели динамику роста востребованности французских игроков. Это знание можно использовать для прогнозирования (условного конечно).
Если при просмотре выборки национальностей игроков за последние три года мы увидим резкий рост привлечения молодых игроков, например, с английским гражданством, то можно сделать вывод о том, что через несколько сезонов (когда молодые игроки выйдут на пик формы, а это где‑то 25–29 лет) сборная Англии будет фаворитом крупных турниров.
И отсюда вывод — визуализация должна делаться с расчетом понимания (в идеале профессионального понимания) контекста и целей, т. е. выборка конкретных статистических показателей должна подстраиваться под задачу. В моем примере для визуализации достаточно совместить параметры национальности и возраста по годам. И из этих данных можно работать с прогнозами состояния молодежных академий стран и перспектив национальных сборных. И конечно, относитесь к моему примеру снисходительно, он очень упрощен.

6 апр 2024

Роман, спасибо за подробные комментарии.

Согласна, что срез одного года мало что может проявить с точки зрения тенденций на рынке футбольных трансферов. Моя задача была в том, чтобы извлечь максимум из данных одного года (вспомните исходную диаграмму), и я довольна результатом. Дашборд хорош, как срез текущей ситуации, и не претендует на историческую перспективу и прогнозирование. Разумеется, если бы ко мне пришёл клиент с запросом на прогнозирование, я бы взяла в работу датасеты за несколько лет, и результат был бы соответствующий. Но это уже не формат эксперимента для бюрошных советов. Здесь я демонстрирую принципы и подход к работе с данными. Отнеситесь и вы снисходительно :‑)

И да, я всеми руками за погружение в предметную область, об этом речь пойдёт в ближайших теоретических заметках. В этом и ещё одном футбольном проекте Лаборатория данных я консультировалась с глубоко погружённым в тему коллегой.

6 апр 2024
Роман Тихонов

Таня, никто не спорит с результатом. Отличный результат. Особенно мне нравится применение «плитки» с национальностями игроков. Она отлично показывает количественную иерархию с разбивкой по сегментам (в вашем случае по регионам). Такую визуализацию любят в Statista. Я не в теме визуализации, но такие штуки красиво делают там.
Ни в коем случае не наезжаю на ваш эксперимент. Такие разборы — показатель уровня. Отличный разбор. Но с комментариями он становится немного лучше))
Спасибо вам!

10 апр 2024

Рекомендуем другие советы