Искусственный интеллект предсказал победителя чемпионата мира по футболу 2018

Искусственный интеллект предсказал победителя чемпионата мира по футболу 2018


В результате оценки 100,000 вероятных комбинаций, исследователи с помощью искусственного интеллекта, пришли к выводу о том, какая команда наиболее вероятно выиграет чемпионат мира по футболу 2018 года.

Как известно, одним из способов прогнозирования результатов крупных спортивных событий является анализ букмекерских ставок. Букмекерские компании используют услуги профессионалов в сфере статистики для анализа обширных баз данных и оценки вероятности того или иного результата.

Еще более интересный эффект может быть получен при анализе вероятности на основе вариантов, полученных от разных букмекеров. Например, исходя из этого подхода, Бразилия в данный момент является явным фаворитом в чемпионате 2018 года с вероятностью 16,6%. За ней следуют Германия (12.8%) и Испания (12.5%).

Однако, в последние годы были разработаны новые методы машинного обучения, которые имеют все шансы превзойти традиционные подходы в оценке статистики. Андреас Гролл и несколько его коллег из Технического Университета Дортмунда (Германия) использовали комбинацию машинного обучения и обычной статистики, применяя метод «случайного леса» (random-forest approach).

Random forest — это алгоритм машинного обучения, предложенный Лео Брейманом и Адель Катлер, заключающийся в использовании комитета (ансамбля) решающих деревьев (на «древе принятия решений»). Алгоритм применяется для задач классификации, регрессии и кластеризации. Основная идея заключается в использовании большого ансамбля решающих деревьев, каждое из которых само по себе даёт очень невысокое качество классификации, но за счёт их большого количества итог прогнозирования получается гораздо более точным (подробнее см. тут: Random forest).

Гролл и группа исследователей начали с широкого спектра потенциальных факторов, которые могут повлиять на конечный результат. К ним относятся такие экономические факторы, как ВВП и население страны, положение национальных сборных в рейтинге ФИФА, а также особенности самих команд, включая средний возраст игроков и их количество в Лиге Чемпионов, национальность тренера и т.д.

При этом, подход, основанный на методе «случайного леса», позволил исследователям включить в выборку и другие попытки ранжирования, например, такие как рейтинги, используемые разными букмекерами.

Предварительный результат, полученный методом случайного леса, указывает на Испанию как наиболее вероятного победителя с вероятностью 17.8%. Однако, важнейшим фактором в данном прогнозе является структура самого турнира. Исходя из этого, первичные шансы Германии достичь четвертьфинала составляют 58%, в то время как Испании — 73%. Если обе команды выступают в четвертьфинале, то они имею примерно равные шансы на победу. При этом, основной риск Германии состоит в большей (относительно Испании) вероятности выбыть до 1/8 финала.

Но метод «случайного дерева» позволяет моделировать весь турнир как целостную последовательность событий и это приводит к несколько иному результату. Так, исходя из анализа 100,000 вероятных комбинаций, исследователи пришли к выводу, что наиболее вероятный сценарий — это все-таки победа Германии.

По словам Гролла, в начале турнира Испания имеет больше шансов на победу. Но если Германия выходит в четвертьфинал, то она становится фаворитом и с наибольшей вероятностью в итоге выигрывает чемпионат мира по футболу 2018.

Очевидно, новые технологии с каждым днем все больше проникают в сферу спорта. Это не случайно, т.к. сам спорт уже давно превратился в высокодоходный бизнес. Для этого достаточно посмотреть, например, на оценку самых дорогих спортивных франшиз (подробнее см. тут: Топ-50 самых дорогих спортивных команд мира).

Источник инфографики: MIT Technology Review

Роман Комыза

15.05.2018

Понравился материал? Поддержите развитие сайта www.komyza.com
Карта Приватбанка 5168 7556 2066 1971

Подписывайтесь на мой Facebook: facebook.com/RomanKomyza и на мой канал в Telegram: t.me/komyza