VK объявила о старте соревнования по созданию рекомендательных алгоритмов VK RecSys Challenge
AI VK открыла регистрацию на VK RecSys Challenge — соревнование по разработке алгоритмов рекомендаций. Инженерам и исследователям предстоит поработать с реальными данными крупного датасета VK-LSVD и предложить решения, которые помогут справляться с «холодным стартом», одной из самых сложных задач рекомендательных систем.
Соревнование VK RecSys Challenge ориентировано как на опытных специалистов в области анализа данных и рекомендательных алгоритмов, так и студентов. К участию приглашаются индивидуальные участники и команды до 4 человек. Общий призовой фонд составляет 2 500 000 рублей. Подать заявку можно до 15 декабря на сайте соревнования. Награждение победителей пройдет 17 января.
Большинство рекомендательных систем анализируют поведение пользователя, а затем подбирают релевантный для него контент. В VK RecSys Challenge задача зеркальна: участникам нужно построить модель, которая будет предсказывать, кому окажется интересен новый клип, даже если он ещё ни разу не показывался.
«Мы вновь проводим VK RecSys Challenge, чтобы поддерживать интерес сообщества к исследовательским задачам, которые напрямую связаны с реальными вызовами индустрии. Для нас важно, чтобы участники могли проверять идеи в условиях, максимально приближенных к реальности, ведь именно так появляются решения, которые действительно могут менять рекомендательные системы, — Андрей Зимовнов, руководитель направления рекомендаций VK.
Для решения участникам предоставили датасет VK-LSVD, включающий 40 миллиардов обезличенных пользовательских взаимодействий с 20 миллионами коротких видео. Участникам нужно сформировать список из 100 пользователей для каждого нового клипа, которым он, скорее всего, подойдёт. При этом каждый пользователь может быть использован не более 100 раз, что исключает возможность формального выполнения условия за счет универсальных активных пользователей.
Все решения автоматически проверяются: алгоритм сравнивает предсказания с закрытой тестовой выборкой и рассчитывает метрику качества. Участникам доступно до 5 сабмитов в день, а перед финалом они смогут выбрать до двух лучших.
Подробная информация о конкурсе и регистрация доступна по ссылке.