Антон Кленицкий | 2 место в задаче Matching, Data Fusion Contest 2022

Решение основано на старом добром ансамбле градиентых бустингов. Основной ингредиент решения – feature engineering. Есть несколько идей, которые позволяют существенно улучшить качество по сравнению с бейзлайном и публичными решениями. В качестве модели использовался catboost c ранжирующим лоссом. Обучим несколько моделей с одинаковыми параметрами на разных фичах, сделаем из них ансамбль – и готово. Постфактум все выглядит достаточно просто, но по ходу соревнования пришлось перепробовать много идей, которые не сработали. Полезные ссылки Data Fest Online 2022: Секция ML Trainings x Data Fusion Contest 2022: Хаб ВТБ: Наши соц.сети Telegram: Вконтакте: Twitter:

2 views

151