089. Мастер класс Решение задач классификации при помощи CatBoost – Никита Дмитриев
PyData Moscow, 13 октября 2018 г.
Градиентный бустинг — метод машинного обучения, появление которого привело к прорыву в решении многих задач, включая поиск в интернете, создание рекомендательных систем и прогнозирование погоды. На протяжении многих лет он остаётся основным методом работы с неоднородными признаками, зашумлёнными данными и сложными зависимостями.
CatBoost — это библиотека градиентного бустинга с открытым исходным кодом. Она превосходит по качеству аналоги и имеет дополнительные преимущества. CatBoost поддерживает работу с категориальными признаками (например, жанрами музыки, ID устройства, URL и т. д.) без предобработки данных. У него очень хорошие дефолтные параметры, поэтому их не нужно настраивать для получения качественных моделей. А GPU-реализация CatBoost — самая быстрая среди общедоступных реализаций градиентного бустинга.
С возможностями библиотеки мы будем знакомиться на примере решения задачи классификации. Вместе мы пройдём все этапы построения модели прогнозирования и рассмотрим следующие темы:
- Выбор подходящих функций потерь и метрик для оптимизации.
Обучение модели.
- Визуализация процесса обучения и кросс-валидации.
- Работа со встроенным детектором переобучения.
- Выбор оптимального порога принятия решения.
- Важность признаков и интерпретация прогнозов модели.
- Применение обученной модели к тестовым данным.
Для участия мастер-классе нужен настроенный Jupyter Notebook с установленными библиотеками: catboos, ipywidgets, sklearn, matplotlib, shap.
Никита Дмитриев
Окончил механико-математический факультет МГУ и Школу анализа данных. В Яндексе занимается разработкой систем машинного обучения.
Другие материалы PyData Moscow –
1 view
561
141
2 months ago 00:03:51 1
KIKI - Get Up [Official MV]
5 months ago 01:29:53 1
Матвеенко В. Н. - Коллоидная химия - Реология
5 months ago 02:14:47 1
Ваше послание из магического мира. Таро поток
5 months ago 00:40:17 1
Напутствие и информация от Рода.
5 months ago 01:23:42 1
Кураков А. В. - Низшие растения - Отдел Аскомикота
6 months ago 00:03:54 1
KEYGEN CHURCH - Tenebre Rosso Sangue (ULTRAKILL P-2 Theme #1)
6 months ago 00:12:39 1
ОКУНЬ БЕЗ УМА от ЭТОЙ ПРИМАНКИ / РЫБАЛКА на СПИННИНГ
6 months ago 00:09:09 1
Как выбрать ЗАГОРОДНЫЙ ДОМ? Обзор современного и комфортного ДОМА МЕЧТЫ | Проект от А до Я
8 months ago 00:15:24 1
Клайв Стейплз Льюис. Письма Баламута
9 months ago 00:31:04 1
Фильм к 50-летию легендарного Нижневартовского УБР №1 (2014)
9 months ago 00:53:49 1
Разбор мастер-класса “Хомяк“ крючком. Амигуруми крючком. Одежда для амигуруми
9 months ago 00:59:50 1
Mephistofeles - Devotional Doom (Full Album 2017)
10 months ago 02:29:07 2
Metallica Live S&M (Subtitulado) - FULL CONCERT 1080p ᴴᴰ HQ
10 months ago 00:36:41 1
MASTER BOOT RECORD - INTERNET PROTOCOL
10 months ago 00:05:08 1
บุญผลา สัญญาฮัก - ใหม่ พัชรี Ft. วิเชียร ไชยเลิศ [ Official MV ]
10 months ago 00:52:29 1
The Döner Kebap from Heaven | Yaprak Döner Kebap | Turkish Street Food in Berlin
11 months ago 00:19:06 1
ШАПКА Бини с дырками и модной макушкой🔥 | Мастер-класс 🧶
1 year ago 02:29:06 3
Metallica & San Francisco Symphony: S&M
1 year ago 00:05:56 1
05 ПРИЗ В ЧЕСТЬ ДНЯ ПОБЕДЫ . Жер. и коб. рожд. 2017 г. Воронежский ипподром
1 year ago 01:09:20 1
Профильный ЕГЭ 2023 математика. Задача 4. Сложная теория вероятностей
1 year ago 00:00:00 1
The resonance has made the paradigm shift unstoppable - DAY 2 UPDATE
1 year ago 00:04:56 2
ЖАНЕ, ВОДОПАДЫ! КУПАЮСЬ В ЛЕДЯНОЙ ВОДЕ В ОКТЯБРЕ! :) 😄 #геленджик2023 #октябрь2023 #осень2023 #жане
1 year ago 01:26:07 1
089. Мастер класс Решение задач классификации при помощи CatBoost – Никита Дмитриев