Валерия Дымбицкая Ищем релевантные признаки из сотен источников для любой модели
Ближайшая конференция I’ML:
#imlconf #ml #mlops #IT #conference #jugrugroup
Итак, вы хотите использовать внешние данные для обучения. Как найти нужные? Можно опираться на метаданные датасетов: их схему, описание, различные фильтры... и потом погрузиться в работу по очистке данных и в эксперименты. И может случиться так, что с виду хороший датасет совсем не подходит для вашей задачи.
А если иначе? Мы в Upgini делаем сервис, который упрощает этот процесс до одного запроса в Google вызова open-source библиотеки. Каков путь от эталона и сотен источников до фич, повышающих GINI? Какие ловушки подстерегают, когда из тысяч признаков нужно выбрать оптимальный набор? И при чем тут LLM? Обо всем этом расскажу в своем докладе.
Скачать презентацию с сайта —
25 views
4310
1541
2 months ago 00:44:00 1
Автоматический подбор параметров для Spark-приложений / Валерия Дымбицкая (OneFactor)
7 months ago 00:41:43 27
Валерия Дымбицкая — Ищем релевантные признаки из сотен источников для любой модели
2 years ago 00:32:39 8
Валерия Дымбицкая. Кластеровыжималка. Автотюнинг параметров сложной системы на примере Spark