Валерия Дымбицкая. Кластеровыжималка. Автотюнинг параметров сложнои системы на примере Spark
Пусть есть система, в которой множество вариативных процессов появляются без вашего контроля и конкурируют за ограниченный ресурс. Это могут быть деплойменты в kubernetes-кластере или, как у нас — сотни и тысячи расчётов на Apache Spark в кластере Hadoop. И при высокой нагрузке мы столкнулись с недоутилизацией ресурсов.
В разных сценариях это может решаться по-разному, но наша конфигурация (и некоторые ограничения Spark) подтолкнули нас к созданию автотюнинга. Это система, которая постоянно мониторит регулярные процессы и сама правит их параметры — например, использование RAM. Мы использовали ML для обслуживания своего ML и встроили это всё в продакшн-цикл.
На основе этого опыта я покажу принцип создания такой системы, который можно применить практически ко всему, что пишет логи. Я расскажу, как простыми средствами мы сделали свою «кластеровыжималку», а также как её можно развить и применить конкретно к вашему случаю.
Презентация –
Сайт –
5 views
497
176
2 months ago 00:44:00 1
Автоматический подбор параметров для Spark-приложений / Валерия Дымбицкая (OneFactor)
7 months ago 00:41:43 26
Валерия Дымбицкая — Ищем релевантные признаки из сотен источников для любой модели
2 years ago 00:32:39 8
Валерия Дымбицкая. Кластеровыжималка. Автотюнинг параметров сложной системы на примере Spark