Mock собеседование на Junior Data Scientist

Курс Start ML: Лучший способ подготовиться к собеседованию — пройти его в тестовом режиме. Мы записали mock-интервью, которое состоит из 4-х секций: Python, ML, работа с данными и А/В Тесты. В независимости от уровня соискателя есть пул обязательных вопросов на знание основ Data Science и пул дополнительных вопросов в зависимости от уровня подготовки и опыта кандидата. Именно эти секции позволяют оценить широту знаний собеседуемого. Вопросы дают понять, умеет ли он составлять запросы к БД, писать код, строить модели и проверять их работу с помощью А/В-тестов. Все эти знания достаточно быстро проверяются на mock-собеседовании. Нашего гостя будет собеседовать преподаватель программы Hard ML Станислав Гафаров. Включайте, чтобы узнать, какие вопросы могут встретиться в интервью на позицию junior DS! Учитесь Data Science с нами: 0:00 Введение. 0:50 О структуре и секциях, которые входят в интервью. Секция «Python» 2:30 Вопрос на изменяемые и неизменяемые типы данных 6:21 Задача на dict и ответ Дмитрия 8:15 Объяснение первой задачи 10:38 Задача, цель которой — сделать, чтобы дикты были разные, ответ Дмитрия 13:51 Разбор второй задачи 16:10 Вопрос о выделении и очистке памяти в Python, ответ Дмитрия 16:26 Разбор вопроса 19:00 Вопрос о генераторах, декораторах и итераторах Секция «A/B-тесты» 20:35 Вопрос о моделировании A/B теста 30:57 Вопрос о генерации распределений 31:22 Подводка к критерию стьюдента и вопрос про ограничения его применения 32:26 О необходимости нормальности распределения 33:46 Тесты для проверки на нормальность 34:24 Как сравнить ненормальные распределения 35:02 Подводка к вопросу о нормальности распределения средних при бутстрапе 36:04 Как быть, если нет старых пользователей, и нужно провести тест только на новых 37:53 Какие еще бывают вопросы и общие рассуждения 41:19 Интерпретация Bootstrap Секция «Работа с данными» 42:04 Вопрос про разницу Where и Having 44:20 вопрос про виды join и задания на join 45:57 подводка к задаче про group by в Python 47:49 Задача на group by в Python Секция «ML алгоритмы» 1:06:22 Задача о линейных регрессиях 1:09:47 Вопрос о градиентном спуске 1:14:06 Вопрос о переобучении 1:22:20 Вопрос о деревьях и их построении 1:26:04 Вопрос: почему случайный лес работает хорошо и не переобучается? 1:28:20 Последний вопрос со звездочкой: в каких случаях логистическая регрессия на задачах классификации будет работать лучше, чем случайный лес 1:32:18 Конец, обратная связь
Back to Top