Техносфера Group, МГУ им. М.В. Ломоносова.
Курс “Методы распределенной обработки больших объемов данных в Hadoop“
Лекция №2 “Основы Hadoop“
Лектор - Алексей Романенко.
История Hadoop и его применение. Хранение данных, кластер Hadoop. Системные принципы. Горизонтальное масштабирование вместо вертикального. Код к данным. Отказы оборудования. Инкапсуляция сложности реализации. Сравнение с СУБД (RDBMS). Экосистема Hadoop. Дистрибутивы, вендоры, поддерживаемые ОС. Полезная литература. Hadoop на Cloudera VM. Импорт и запуск VM. Копирование файлов в HDFS. Запуск MapReduce-задачи в Hadoop. Проверка результатов.
4 views
817
233
7 months ago 00:28:53 1
В 6 лет учу машинному обучению. Модель Титаника
1 year ago 00:14:01 1
Часть 01. Оптимизация настроек ОС перед установкой кластера Hadoop- “Школа Больших Данных“ г. Москва
1 year ago 00:00:18 10
Я умнее тебя у меня памяти 16 мегабайт
2 years ago 02:02:11 1
Лекция 4, Виктор Бородаенко, Основы Hadoop, современные подходы к обработке Big data
3 years ago 01:54:52 1
Онлайн-митап «Основы работы с PostGIS, Hadoop и Spark»
4 years ago 00:39:05 1
На пути к бессерверным базам данных — как и зачем? / Николай Голов (ManyChat)
4 years ago 00:06:05 1
Курс по Основам Hadoop от “Школы Больших Данных“ г Москва - введение в использование кластера Hadoop
6 years ago 00:31:55 12
Кластеризация BigData на примере подарков в ОК / Артур Кадурин ( Group)
8 years ago 01:25:13 44
BigData Training: Данила, BigData Tool Master, с похмелья злой (HappyDev’15)
9 years ago 00:26:50 17
Построение хранилища данных на основе платформы Hadoop / Игорь Нахват [DataTalks#4 ]
9 years ago 00:25:18 35
BIG DATA №10: Игорь Нахват, Wargaming “Построение хранилища данных на основе платформы Hadoop“