Apache Spark для дата инженеров. Рассказываем о программе
Apache Spark – самый популярный инструмент мира Big Data. Он позволяет обрабатывать большие объемы данных в распределенном режиме. При помощи него удобно создавать витрины данных, подключаясь к различным источникам: Kafka, Elasticsearch, Cassandra, а также создавать real-time приложения, позволяющие на лету пересчитывать и готовить свежие матрицы признаков для моделей машинного обучения, чтобы поддерживать их в актуальном состоянии.
Узнать подробнее о курсе и записаться:
10 views
8
4
1 month ago 00:03:19 8
Apache Spark in 100 Seconds
1 month ago 00:55:38 4
Практический вебинар: новые возможности DataSphere
1 month ago 02:15:12 3
DataOps Community Meetup
1 month ago 00:40:16 1
Как перенести, хранить и обрабатывать данные
1 month ago 00:57:59 1
Обработка данных на Apache Airflow в Yandex Cloud
1 month ago 00:50:15 6
Возможности легковесных кластеров Apache Spark в Yandex Data Proc
2 months ago 00:31:55 2
Гонта Виталий, Andersen Lab, Киев - ПОТОКОВАЯ ОБРАБОТКА ДАННЫХ В РЕАЛЬНОМ ВРЕМЕНИ
2 months ago 00:43:18 1
TopRater com: Машинное понимание миллионов отзывов / Павел Велихов (TopRater)
2 months ago 00:41:07 1
Пайплайн машинного обучения на Apache Spark / Павел Клеменков (Rambler&Co)
2 months ago 00:44:03 2
Визуализация активности клиентов по всему миру в реальном времени / Александр Сербул (1С-Битрикс)
2 months ago 00:44:41 2
Как подключить к Apache Spark проприетарный источник данных / Александра Белоусова (Яндекс.Go)
2 months ago 00:40:44 1
Потоковая обработка BigData для МТС / Евгений Ненахов (МТС Digital)
2 months ago 00:39:38 1
YTsaurus SPYT: помогаем планировщику Apache Spark быть ещё эффективнее / Алексей Шишкин (Яндекс)