Инфраструктура data science: хранилища данных, ПО, витрины, озёра и важные скиллы
Гость: Влад Гоцуляк. Директор по Data&AI в «Еаптеке». Окончил МФТИ. В свободное время читает лекции для студентов кафедры БИТ в МФТИ по big data.
Содержание выпуска
— Из каких компонентов состоит инфраструктура data science в идеальном варианте и как компании её выстроить.
— Из каких источников в систему приходят сырые данные.
— Куда данные сохраняются и в каком виде.
— Как предварительно обрабатываются и готовятся данные.
— Как отбираются данные для обработки и анализа.
— Как происходит анализ в DS и чем он отличается от традиционной аналитики.
— Какие решения и инструменты существуют для анализа и изучения данных в data science.
— Витрины, озёра данных, Kafka, S3, Hadoop и всё остальное.
— Чем занимается отдел data science. Какие роли связаны с data science.
— Как правильно формулировать задачу для специалистов по data science, какие ошибки в формулировках задач могут встречаться.
— Насколько data science — это программирование. Чем задачи и стиль программирования специалистов по data science отличаются от задач и стиля программирования обычных разработчиков.
— Какие языки и для каких задач используются.
— Что необходимо знать специалисту для первой работы. Кто такие мидлы и сеньоры.
— Какие зарплаты, специализации и перспективы в data science.
Полезные ссылки
Apache Spark
Apache Hadoop
Язык программирования Scala
Amazon Simple Storage Service (S3)
Redis
MLflow
CI/CD
Apache Kafka
Debezium
Micro Batching
Витрина данных
Слои в data science
REST API
Модель вычислений MapReduce
Google File System
HDFS
Захват изменения данных
Apache NiFi
Nginx
Apache Airflow
Dimensional modeling
Сайт-тренажёр
«Книга с кабанчиком»
Codewars
LeetCode
YouTube-канал «Диджитализируй!»
Марк Лутц. «Изучаем Python»
Эви Немет, Гарт Снайдер, Трент Хейн, Бэн Уэйли, Дэн Макин. «Unix и Linux: руководство системного администратора»
Предложить тему, стать гостем подкаста, похвалить или поругать выпуск: @,
Стартовать в программировании вместе со Skillbox:
Наш подкаст удобно слушать на популярных платформах:
Castbox:
«Яндекс Музыка»:
Apple Podcasts:
Google Podcasts:
Подписывайтесь, ставьте лайки, делитесь с друзьями и оставляйте комментарии!
1 view
637
217
1 day ago 00:10:05 1
Как Интернет вещей – Интернет вещей и киберфизические системы будут определять четвертую промышленную революцию
2 days ago 00:22:29 1
VRF Lite: Что это и как это работает?
3 days ago 00:29:08 11
[Linus Tech Tips] My network is bigger than yours ;)
3 days ago 00:42:40 9.7K
Как Россию защищают от хакерских атак | Едем разбираться в Positive Technologies
3 days ago 01:19:28 1
Инфраструктура data science: хранилища данных, ПО, витрины, озёра и важные скиллы
3 days ago 00:21:35 197
Публичное облако 2.0: быстрее и выше | Теория большого ІТ
3 days ago 01:13:57 1
Code of Leadership #24 - Interview with Konstantin Evteev
3 days ago 01:54:25 1
Сессия 4А. Дискуссия. Проект IT PARK. Направление на эффективную цифровизацию Таджикистана. Стартапы.
4 days ago 00:00:55 1
Как создать первую видеоконференцию на сервере BigBlueButton
4 days ago 00:00:58 2
Как настроить DNS для услуги Антиспам
6 days ago 00:01:05 1
Закладка первого камня ЦОД Таттелеком: будущее начинается здесь
6 days ago 00:20:32 1
Эффективные методы развития продукта. Кейс «Магнита».
6 days ago 00:40:29 64
Вебинар : “Почему в 2025 году без промышленной платформы интеграции не обойтись?“
6 days ago 00:05:21 354
Энергетические объекты из портфолио ПСК. В честь дня электрика России! От АЭС до ГЭС!
7 days ago 00:04:53 1
Турция - Green Max 5*
7 days ago 00:06:14 2
Турция - Utopia World Hotel 5*
1 week ago 00:04:06 2.5K
Андрей Чибис: энергосистема региона объединяет лучшие традиции и передовой опыт
1 week ago 00:28:05 298
Смотри Хабаровск : подготовка Хехцира, конкурс «Амурский хрусталь», памятник Дзержинскому, Горэлектросеть
1 week ago 01:01:02 106
Как измениться майнинг в 2025 году? Какое оборудование выбрать? Подкаст с основателем YDM Group
2 weeks ago 00:44:57 262
Как работает Data Science — Пётр Лукьянченко /
2 weeks ago 00:08:57 4
Nanu Resort Arambol, Северный Гоа, Арамболь. Обзор отеля.
2 weeks ago 00:06:02 3
ITC Grand Goa 5* (ex. Park Hyatt Goa), Южный Гоа, Ароссим.
2 weeks ago 00:08:13 2
Riva Beach Resort, Северный Гоа, Мандрем. Обзор отеля.