Изучаем описание метрик, мониторинга и системы оповещений под руководством старшего системного инженера Logrocon Ивана Худорожкова.
Рассматриваемые вопросы:
1. Что такое метрики и зачем их собирать?
2. Что такое мониторинг?
3. Программное обеспечение для мониторинга
4. Что такое система оповещений?
5. Какие данные нужно отслеживать?
6. 5 ошибок в настройке и процессе сбора данных
7. А что если не мониторить и не проверять свои данные?
8. Список литератур
Что такое метрики и зачем их собирать?
Метрика – это стандарт для измерения ресурса. Метрики могут ссылаться либо на ресурс и его единицы измерения, либо на данные, собранные об этом ресурсе.
Метод сбора и анализа проблем с производительностью инфраструктуры (железо, сеть).
Метод сбора высокоуровневых данных и анализа (веб сервисы, базы данных, очереди и тд).
Метод сбора и анализа бизнес-метрик.
Что такое метрики и зачем их собирать?
Метрика процесса
Целевая точка
Текущее измерение процесса
Результат усовершенствования процесса
Что такое мониторинг?
Мониторинг — это постоянный сбор и анализ различных параметров (метрик) поведения системы. С его помощью можно описать и измерить в числовом выражении каждый важный аспект проекта.
Данные из разных точек среды собираются системой мониторинга, которая отвечает за хранение, агрегацию, визуализацию данных и автоматические реагирует на изменения, когда значения соответствует заданным условиям.
Первая обязанность
Задача мониторинга
Программное обеспечение для мониторинга:
Grafana — универсальная обертка для работы с аналитическими данными, которые хранятся в разных источниках. Она сама ничего не хранит и не собирает, а является лишь универсальным клиентом для систем хранения метрик. Например, с помощью нее можно ходить за цифрами как в традиционную базу PostgreSQL, так и в специализированные аналитические системы типа Prometheus.
Prometheus - Система сбора данных временных рядов, разработанная музыкальной компанией SoundCloud для решения внутренних потребностей в быстрой и гибкой обработке продуктовых метрик. Продукт с задачей справился настолько хорошо, что был выпущен за границы SoundCloud и теперь доступен как opensource для всех желающих.
Zabbix — свободная система мониторинга и отслеживания статусов разнообразных сервисов компьютерной сети, серверов и сетевого оборудования, написанная Алексеем Владышевым.
Nagios — программа с открытым кодом, предназначенная для мониторинга компьютерных систем и сетей: наблюдения, контроля состояния вычислительных узлов и служб, оповещения администратора в том случае, если какие-то из служб прекращают свою работу.
USE Method:
Grafana
RED Method:
Prometheus
USE Method:
Zabbix
Nagios
USE Method — метод был предложен Brendan Gregg для анализа производительности любой системы. USE — это акроним от терминов Utilization, Saturation и Errors (Утилизация, Насыщение и Ошибки).
RED Method — подход, предложенный Tom Wilkie и является акронимом от (Requests) Rate, Errors, Duration ((Запросы) Скорость, Ошибки, Продолжительность). Он рассчитан на сбор метрик с самих приложений.
(Запрос) Rate
(Запрос) Errors
(Запрос) Duration
Для каждого приложения отслеживайте:
Задержка
Трафик
Ошибки
Насыщенность
USE Method:
Grafana Prometheus
UCA method:
UCA акроним от Users, Conversions, Activity (Пользователи, Преобразования, Деятельность) и он нацелен на измерение бизнес метрик сервиса. Его предложил Mike Julian и рассмотрел его в своем курсе Monitor Anything.
Conversions
Activity
UCA
UCA method:
Google Analytics
Yandex Metrika
Что такое система оповещений?
1. Мониторинг оборудования.
2. Мониторинг состояния приложений.
3. Мониторинг бизнес-метрик.
5 ошибок в настройке и процессе сбора данных
Человеческий фактор.
Отсутствие связи между бизнес-задачами и настройкой аналитики.
«Плавающее» руководство по сбору данных.
Разрозненные данные.
Отсутствие проверок.
Комплексный мониторинг - преимущества
Комплексный мониторинг - вывод
А что если не мониторить и не проверять свои данные?
Список литературы
Реферальные ссылки:
#xref_monitoring_golden-signals
Спасибо за внимание! :)
5 views
3086
751
5 years ago 00:44:51 6.2K
Основы мониторинга PostgreSQL / Алексей Лесовский (DataEgret)
2 years ago 02:37:29 704
Вебинар: «Электрофизиология гортанных нервов и основы мониторинга».
4 years ago 00:06:26 7
Знакомство с курсом “Основы видео ЭЭГ мониторинга“
2 months ago 02:03:31 659
Основы мониторинга Linux // Демо-занятие курса «Administrator Linux. Basic»
3 years ago 00:00:42 9.3K
На основе мониторинга
1 year ago 00:28:27 29
Основы мониторинга инфраструктуры распределённых систем
6 years ago 00:09:06 2
3.Основы мониторинга.MP4
6 years ago 01:19:26 137.8K
Клиент-серверное приложение для мониторинга нагрузки на сервер
2 months ago 00:38:45 5
Основы мониторинга и сбор метрик
4 years ago 02:02:15 1
Вебинар | Анестезиология. Основы аппаратного мониторинга
3 months ago 00:06:25 9
Знакомство с курсом _Основы видео ЭЭГ мониторинга_
2 years ago 01:02:17 57
Презентация рейтинга общественного здоровья (на основе мониторинга субъектов Российской Федерации)
4 months ago 01:19:14 1
Управление воспитательным процессом на основе моделирования и мониторинга | Николай БОРЫТКО
5 months ago 00:29:01 17
Non-legacy monitoring: построение системы мониторинга предприятия на основе IAC & ITAM практик
4 years ago 01:02:44 5
Лекция “Основы мониторинга земель“ - автор Быкова Е.Н.
3 years ago 00:02:23 109
Студент СурГУ разработал сайт для мониторинга состояния ковид-пациентов
6 months ago 00:03:14 267
Студия “Основы 3D моделирования“
3 months ago 09:33:42 116
XVII.B - Использование спутниковых данных в системах мониторинга - 12 ноября 2019
2 years ago 00:47:09 3.3K
Основы финансовой грамотности. Финансовая грамотность
2 months ago 00:31:40 1K
Прокачиваем подсистему мониторинга: детектирование атак с помощью решений на основе eBPF
3 years ago 00:03:13 15.3K
Автоматизированная система мониторинга «АСМ ЭРА»
3 years ago 00:08:39 11.5K
Результаты мониторинга качества дошкольного образования Российской Федерации, как основа повышения эффективности работы
12 years ago 00:12:01 150
Основы звукорежиссуры Урок 11. Мониторинг звука
7 years ago 00:03:56 5.1K
Эксперимент - создание автономной системы мониторинга