Версия: Next

Релиз 11

“Мониторинг и Логирование”

В рамках поставки будут представленны следующие доработки в части мониторинга и логирования:

Установлены Prometheus и Grafana, в графане будт доступны следующие графики: (Примечание: Скриншоты ниже сделаны с помощью тестовой среды)
1. Healthcheck - Отображает доступность сервисов входящих в ADCP, с помощью которого возможно оценить доступности платформы и её элементов.
2. Kubernetes / Compute Resources / Cluster - отображает текущую загруженность всего K8S кластера в части RAM, CPU, Сети в разрезе неймспейсов K8S
3. Kubernetes / Compute Resources / Namespace (Pods) - отображает текущую загруженномсть всего K8S кластера в части RAM, CPU, Сети в разрезе каждого пода неймспейса кластера
4. Kubernetes / Compute Resources / Namespace (Workloads) - отображает текущую загруженность всех типов сущности кластера в части RAM, CPU, Сети в разрезе каждого пода неймспейса кластера
5. Kubernetes / Compute Resources / Node (Pods) - отображает текущую загруженность ноды кластера (сервера) с разбивкой на контейнеры
6. Kubernetes / Compute Resources / Pod - отображает потребление ресурсов каждым подом кластера в неймспейсе
7. Kubernetes / Networking / Cluster - Отображает текущую нагрузку на сеть всего K8S кластера в разрезе неймспейсов K8S
8. Kubernetes / Networking / Namespace (Pods) - Отображает текущую нагрузку на сеть всего K8S кластера в разрезе каждого пода неймспейса кластера
9. Kubernetes / Networking / Namespace (Workload) - Отображает текущую нагрузку на сеть всего K8S кластера в разрезе каждого пода неймспейса кластера
10. Kubernetes / Networking / Pod - Отображает текущую нагрузку на сеть каждым подом кластера в неймспейсе
11. Kubernetes / Views / Nodes - Отображает текущую загрузку каждой ноды кластера K8S
12. Easy RabbitMQ (K8S) - отображает основную информацию о брокере RabbitMQ - такие как количество очередей, каналов, сообщений в очередях
13. Elasticsearch - Cluster - отображает текущее состояние кластера ElasticSearch, отображает такие метрики как загруженность каждой ноды кластера, количество записей и чтений, индексацию, использование диска, RAM, CPU
В рамках Grafana реализован алертинг в части доступности каждого из компонента системы, в случае недоступности одного из сервисов в течении 5 мин будет срабатывать алерт о недоступности. Со списком доступных внешних систем для отправки нотификаций о сработке алерта возможно ознакомится в официальной документации Grafana по URL: https://grafana.com/docs/grafana/v9.0/alerting/contact-points/notifiers/
По умолчанию сбор метрик осуществляется каждые 10 сек, глубина хранения данных мониторинга составляет 3 недели. Глубина хранения и частота опроса настраивается при деплое Prometheus и опрашиваемых компонентов. Глубина хранения может быть увеличена или уменьшена для каждой поставки, так же как и частота опроса. Более детальная информация о настройках будет добавленна в документацию по результатам поставки релиза.
Будут установлены FileBeat, Kibana, ElasticSearch
1. С их помощью будут собираться логи сервисов ADCP
2. C их помощью будут собираться аудит логи по действиям выполняемыми пользователями в системе
3. Глубина хранения аудит логов по умолчанию
  1. для аудит логов 30 дней
  2. для технических логов 7 дней
4. Будет реализован доступ в Kibana для просмотра логов средствами Kibana

Релиз 11

“Мониторинг и Логирование”​

“Мониторинг и Логирование”