sysadmin
Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédenteProchaine révisionLes deux révisions suivantes | ||
sysadmin [2020/01/31 16:38] – [Ressources] lpieri | sysadmin [2020/01/31 17:34] – [Gestion des utilisateurs] lpieri | ||
---|---|---|---|
Ligne 25: | Ligne 25: | ||
* L' | * L' | ||
+ | === Formater et mettre à disposition les données === | ||
+ | |||
+ | Le premier outil se nomme Promethéus, | ||
+ | |||
+ | **Une Time Series DataBase est une base de données optimisée pour le stockage de données horodatées** | ||
+ | |||
+ | C'est l' | ||
+ | |||
+ | {{: | ||
+ | |||
+ | Il permet d' | ||
+ | |||
+ | === Récolter les données === | ||
+ | |||
+ | Prometheus fonctionne avec des exporter. Ce sont des outils qui récolter les données d'un serveur ou d'un service et les enregistrer dans Prometheus. Il en existe de nombreux pour tous types d' | ||
+ | |||
+ | [[https:// | ||
+ | |||
+ | === Alerter === | ||
+ | |||
+ | Prometheus possède un système d' | ||
+ | |||
+ | [[https:// | ||
+ | |||
+ | === Afficher les données === | ||
+ | |||
+ | Enfin, il est intéressant d' | ||
===== Ressources ===== | ===== Ressources ===== | ||
Ligne 73: | Ligne 100: | ||
* Les permissions qui lui sont attribuées directement | * Les permissions qui lui sont attribuées directement | ||
* Toutes les permissions si il est **Grafana Admin** | * Toutes les permissions si il est **Grafana Admin** | ||
+ | |||
+ | ===== Gestion des alarmes ===== | ||
+ | |||
+ | Comme expliqué plus haut, les alarmes sont gérées par AlertManager. | ||
+ | |||
+ | AlertManager récupère les alertes remontées par Prometheus et les dispatche au personnes concernées. Il est aussi capable de mettre en silence certaines alertes et d'en regrouper d' | ||
+ | |||
+ | [[https:// | ||
+ | |||
+ | Le fichier de configuration global d' | ||
+ | * les informations de connexions au serveur smtp | ||
+ | * la liste des destinataires des alertes | ||
+ | * la configuration du silence et du regroupement des alertes | ||
+ | |||
+ | La configuration des alertes en elle-mêmes est rédigée dans le dossier **/ | ||
+ | |||
+ | Dans ces fichiers sera décrit : | ||
+ | * le groupe | ||
+ | * le nom de l' | ||
+ | * la requête prometheus qui va identifier le comportement déclenchant l' | ||
+ | * le temps avant que l' | ||
+ | * un label pour identifier la sévérité de l' | ||
+ | * un sommaire et une description : c'est ce qu'on retrouvera dans la notification | ||
+ | |||
+ | Plusieurs alertes peuvent-être configurées dans un même fichier, à condition qu' | ||
+ | |||
+ | 2 alertes ont déjà été configurées : | ||
+ | * une alerte si le serveur dev n'est plus accessible pendant plus d'une minute. | ||
+ | * une alerte si le disque du serveur dev possède moins de 5% de capacité libre pendant plus de une minute. | ||
+ | |||
+ | **Attention !** A chaque de fois qu'un fichier d' | ||
+ | * que les droits du fichier sont prometheus: | ||
+ | * que le fichiers est correctement construit avec la commande **promtool check rules path/ | ||
+ | * relancer prometheus avec **sudo systemctl restart prometheus** | ||