sysadmin
Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédenteProchaine révisionLes deux révisions suivantes | ||
sysadmin [2020/01/31 17:07] – [Surveillance système] lpieri | sysadmin [2020/01/31 17:36] – lpieri | ||
---|---|---|---|
Ligne 12: | Ligne 12: | ||
* Modifier/ | * Modifier/ | ||
- | Plusieurs clés peuvent être ajoutées dans le fichier authorized_keys, | + | Plusieurs clés peuvent être ajoutées dans le fichier authorized_keys, |
====== Surveillance système ====== | ====== Surveillance système ====== | ||
Ligne 18: | Ligne 18: | ||
La surveillance système est un processus qui consiste en la vérification périodique du bon fonctionnement de tous les composants des serveurs hébergeant les différents applicatifs logiciels. | La surveillance système est un processus qui consiste en la vérification périodique du bon fonctionnement de tous les composants des serveurs hébergeant les différents applicatifs logiciels. | ||
- | Ce processus a été mise en place à la suite d'un erreur liée à l' | + | Ce processus a été mis en place à la suite d'une erreur liée à l' |
- | La surveillance système est composé | + | La surveillance système est composée |
* L' | * L' | ||
* L' | * L' | ||
Ligne 31: | Ligne 31: | ||
**Une Time Series DataBase est une base de données optimisée pour le stockage de données horodatées** | **Une Time Series DataBase est une base de données optimisée pour le stockage de données horodatées** | ||
- | C'est l' | + | C'est l' |
{{: | {{: | ||
Ligne 87: | Ligne 87: | ||
===== Gestion des utilisateurs ===== | ===== Gestion des utilisateurs ===== | ||
- | Lors de l' | + | Lors de l' |
L' | L' | ||
Ligne 100: | Ligne 100: | ||
* Les permissions qui lui sont attribuées directement | * Les permissions qui lui sont attribuées directement | ||
* Toutes les permissions si il est **Grafana Admin** | * Toutes les permissions si il est **Grafana Admin** | ||
+ | |||
+ | ===== Gestion des alarmes ===== | ||
+ | |||
+ | Comme expliqué plus haut, les alarmes sont gérées par AlertManager. | ||
+ | |||
+ | AlertManager récupère les alertes remontées par Prometheus et les dispatche aux personnes concernées. Il est aussi capable de mettre en silence certaines alertes et d'en regrouper d' | ||
+ | |||
+ | [[https:// | ||
+ | |||
+ | Le fichier de configuration global d' | ||
+ | * les informations de connexions au serveur smtp | ||
+ | * la liste des destinataires des alertes | ||
+ | * la configuration du silence et du regroupement des alertes | ||
+ | |||
+ | La configuration des alertes en elle-mêmes est rédigée dans le dossier **/ | ||
+ | |||
+ | Dans ces fichiers sera décrit : | ||
+ | * le groupe | ||
+ | * le nom de l' | ||
+ | * la requête prometheus qui va identifier le comportement déclenchant l' | ||
+ | * le temps avant que l' | ||
+ | * un label pour identifier la sévérité de l' | ||
+ | * un sommaire et une description : c'est ce qu'on retrouvera dans la notification | ||
+ | |||
+ | Plusieurs alertes peuvent-être configurées dans un même fichier, à condition qu' | ||
+ | |||
+ | 2 alertes ont déjà été configurées : | ||
+ | * une alerte si le serveur dev n'est plus accessible pendant plus d'une minute. | ||
+ | * une alerte si le disque du serveur dev possède moins de 5% de capacité libre pendant plus de une minute. | ||
+ | |||
+ | **Attention !** A chaque de fois qu'un fichier d' | ||
+ | * que les droits du fichier sont prometheus: | ||
+ | * que le fichier est correctement construit avec la commande **promtool check rules path/ | ||
+ | * relancer prometheus avec **sudo systemctl restart prometheus** | ||