sysadmin
Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédenteProchaine révisionLes deux révisions suivantes | ||
sysadmin [2020/01/31 16:38] – [Ressources] lpieri | sysadmin [2020/01/31 17:36] – lpieri | ||
---|---|---|---|
Ligne 12: | Ligne 12: | ||
* Modifier/ | * Modifier/ | ||
- | Plusieurs clés peuvent être ajoutées dans le fichier authorized_keys, | + | Plusieurs clés peuvent être ajoutées dans le fichier authorized_keys, |
====== Surveillance système ====== | ====== Surveillance système ====== | ||
Ligne 18: | Ligne 18: | ||
La surveillance système est un processus qui consiste en la vérification périodique du bon fonctionnement de tous les composants des serveurs hébergeant les différents applicatifs logiciels. | La surveillance système est un processus qui consiste en la vérification périodique du bon fonctionnement de tous les composants des serveurs hébergeant les différents applicatifs logiciels. | ||
- | Ce processus a été mise en place à la suite d'un erreur liée à l' | + | Ce processus a été mis en place à la suite d'une erreur liée à l' |
- | La surveillance système est composé | + | La surveillance système est composée |
* L' | * L' | ||
* L' | * L' | ||
* L' | * L' | ||
+ | === Formater et mettre à disposition les données === | ||
+ | |||
+ | Le premier outil se nomme Promethéus, | ||
+ | |||
+ | **Une Time Series DataBase est une base de données optimisée pour le stockage de données horodatées** | ||
+ | |||
+ | C'est l' | ||
+ | |||
+ | {{: | ||
+ | |||
+ | Il permet d' | ||
+ | |||
+ | === Récolter les données === | ||
+ | |||
+ | Prometheus fonctionne avec des exporter. Ce sont des outils qui récolter les données d'un serveur ou d'un service et les enregistrer dans Prometheus. Il en existe de nombreux pour tous types d' | ||
+ | |||
+ | [[https:// | ||
+ | |||
+ | === Alerter === | ||
+ | |||
+ | Prometheus possède un système d' | ||
+ | |||
+ | [[https:// | ||
+ | |||
+ | === Afficher les données === | ||
+ | |||
+ | Enfin, il est intéressant d' | ||
===== Ressources ===== | ===== Ressources ===== | ||
Ligne 60: | Ligne 87: | ||
===== Gestion des utilisateurs ===== | ===== Gestion des utilisateurs ===== | ||
- | Lors de l' | + | Lors de l' |
L' | L' | ||
Ligne 73: | Ligne 100: | ||
* Les permissions qui lui sont attribuées directement | * Les permissions qui lui sont attribuées directement | ||
* Toutes les permissions si il est **Grafana Admin** | * Toutes les permissions si il est **Grafana Admin** | ||
+ | |||
+ | ===== Gestion des alarmes ===== | ||
+ | |||
+ | Comme expliqué plus haut, les alarmes sont gérées par AlertManager. | ||
+ | |||
+ | AlertManager récupère les alertes remontées par Prometheus et les dispatche aux personnes concernées. Il est aussi capable de mettre en silence certaines alertes et d'en regrouper d' | ||
+ | |||
+ | [[https:// | ||
+ | |||
+ | Le fichier de configuration global d' | ||
+ | * les informations de connexions au serveur smtp | ||
+ | * la liste des destinataires des alertes | ||
+ | * la configuration du silence et du regroupement des alertes | ||
+ | |||
+ | La configuration des alertes en elle-mêmes est rédigée dans le dossier **/ | ||
+ | |||
+ | Dans ces fichiers sera décrit : | ||
+ | * le groupe | ||
+ | * le nom de l' | ||
+ | * la requête prometheus qui va identifier le comportement déclenchant l' | ||
+ | * le temps avant que l' | ||
+ | * un label pour identifier la sévérité de l' | ||
+ | * un sommaire et une description : c'est ce qu'on retrouvera dans la notification | ||
+ | |||
+ | Plusieurs alertes peuvent-être configurées dans un même fichier, à condition qu' | ||
+ | |||
+ | 2 alertes ont déjà été configurées : | ||
+ | * une alerte si le serveur dev n'est plus accessible pendant plus d'une minute. | ||
+ | * une alerte si le disque du serveur dev possède moins de 5% de capacité libre pendant plus de une minute. | ||
+ | |||
+ | **Attention !** A chaque de fois qu'un fichier d' | ||
+ | * que les droits du fichier sont prometheus: | ||
+ | * que le fichier est correctement construit avec la commande **promtool check rules path/ | ||
+ | * relancer prometheus avec **sudo systemctl restart prometheus** | ||