sysadmin
Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédenteProchaine révisionLes deux révisions suivantes | ||
sysadmin [2020/01/31 17:07] – [Surveillance système] lpieri | sysadmin [2020/02/28 12:17] – lpieri | ||
---|---|---|---|
Ligne 12: | Ligne 12: | ||
* Modifier/ | * Modifier/ | ||
- | Plusieurs clés peuvent être ajoutées dans le fichier authorized_keys, | + | Plusieurs clés peuvent être ajoutées dans le fichier authorized_keys, |
====== Surveillance système ====== | ====== Surveillance système ====== | ||
Ligne 18: | Ligne 18: | ||
La surveillance système est un processus qui consiste en la vérification périodique du bon fonctionnement de tous les composants des serveurs hébergeant les différents applicatifs logiciels. | La surveillance système est un processus qui consiste en la vérification périodique du bon fonctionnement de tous les composants des serveurs hébergeant les différents applicatifs logiciels. | ||
- | Ce processus a été mise en place à la suite d'un erreur liée à l' | + | Ce processus a été mis en place à la suite d'une erreur liée à l' |
- | La surveillance système est composé | + | La surveillance système est composée |
* L' | * L' | ||
* L' | * L' | ||
Ligne 31: | Ligne 31: | ||
**Une Time Series DataBase est une base de données optimisée pour le stockage de données horodatées** | **Une Time Series DataBase est une base de données optimisée pour le stockage de données horodatées** | ||
- | C'est l' | + | C'est l' |
{{: | {{: | ||
Ligne 87: | Ligne 87: | ||
===== Gestion des utilisateurs ===== | ===== Gestion des utilisateurs ===== | ||
- | Lors de l' | + | Lors de l' |
L' | L' | ||
Ligne 101: | Ligne 101: | ||
* Toutes les permissions si il est **Grafana Admin** | * Toutes les permissions si il est **Grafana Admin** | ||
+ | ===== Gestion des alarmes ===== | ||
+ | |||
+ | Comme expliqué plus haut, les alarmes sont gérées par AlertManager. | ||
+ | |||
+ | AlertManager récupère les alertes remontées par Prometheus et les dispatche aux personnes concernées. Il est aussi capable de mettre en silence certaines alertes et d'en regrouper d' | ||
+ | |||
+ | [[https:// | ||
+ | |||
+ | Le fichier de configuration global d' | ||
+ | * les informations de connexions au serveur smtp | ||
+ | * la liste des destinataires des alertes | ||
+ | * la configuration du silence et du regroupement des alertes | ||
+ | |||
+ | La configuration des alertes en elle-mêmes est rédigée dans le dossier **/ | ||
+ | |||
+ | Dans ces fichiers sera décrit : | ||
+ | * le groupe | ||
+ | * le nom de l' | ||
+ | * la requête prometheus qui va identifier le comportement déclenchant l' | ||
+ | * le temps avant que l' | ||
+ | * un label pour identifier la sévérité de l' | ||
+ | * un sommaire et une description : c'est ce qu'on retrouvera dans la notification | ||
+ | |||
+ | Plusieurs alertes peuvent-être configurées dans un même fichier, à condition qu' | ||
+ | |||
+ | 2 alertes ont déjà été configurées : | ||
+ | * une alerte si le serveur dev n'est plus accessible pendant plus d'une minute. | ||
+ | * une alerte si le disque du serveur dev possède moins de 5% de capacité libre pendant plus de une minute. | ||
+ | |||
+ | **Attention !** A chaque de fois qu'un fichier d' | ||
+ | * que les droits du fichier sont prometheus: | ||
+ | * que le fichier est correctement construit avec la commande **promtool check rules path/ | ||
+ | * relancer prometheus avec **sudo systemctl restart prometheus** | ||
+ | |||
+ | ===== Monitorer CouchDB ===== | ||
+ | |||
+ | Exporter Prometheus pour CouchDB : [[https:// | ||
+ | |||
+ | Cet exporter fonctionne exclusivement avec Docker il faut donc l' | ||
+ | |||
+ | [[https:// | ||
+ | |||
+ | Il faut ajouter l' | ||
+ | |||
+ | < | ||
+ | |||
+ | Puis se reconnecter. | ||
+ | |||
+ | L' | ||
+ | |||
+ | < | ||
+ | docker run -d --restart always -p 9984:9984 gesellix/ | ||
+ | </ | ||
+ | |||
+ | Ajouter l' | ||
+ | |||
+ | < | ||
+ | - job_name: ' | ||
+ | scrape_interval: | ||
+ | static_configs: | ||
+ | - targets: [' | ||
+ | </ | ||
+ | |||
+ | Ajouter une rêgle d' | ||
+ | |||
+ | < | ||
+ | dev@ubuntu1804-betterb-dev: | ||
+ | groups: | ||
+ | - name: couchdb.rules | ||
+ | rules: | ||
+ | - alert: CouchDbDownAlert | ||
+ | expr: absent(couchdb_httpd_up) or couchdb_https_up < 1 | ||
+ | for: 1m | ||
+ | annotations: | ||
+ | summary: CouchDB Node Down | ||
+ | </ | ||