Grafana

01 // Indicateur Principal

TRS - Taux de Rendement Synthetique

L'indicateur roi du suivi de performance industrielle. Voyons comment le construire et l'afficher efficacement dans Grafana.

Qu'est-ce que le TRS ?

Le Taux de Rendement Synthetique est l'indicateur de reference en industrie pour mesurer la performance globale d'un equipement. Il combine trois facteurs multiplicatifs :

Disponibilite

Temps de production reel divise par le temps d'ouverture. Impacte par les pannes, les changements de serie, les reglages.

Performance

Ratio entre la cadence reelle et la cadence theorique. Impacte par les micro-arrets, les ralentissements, les sous-vitesses.

Qualite

Nombre de pieces conformes divise par le nombre total produit. Impacte par les rebuts, les retouches, les pertes au demarrage.

Formule du TRS

TRS = Disponibilite x Performance x Qualite

// Exemple avec notre machine MACHINE_01 :
// Disponibilite = 60% (beaucoup de pannes)
// Performance   = 70% (cadence reduite)
// Qualite       = 73% (rebuts CPT)
// TRS = 0.60 x 0.70 x 0.73 = 30.6%

// Objectifs industriels standards :
//   > 85% = World Class (excellence)
//   60-85% = Acceptable
//   < 60% = Insuffisant, actions requises
//   Notre machine a 30.6% -> actions urgentes necessaires

Gauge

Vue d'ensemble instantanee

La jauge donne une lecture instantanee du TRS. A 30.6%, on voit immediatement que la machine est loin de son potentiel optimal. La couleur jaune indique un niveau d'alerte modere.

Pourquoi une Gauge ? Dans un contexte industriel, les operateurs doivent voir d'un seul coup d'oeil si la machine tourne bien. La jauge semi-circulaire imite un cadran physique : le cerveau humain l'interprete instantanement, contrairement a un chiffre brut ou une courbe. Les seuils de couleurs (rouge/jaune/bleu) renforcent ce message visuel.

Les threshold markers (la bande exterieure rouge/jaune/bleu) permettent de voir ou se situe la valeur par rapport aux zones de performance. Ici, la zone rouge (0-30%) est presque atteinte, ce qui est un signal d'alarme.

Choisir le type Gauge

Dans le panneau de visualisation a droite, cliquez sur le selecteur et choisissez "Gauge". Grafana affiche automatiquement une jauge semi-circulaire avec la valeur au centre. L'orientation "Auto" fonctionne bien pour un panneau unique.

Requete Lucene sur Raw Data

La source de donnees est Elastic indus-dms-gem-bench. On utilise le mode Raw Data (et non Metrics) car on veut la valeur brute stockee dans Elasticsearch, pas une agregation. Le Size: 500 recupere les 500 derniers documents correspondants.

Calcul "Last *" (Last non-null)

Dans Value options > Calculation, selectionnez "Last *". La difference avec "Last" simple : "Last *" ignore les valeurs null et prend la derniere valeur reelle. C'est essentiel quand les donnees ont des trous (machine eteinte, perte de connexion).

Color scheme "From thresholds"

Dans Standard options > Color scheme, choisissez "From thresholds (by value)". Ensuite definissez vos seuils : base verte, 0% orange/jaune, un seuil a 60% bleu. La couleur du chiffre ET de la jauge changent automatiquement selon la valeur.

Activer les Threshold Markers

Dans les options Gauge, activez "Show threshold markers". Cela ajoute la bande coloree exterieure (rouge/jaune/bleu) autour de la jauge qui sert de reference visuelle permanente.

Cliquez pour zoomer - Gauge TRS avec visualisation et requete

Configuration detaillee :

Lucene Query - TRS Gauge

// Requete Elasticsearch pour recuperer le TRS
MACHINE_01 AND metrics.custom.name:"TRS"

// Type: Raw Data | Size: 500
// Calcul: Last * (derniere valeur non-null)

Le mode Raw Data est ideal quand vous voulez la valeur exacte sans agregation. Combinez-le avec "Last *" pour toujours afficher la donnee la plus recente, meme si des valeurs null existent.

Comprendre Raw Data vs Metrics vs Logs vs Raw Document ▼

Elasticsearch dans Grafana propose 4 modes de requete. Chacun a un usage different :

Metrics - Effectue des agregations (Count, Sum, Max, Average, etc.) cote serveur Elasticsearch. Ideal pour les bar charts et time series qui necessitent des calculs sur les donnees (ex: "nombre de pannes par jour"). C'est le mode le plus performant car Elasticsearch fait le calcul.
Raw Data - Retourne les documents bruts tels qu'ils sont stockes dans l'index. Grafana fait ensuite le calcul (Last, First, Max...). Utilise ici pour le TRS car on veut la valeur exacte du champ metrics.custom.numeric_value, pas une agregation.
Logs - Formate les documents comme des logs avec timestamp et message. Utile pour les panels de type Logs, pas pour les metriques numeriques.
Raw Document - Retourne le JSON complet du document Elasticsearch. Utile pour le debug mais pas pour l'affichage de metriques.

Regle generale : Utilisez Metrics quand vous avez besoin d'agreger (sommes, moyennes, comptages par periode). Utilisez Raw Data quand vous voulez une valeur ponctuelle (la derniere mesure, un total stocke).

Time Series

Evolution temporelle du TRS

Le graphique Time Series montre l'evolution du TRS sur les 90 derniers jours. On observe un pic autour du 12 decembre (~25%) puis un retour a 0%, indiquant des periodes d'arret de la machine.

Pourquoi un Time Series ici ? Contrairement a la Gauge qui donne une photo instantanee, le Time Series revele les tendances et les patterns. On peut voir quand la machine a ete productive, identifier les periodes de maintenance, et correler avec les pannes. L'intervalle de 1h (Interval = 1h) offre une granularite suffisante sans surcharger le graphique.

Style du graphique - Chaque parametre explique ▼

Style: Lines - Les 3 modes sont Lines (courbe), Bars (barres) et Points (nuage). Lines est le choix standard pour les series temporelles car il montre la continuite des donnees.
Line interpolation: Smooth - L'interpolation lisse (premiere icone) arrondit les angles entre les points de donnees. Ca rend le graphique plus agreable visuellement, mais attention : ca peut donner l'illusion de valeurs qui n'existent pas entre deux points.
Line width: 2 - Epaisseur de la ligne en pixels. 1 est trop fin (dur a voir de loin), 3+ est trop epais si vous avez plusieurs series. 2 est le bon compromis.
Fill opacity: 20 - L'aire sous la courbe est remplie a 20% d'opacite. Ca donne du "poids" visuel a la courbe sans la rendre illisible. Pour un dashboard industriel sur grand ecran, 15-25% est ideal.
Gradient mode: Opacity - Le remplissage degrade du haut (opaque) vers le bas (transparent). C'est plus esthetique qu'un aplat uniforme et aide a lire les valeurs basses.
Line style: Solid - Ligne continue. Dash (pointille) et Dots (pointille court) sont utiles pour differencier plusieurs series sur un meme graphique.
Connect null values: Never - Les trous dans les donnees restent visibles comme des interruptions. C'est important : si la machine est eteinte, on ne veut pas que Grafana "invente" une connexion entre les points.
Show points: Auto - Grafana decide automatiquement d'afficher les points de donnees quand le zoom le permet. Sur 90 jours, ils sont masques pour la lisibilite.

Options Standard - Configuration detaillee ▼

Unit: Percent (0-100) - Dit a Grafana que la valeur est un pourcentage. L'axe Y affiche automatiquement le symbole "%" et adapte l'echelle de 0 a 100.
Min: auto / Max: 100 - Le minimum est calcule automatiquement, mais le maximum est fixe a 100%. Fixer le max evite que l'axe Y change selon les donnees, ce qui facilite la comparaison dans le temps.
Display name: TRS - Renomme la serie dans la legende. Sans ca, Grafana afficherait le nom brut du champ Elasticsearch, souvent incomprehensible.
Color scheme: Single color (bleu) - Une seule couleur fixe pour la serie. Ideal quand on n'a qu'une serie. Si vous ajoutez le TRP, passez en "Classic palette" pour avoir des couleurs differentes automatiquement.
Transparent background: ON - Supprime le fond gris du panneau pour une integration visuelle propre dans le dashboard. Les panneaux se fondent dans le fond sombre.
Tooltip mode: Single - Affiche uniquement la valeur de la serie survolee. En mode "All", on verrait toutes les series du panneau au survol (utile si TRS + TRP sont sur le meme graphique).

Comment ameliorer ce graphique ? ▼

Ajouter des alertes Grafana - Configurez une alerte dans l'onglet "Alert" du panneau qui envoie une notification (email, Slack, Teams) quand le TRS descend sous 50%. Condition : avg() of TRS is below 50 sur les 6 dernieres heures.
Annotations d'evenements - Ajoutez une source d'annotations qui marque les periodes de maintenance preventive, les changements de serie, et les interventions. Ca permet de correler visuellement "le TRS a chute ici parce qu'il y a eu un changement d'outil".
Thresholds avec zones colorees - Ajoutez des thresholds visuels sur le graphique : une zone rouge sous 30%, orange sous 60%, verte au-dessus. L'operateur voit immediatement dans quelle zone il se trouve.
Superposer TRS et TRP - Au lieu de deux panneaux separes, mettez les deux series sur le meme graphique avec des couleurs differentes et activez Tooltip mode "All". Ca permet de comparer instantanement.
Ajouter une moyenne mobile - Utilisez une transformation "Add field from calculation" avec une fenetre glissante de 7 jours pour lisser la tendance et filtrer le bruit.
Varier la plage temporelle - Le selecteur "Last 90 days" en haut a droite est modifiable. Pour le suivi quotidien, "Last 7 days" avec intervalle 15min donne plus de detail. Pour les revues mensuelles, "Last 6 months" avec intervalle 1d est pertinent.

Time Series TRS sur 90 jours avec requete Lucene

TRS vs TRP - Comparaison cote a cote

Dashboard avec TRS (bleu) et TRP (vert) cote a cote

TRS - Taux de Rendement Synthetique

Inclut toutes les pertes : arrets planifies, pannes, sous-performance, defauts qualite. C'est la vision la plus complete de la performance machine.

Quand l'utiliser : Pour les revues de performance globale, les rapports de direction, la comparaison entre machines ou entre usines.

Ici on voit le TRS monter a ~25% autour du 12 decembre puis retomber a 0% quand la machine est arretee.

TRP - Taux de Rendement Productif

Mesure uniquement la performance pendant les periodes de production effective. Exclut les arrets planifies (pauses, maintenance programmee).

Quand l'utiliser : Pour evaluer la performance reelle de la machine quand elle tourne. Un TRP eleve mais un TRS bas signifie que le probleme est la disponibilite, pas la machine elle-meme.

Le TRP monte plus haut (~45%) car il ne compte pas les periodes d'inactivite.

Analyse croisee TRS/TRP : Si TRP >> TRS, le probleme est la disponibilite (trop d'arrets). Si TRS et TRP sont proches mais bas, le probleme est la performance ou la qualite en production. Avoir les deux cote a cote permet de diagnostiquer rapidement l'origine des pertes.

Ici, le TRP (~45%) est nettement superieur au TRS (~25%) pendant la periode active. Cela confirme que la machine MACHINE_01 souffre principalement de problemes de disponibilite (pannes frequentes) plutot que de sous-performance quand il tourne.

Testez vos connaissances

Quel mode de requete est utilise pour la jauge TRS ?

02 // Suivi des incidents

Nombre de Pannes

Un bar chart essentiel pour suivre la frequence des pannes et identifier les tendances. Chaque barre represente le nombre maximum de pannes enregistrees sur une journee.

Pourquoi suivre les pannes ?

En maintenance industrielle, le suivi des pannes est fondamental. Il permet de detecter les tendances (les pannes augmentent-elles ?), d'identifier les periodes critiques (y a-t-il des jours plus problematiques ?) et de justifier les investissements en maintenance preventive.

La metrique status-count-Panne est incrementee par le systeme a chaque fois que la machine passe de l'etat "WORKING" a l'etat "Panne". Un compteur eleve sur une journee peut signifier soit beaucoup de petites pannes (micro-arrets), soit des redemarrages frequents apres chaque intervention.

Avec des pics a 17 pannes/jour, la machine MACHINE_01 montre un taux de defaillance preoccupant. La norme industrielle vise generalement moins de 2-3 pannes non planifiees par equipe (8h). 17 pannes sur une journee indique un probleme recurrent qui necessite une analyse des causes racines (methode des 5 pourquoi, diagramme d'Ishikawa).

Bar chart - Nombre de pannes sur 90 jours

Bar Chart

Visualiser les pannes dans le temps

Ce graphique en barres rouges montre le nombre de pannes par jour. On observe des pics a 17 pannes/jour et des periodes plus calmes. L'intervalle est de 1 jour avec un histogramme par date.

Lecture du graphique : Chaque barre rouge represente une journee. La hauteur correspond au nombre maximum de pannes enregistrees ce jour-la. Les periodes sans barre correspondent aux jours ou la machine etait arretee ou sans pannes. On remarque des "clusters" de pannes (groupes de jours consecutifs) ce qui suggere un probleme recurrent plutot que des incidents isoles.

Lucene Query - Pannes

MACHINE_01 AND metrics.custom.name:"status-count-Panne"

// Mode: Metrics
// Metric: Max on metrics.custom.numeric_value
// Group By: Terms on metrics.custom.name.keyword
// Then By: Date Histogram (Interval: 1d)
// Alias: Nombre de pannes

Construction pas a pas

Source de donnees Elasticsearch

Connectez-vous au cluster Elastic indus-dms-gem-bench. Ce data source doit etre configure au prealable dans Grafana > Configuration > Data Sources. L'index pattern est indus-dms-gem-bench-metrics qui contient les metriques custom de la machine.

Requete Lucene avec filtre combine

La syntaxe MACHINE_01 AND metrics.custom.name:"status-count-Panne" combine deux filtres : le premier identifie la machine, le second cible specifiquement la metrique de comptage de pannes. L'operateur AND est en majuscule (obligatoire en Lucene). Les guillemets autour de la valeur garantissent une correspondance exacte.

Mode Metrics avec agregation Max

Contrairement au TRS (Raw Data), ici on utilise le mode Metrics car on veut agreger les donnees. L'agregation Max sur metrics.custom.numeric_value recupere la valeur maximale du compteur pour chaque bucket temporel. On utilise Max (et non Count ou Sum) car le compteur est deja incremental dans Elasticsearch - on veut sa valeur max par jour.

Group By : Terms puis Date Histogram

Le Group By Terms sur metrics.custom.name.keyword separe les donnees par type de metrique (ici une seule : "status-count-Panne"). Le Then By Date Histogram avec Interval 1d decoupe le temps en buckets d'une journee. C'est cette combinaison qui donne une barre par jour.

Alias "Nombre de pannes"

Le champ Alias renomme la serie dans la legende. Sans cela, Grafana afficherait le nom technique de la metrique. Un alias clair est important pour les dashboards partages avec des non-techniciens (responsables de production, direction).

Visualisation et plage temporelle

La visualisation Time Series est utilisee (pas Bar Chart natif) car elle gere nativement l'axe temporel. La plage "Last 90 days" est choisie pour voir les tendances sur un trimestre. Le MD = auto = 1865 indique que Grafana a automatiquement calcule le nombre max de data points.

Pistes d'amelioration

⚠

Alertes automatiques

Configurez une alerte Grafana (onglet Alert du panneau) : condition WHEN max() OF Nombre de pannes IS ABOVE 10. Envoyez vers Slack, email ou PagerDuty. Definissez un "For" de 0s pour alerter immediatement ou 1h pour filtrer les faux positifs.

★

Moyenne mobile sur 7 jours

Ajoutez une seconde requete ou utilisez Transformations > "Add field from calculation" pour afficher une courbe de tendance lissee. Ca permet de voir si la situation s'ameliore ou se degrade au-dela du bruit quotidien.

📈

Annotations de maintenance

Creez une source d'annotations dans les Dashboard Settings qui requete les evenements de maintenance. Chaque intervention apparaitra comme une ligne verticale sur le graphique, permettant de correler "maintenance effectuee = moins de pannes apres".

📊

Panneau Stat complementaire

Ajoutez un panneau Stat a cote qui affiche le total cumule des pannes sur la periode, la moyenne par jour, et le jour avec le plus de pannes. Utilisez les transformations "Reduce" pour calculer ces valeurs.

🕒

MTBF et MTTR

Completez avec des indicateurs MTBF (Mean Time Between Failures) et MTTR (Mean Time To Repair). Ce sont les KPIs de maintenance les plus importants. Creez des requetes qui calculent le temps moyen entre deux pannes et le temps moyen de reparation.

📋

Pareto des causes

Si les causes de pannes sont documentees, creez un diagramme de Pareto (bar chart horizontal trie par frequence) pour identifier les 20% de causes qui generent 80% des pannes. Utilisez un Bar Chart natif avec Group By sur le type de cause.

Parametres de style

Color by field: metrics.custom.name.keyword
Line width: 0 (pas de bordure)
Fill opacity: 80 (barres bien visibles)
Gradient mode: None
Tooltip mode: Single
Legend: Visible

Un Fill opacity de 80 donne des barres bien opaques sans etre completement solides, ce qui les rend plus esthetiques.

Challenge

Quelle agregation est utilisee pour compter les pannes ?

03 // Analyse d'etats

Etat de la Machine

Un stacked bar chart pour visualiser la repartition du temps entre les differents etats de la machine. Essentiel pour comprendre comment le temps de production est consomme.

Comprendre la repartition du temps machine

En industrie, chaque minute de production compte. Le graphique "Etat de la machine" decompose chaque journee en blocs de temps : combien d'heures la machine a travaille, combien d'heures elle etait en panne, inactif, en erreur, etc. C'est le pilier du calcul de disponibilite (le D du TRS).

L'axe Y est en heures (0-10h), ce qui correspond a une journee de travail typique. Si la barre verte (WORKING) ne remplit pas les 8-10h, c'est que du temps est perdu. Les barres empilees (stacked) montrent exactement ou va le temps perdu.

Comment lire ce graphique : Pour chaque jour, la hauteur totale de la barre empilee devrait atteindre ~8-10h (temps d'ouverture). La proportion de vert (WORKING) par rapport au total donne directement le taux de disponibilite de la machine ce jour-la.

Stacked bar chart - Duree par etat (en heures) avec overrides et thresholds

Les 5 etats surveilles :

WORKING

Machine en production active. C'est l'etat souhaite : la machine execute son programme de production. Plus cette duree est longue par rapport au temps d'ouverture, meilleure est la disponibilite. Objectif : >85% du temps d'ouverture.

Panne (status-duration-Panne)

Arret non planifie de la machine. Chaque minute de panne est une perte directe de production. Les causes typiques : defaut capteur, bourrage, casse d'outil, defaut electrique. A minimiser en priorite.

OTHER

Activites hors production : changement de serie, reglages, essais, nettoyage. Ce temps est partiellement reducible par du SMED (Single Minute Exchange of Die) et de l'optimisation des procedures.

NON UTILISATION

La machine est disponible mais non utilisee : pauses, manque de pieces en amont, attente d'un operateur, fin de commande. Indique des problemes d'organisation ou de flux logistique.

ERROR

Erreur systeme de la machine : bug logiciel, defaut de communication, alarme securite. Souvent plus grave qu'une panne classique car peut necessiter un reboot complet ou une intervention constructeur.

Stacked Bar Chart

Construction de la requete

Lucene Query - Etat de la machine

MACHINE_01 AND metrics.custom.name:"status-duration-*"

// Le wildcard * capture tous les etats :
//   status-duration-Panne
//   status-duration-OTHER
//   status-duration-NON UTILISATION
//   status-duration-ERROR
//   (+ WORKING via override)

// Metric: Max on metrics.custom.numeric_value
// Group By: Terms (metrics.custom.name.keyword)
// Then By: Date Histogram (Interval: 1d)

Le wildcard status-duration-* capture toutes les metriques de duree. L'override renomme status-duration-WORKING en simplement WORKING pour la lisibilite.

Options du Bar Chart en detail ▼

Type: Bar chart - Ici on utilise la visualisation Bar Chart native (et non Time Series avec style Bars). La difference : Bar Chart natif gere nativement le stacking (empilage) et les categories.
Orientation: Auto - Grafana choisit automatiquement vertical (barres classiques) ou horizontal selon les dimensions du panneau. Pour un graphique temporel, vertical est preferable.
X Axis labels rotation: 60 degres - Les dates etant longues (ex: "12/01"), les labels sont inclines a 60 degres pour eviter qu'ils se chevauchent. C'est un bon compromis entre lisibilite et espace.
Stacking: Normal - Les barres des differents etats sont empilees les unes sur les autres. La hauteur totale represente le temps total, et chaque segment colore represente un etat. C'est fondamental pour voir la proportion.
Axe Y: heures (0-10h) - L'unite "Duree en heures" est configuree dans Standard options. 10h correspond a une journee de travail typique en usine (2 equipes de 8h avec chevauchement, ou une equipe longue).

Overrides & Thresholds - Fonctionnement detaille ▼

Les overrides permettent de modifier les proprietes d'une serie specifique sans affecter les autres. C'est un outil puissant de Grafana.

Override 1 : Le champ status-duration-WORKING est renomme en "WORKING" via Display name. Sans cela, la legende afficherait le nom technique complet, peu lisible.
Pourquoi override ? La requete Lucene avec wildcard status-duration-* retourne toutes les series correspondantes. Leurs noms techniques sont longs. Les overrides permettent de les humaniser un par un.
Thresholds en mode Percentage : Les thresholds sont configures en pourcentage relatif au min/max du champ. La base est verte avec un seuil a 0%. Cela colore les segments selon leur proportion.

Pour ajouter un override : panneau droit > Overrides > "Add field override" > "Fields with name" > selectionnez le champ > ajoutez les proprietes (Display name, Color, etc.)

Ameliorations possibles ▼

Couleurs fixes par override pour chaque etat : Ajoutez un override de couleur pour chaque etat : vert pour WORKING, rouge pour Panne, orange pour NON UTILISATION, bleu pour OTHER, rouge vif pour ERROR. Cela garantit que les couleurs restent coherentes meme si Grafana change de palette.
Transformation "Calculate ratio" : Utilisez Transformations > "Add field from calculation" pour creer un champ calcule WORKING / (WORKING + Panne + OTHER + ...). Cela donne directement le taux de disponibilite par jour.
State Timeline en complement : Ajoutez un panneau "State Timeline" sous le bar chart. Il montrera une frise chronologique coloree de chaque etat avec les transitions exactes. On voit alors non seulement la duree, mais aussi l'ordre et la frequence des changements d'etat.
Tooltip mode "All" : En passant le tooltip en mode "All", au survol d'une barre vous voyez la duree de chaque etat ce jour-la. Tres pratique pour l'analyse rapide sans devoir lire chaque segment.
Pie Chart complementaire : Ajoutez un Pie Chart cote a cote qui montre la repartition globale des etats sur toute la periode. Le bar chart montre le detail par jour, le pie chart donne la vue d'ensemble.

04 // Performance par type

Indicateurs CPT

Des jauges et statistiques pour chaque type de composant : Simple, Double, Milieu - Gauche et Droite.

Qu'est-ce que les CPT ?

CPT (Composant Par Type) correspond aux differents composants utilises par la machine de production. La machine MACHINE_01 utilise 6 types de composants, organises par position (Gauche/Droite) et par geometrie (Simple, Double, Milieu).

Chaque composant a un taux de reussite (le pourcentage affiches dans les jauges) qui indique la proportion d'operations conformes realisees avec ce type. Un taux faible signifie que le composant est use, mal aligne, ou incompatible avec le type de piece.

Cote Gauche (G)

CPT1-G (Simple Gauche) : 0% - Composant probablement non utilise ou defaillant
CPT2-G (Double Gauche) : 87.5% - Meilleure performance du lot
CPT3-G (Milieu Gauche) : 22.2% - Performance critique, a investiguer

Cote Droit (D)

CPT1-D (Simple Droite) : 60% - Performance moyenne
CPT2-D (Double Droite) : 36.8% - En dessous du seuil acceptable
CPT3-D (Milieu Droite) : 73.7% - Correcte mais ameliorable

Analyse : Le desequilibre entre Gauche et Droite (87.5% vs 36.8% pour le type Double) suggere un probleme mecanique d'alignement ou d'usure asymetrique. Les composants "Simple" sont les plus variables (0% a 60%), ce qui indique un besoin de standardisation des parametres de production.

Performance en temps reel

Chaque jauge represente le taux de reussite d'un type de composant. Les couleurs changent automatiquement selon les seuils configures : rouge < 30%, jaune 30-60%, bleu > 60%.

CPT1-G (Simple Gauche)

87.5%

CPT2-G (Double Gauche)

22.2%

CPT3-G (Milieu Gauche)

60%

CPT1-D (Simple Droite)

36.8%

CPT2-D (Double Droite)

73.7%

CPT3-D (Milieu Droite)

Les 6 jauges CPT dans le dashboard Grafana

Gauge

Configuration des jauges CPT

Chaque jauge est un panneau Grafana independant avec sa propre requete. Les threshold markers (barre exterieure coloree) et le schema de couleur "From thresholds (by value)" font que la couleur du chiffre et de la jauge changent automatiquement.

Lucene Query - CPT Gauge (exemple CPT1_G)

MACHINE_01 AND metrics.custom.name:"CPT1_G-total"

// Mode: Raw Data | Size: 500
// Value options > Calculation: Last *
// Standard options > Unit: Percent (0-100)
// Standard options > Min: 0 / Max: 100

// Pour chaque jauge, changez le nom de metrique :
//   CPT1_G-total  (Simple Gauche)
//   CPT2_G-total  (Double Gauche)
//   CPT3_G-total  (Milieu Gauche)
//   CPT1_D-total  (Simple Droite)
//   CPT2_D-total  (Double Droite)
//   CPT3_D-total  (Milieu Droite)

Comment configurer les thresholds de la jauge ▼

Allez dans le panneau droit > Thresholds
La Base (couleur par defaut) est verte = valeurs normales (> 60%)
Ajoutez un seuil a 0% en rouge = zone critique
Ajoutez un seuil a 30% en jaune = zone d'alerte
Ajoutez un seuil a 60% en bleu = zone acceptable
Dans Gauge options, activez "Show threshold markers" = bande exterieure
Dans Standard options > Color scheme, choisissez "From thresholds (by value)"

Comment ameliorer les panneaux CPT ? ▼

Utiliser des variables dashboard : Au lieu de 6 panneaux dupliques, creez une variable $epf_type avec les 6 valeurs et un seul panneau qui utilise la variable dans la requete. Le repeat feature de Grafana generera automatiquement les 6 jauges.
Ajouter des tendances (sparklines) : Ajoutez des mini Time Series sous chaque jauge montrant l'evolution du taux sur les 30 derniers jours. Une jauge a 60% est differente selon qu'elle monte ou descend.
Data links : Configurez des "Data links" sur chaque jauge pour naviguer vers un dashboard detaille du composant au clic. L'URL peut contenir des variables comme /d/epf-detail?var-type=CPT1_G.
Comparaison gauche/droite : Creez un bar chart horizontal avec les 6 CPT tries par performance pour voir immediatement lequel est le pire et prioriser les actions.

Les seuils utilisent le code couleur industriel : rouge < 30%, jaune 30-60%, bleu > 60%. Les markers exterieurs rendent la lecture tres intuitive meme a distance sur un ecran d'atelier.

Stat

Compteur total CPT

Le panneau Stat affiche le nombre total brut : 103 pour CPT1_G-total. Le fond vert avec le grand chiffre rend l'information immediatement lisible, meme sur un ecran d'atelier a 5 metres.

Pourquoi le panneau Stat ? Quand l'information se resume a un seul chiffre important, le Stat est le meilleur choix. Le nombre 103 represente le total cumule d'operations realisees avec le composant CPT1_G. Ce n'est pas un pourcentage mais un compteur absolu. Le fond colore (vert) est genere automatiquement par les thresholds, indiquant que cette valeur est dans la zone "normale".

Configuration complete du Stat etape par etape ▼

Choisir la visualisation Stat

Dans le selecteur de visualisation, choisissez "Stat". Il affiche un grand chiffre avec optionnellement un sparkline (mini graphique) en arriere-plan.

Requete Lucene en Raw Data

Requete : MACHINE_01 AND metrics.custom.name:"CPT1_G-total" en mode Raw Data, Size: 500. Le mode Raw Data recupere les documents bruts pour obtenir la valeur exacte du compteur.

Value options : Calculate > Last *

Le mode "Calculate" applique une fonction de reduction aux donnees. "Last *" prend la derniere valeur non-null. L'alternative "All values" afficherait chaque valeur individuellement (utile avec un repeat panel).

Couleur de fond automatique

Le fond vert est genere par le Color scheme "From thresholds (by value)". Grafana colore le fond du panneau entier selon les seuils definis. Sans seuils, le fond serait gris neutre.

Interval auto : MD = 304

L'intervalle est de 6h car Grafana calcule automatiquement le "max data points" (304) en fonction de la largeur du panneau et de la plage temporelle (90 jours). Pour un Stat, l'intervalle importe peu car seule la derniere valeur est utilisee.

Comment ameliorer le panneau Stat ? ▼

Activer le Graph mode (sparkline) : Dans Stat options, activez "Graph mode: Area". Un mini graphique apparait en fond montrant l'evolution du compteur dans le temps. Ca donne du contexte : le compteur augmente-t-il vite ou lentement ?
Ajouter un prefix/suffix : Dans Standard options, ajoutez un suffix comme "operations" pour afficher "103 operations" au lieu de "103" seul. Plus clair pour les non-inities.
Creer un Stat par CPT : Dupliquez le panneau pour chaque type de composant et alignez-les en ligne. Les operateurs voient immediatement quels composants sont les plus sollicites.
Ajouter des thresholds significatifs : Si chaque composant a une duree de vie de 200 operations, mettez un seuil jaune a 150 (pre-alerte) et rouge a 190 (remplacement imminent).

Panel Stat - CPT1_G-total = 103

Challenge

Quel type CPT a le meilleur taux de reussite ?

05 // Boite a outils

Configuration Grafana

Les types de visualisation, les options de style, et les bonnes pratiques pour un dashboard efficace.

Toutes les visualisations disponibles dans Grafana

Visualisations utilisees dans ce dashboard

Time Series

Evolution du TRS et TRP dans le temps. Ideal pour les tendances.

Bar Chart

Nombre de pannes et etat de la machine. Parfait pour les comparaisons.

Gauge

TRS et CPT en pourcentage. Lecture instantanee avec seuils visuels.

Stat

Totaux CPT. Un grand chiffre lisible de loin sur ecran industriel.

Connexion Elasticsearch - Le data source

Tout le dashboard repose sur le data source Elastic indus-dms-gem-bench. C'est un cluster Elasticsearch qui stocke les metriques de la machine dans un index indus-dms-gem-bench-metrics.

Comment configurer le data source Elasticsearch dans Grafana ▼

Administration > Data Sources > Add

Allez dans les parametres Grafana, section Data Sources, et cliquez "Add data source". Cherchez "Elasticsearch".

URL du cluster

Renseignez l'URL de votre cluster Elasticsearch (ex: http://elasticsearch:9200). Si vous utilisez une authentification, configurez les credentials dans la section Auth.

Index name pattern

Entrez le pattern d'index : indus-dms-gem-bench-metrics. Si vos index sont journaliers (ex: indus-dms-gem-bench-metrics-2024.12.01), utilisez le pattern avec wildcard.

Time field

Selectionnez le champ de timestamp : generalement @timestamp ou metrics.date. C'est ce champ que Grafana utilise pour l'axe temporel.

Save & Test

Cliquez "Save & Test" pour verifier la connexion. Un message vert confirme que Grafana arrive a se connecter et a trouver l'index.

Structure des documents dans Elasticsearch ▼

Chaque document dans l'index contient les metriques custom de la machine. Voici la structure utilisee :

Structure JSON - Document Elasticsearch

{
  "@timestamp": "2024-12-10T08:30:00Z",
  "machine": "MACHINE_01",
  "metrics": {
    "date": "2024-12-10",
    "custom": {
      "name": "TRS",           // Nom de la metrique
      "numeric_value": 30.6    // Valeur numerique
    }
  }
}

Les metriques disponibles dans metrics.custom.name : TRS, TRP, status-count-Panne, status-duration-*, CPT*_G-total, CPT*_D-total.

Syntaxe Lucene - Guide rapide

Toutes les requetes de ce dashboard utilisent la syntaxe Lucene. Voici les elements essentiels utilises :

Cheatsheet Lucene pour Elasticsearch

// === OPERATEURS DE BASE ===
MACHINE_01                          // Recherche du terme dans tous les champs
metrics.custom.name:"TRS"          // Recherche exacte dans un champ specifique
MACHINE_01 AND metrics.custom.name:"TRS"  // Combinaison (AND en majuscule !)

// === WILDCARDS ===
metrics.custom.name:"status-duration-*"  // * = n'importe quelle suite de caracteres
metrics.custom.name:"CPT?_G*"         // ? = un seul caractere

// === CHAMPS .keyword ===
metrics.custom.name:"TRS"          // Champ text (analyse, tokenise)
metrics.custom.name.keyword:"TRS"  // Champ keyword (exact, pour Group By)

// === BONNES PRATIQUES ===
// Toujours utiliser .keyword pour les Group By Terms
// Toujours mettre les valeurs entre guillemets si elles contiennent des espaces
// AND/OR/NOT doivent etre en MAJUSCULES

Bonnes pratiques du dashboard

⚙

Nommage coherent

Utilisez des Display names clairs (TRS, TRP, WORKING) et des alias dans les requetes. Les non-techniciens doivent comprendre chaque panneau sans explication. Evitez les noms de champs bruts dans les legendes.

🎨

Thresholds pertinents

Definissez des seuils qui correspondent aux standards industriels : TRS > 85% = World Class, > 60% = acceptable, < 60% = critique. Chaque seuil doit declencher une action concrete.

📘

Fond transparent

Activez "Transparent background" sur chaque panel pour une integration visuelle propre. Les panneaux se fondent dans le fond sombre et l'ensemble parait plus professionnel.

🕑

Intervalle adapte

1h pour les time series (detail), 1d pour les bar charts (vue jour), auto pour les stats. Le parametre MD (Max Data Points) controle la granularite. Trop de points = lenteur, pas assez = perte d'info.

🔎

Wildcards Lucene

Le wildcard status-duration-* capture 5 metriques en une requete. C'est plus efficace que 5 requetes separees et assure que les nouvelles metriques sont automatiquement incluses.

⚠

Overrides strategiques

Les field overrides permettent de personnaliser chaque serie : renommer status-duration-WORKING en "WORKING", fixer des couleurs par etat, masquer des champs inutiles.

🛠

Variables dashboard

Creez des variables pour le nom de la machine ($machine) et la periode. Un seul dashboard sert alors pour toutes les machines de l'usine. Les utilisateurs selectionnent via un menu deroulant.

🔒

Permissions et partage

Configurez les permissions du dashboard : lecture seule pour les operateurs (pas de modification accidentelle), edition pour les superviseurs. Utilisez les Teams Grafana pour gerer les acces.

Architecture du Dashboard

Le flux de donnees de la machine jusqu'au dashboard Grafana :

🤖

MACHINE_01

Machine

→

📊

Metrics

custom.name / value

→

🔍

Elasticsearch

indus-dms-gem-bench

→

📈

Grafana

Dashboard

Dashboard Grafana

TRS - Taux de Rendement Synthetique

Qu'est-ce que le TRS ?

Disponibilite

Performance

Qualite

Vue d'ensemble instantanee

Choisir le type Gauge

Requete Lucene sur Raw Data

Calcul "Last *" (Last non-null)

Color scheme "From thresholds"

Activer les Threshold Markers

Configuration detaillee :

Evolution temporelle du TRS

TRS vs TRP - Comparaison cote a cote

TRS - Taux de Rendement Synthetique

TRP - Taux de Rendement Productif

Testez vos connaissances

Nombre de Pannes

Pourquoi suivre les pannes ?

Visualiser les pannes dans le temps

Construction pas a pas

Source de donnees Elasticsearch

Requete Lucene avec filtre combine

Mode Metrics avec agregation Max

Group By : Terms puis Date Histogram

Alias "Nombre de pannes"

Visualisation et plage temporelle

Pistes d'amelioration

Alertes automatiques

Moyenne mobile sur 7 jours

Annotations de maintenance

Panneau Stat complementaire

MTBF et MTTR

Pareto des causes

Parametres de style

Challenge

Etat de la Machine

Comprendre la repartition du temps machine

Les 5 etats surveilles :

WORKING

Panne (status-duration-Panne)

OTHER

NON UTILISATION

ERROR

Construction de la requete

Indicateurs CPT

Qu'est-ce que les CPT ?

Cote Gauche (G)

Cote Droit (D)

Performance en temps reel

Configuration des jauges CPT

Compteur total CPT

Choisir la visualisation Stat

Requete Lucene en Raw Data

Value options : Calculate > Last *

Couleur de fond automatique

Interval auto : MD = 304

Challenge

Configuration Grafana

Visualisations utilisees dans ce dashboard

Connexion Elasticsearch - Le data source

Administration > Data Sources > Add

URL du cluster

Index name pattern

Time field

Save & Test

Syntaxe Lucene - Guide rapide

Bonnes pratiques du dashboard

Nommage coherent

Thresholds pertinents

Fond transparent

Intervalle adapte

Wildcards Lucene

Overrides strategiques

Variables dashboard

Permissions et partage

Architecture du Dashboard

Auditez votre Dashboard

Glissez votre screenshot ici

Dashboard
Grafana