Article: Comment surveiller le développement, en particulier pour votre application

Le point de départ pour atteindre l’observabilité pour les systèmes distribués tels que les déploiements de microservices basés sur des conteneurs et les équilibreurs de charge est la télémétrie.

Vous devez vous attendre à agréger les données de télémétrie de quatre grandes catégories.

Vous trouverez ci-dessous quelques explications sur la manière dont nous utilisons ces catégories pour doter votre entreprise de l’observabilité dont elle a besoin.

Métriques :

une représentation numérique des données mesurées sur un intervalle de temps. Les exemples peuvent inclure la profondeur de la file d’attente, la quantité de mémoire utilisée, le nombre de requêtes par seconde traitées par un service donné, les connexions ou les flux actifs, le nombre d’erreurs par seconde, la latence, l’état de santé des nœuds, etc. Les métriques sont particulièrement utiles pour rendre compte de la santé globale d’un système, et se prêtent également naturellement au déclenchement d’alertes et de représentations visuelles telles que des jauges, mais offrent un meilleur aperçu de la façon dont vos systèmes sont utilisés par un public mondial.

Événements :

Il s’agit d’enregistrement immuable et horodaté des événements au fil du temps. Ceux-ci sont généralement émis par l’application en réponse à un événement dans le code. Le fait de disposer d’informations détaillées sur des événements spécifiques permet aux équipes (et aux systèmes d’IA intelligents de nos solutions de télémétrie) de mieux répondre à des événements spécifiques et de les atténuer, tandis qu’en tant qu’entreprise, vous pouvez également mieux vous préparer et prévoir ces événements à l’avenir.

Journaux :

Dans leur forme la plus fondamentale, les journaux ne sont essentiellement que des lignes de texte qu’un système produit lorsque certains blocs de code sont exécutés. Les journaux s’avèrent précieux lors de la vérification et de l’interrogation rétroactives de l’exécution du code. En fait, les journaux sont extrêmement précieux pour le dépannage des bases de données, des caches, des équilibreurs de charge ou des systèmes propriétaires plus anciens qui ne sont pas compatibles avec l’instrumentation en cours, pour n’en nommer que quelques-uns. Nos outils d’observabilité aident à donner un sens à tout cela en mettant en évidence les informations dont vous avez besoin, tout en montrant quelles informations sont peut-être inutiles et non nécessaires, réduisant ce bruit inutile de vos serveurs, ce qui devrait améliorer les performances opérationnelles et rendre la vie de vos équipes d’ingénierie bien plus facile.

Traces :

les traces montrent l’activité d’une seule demande lorsqu’elle « saute » à travers une chaîne ou un réseau de services. Une trace doit indiquer le chemin de la demande à travers le système, la latence des composants le long de ce chemin et quel composant est à l’origine d’un goulot d’étranglement ou d’une panne. Ces traces sont essentielles pour résoudre les problèmes et concevoir de meilleurs systèmes qui peuvent empêcher que ce type de problèmes ne se reproduise à l’avenir.

Unification dans les environnements hybrides

Les données de télémétrie – et les traces en particulier – peuvent s’avérer difficiles à collecter et à rassembler pour de nombreuses organisations. L’un des principaux défis est qu’une seule organisation peut exploiter un environnement hybride englobant de nombreux emplacements, types de serveurs, clouds, plates-formes, etc., qui peuvent avoir été mis en place par différentes équipes suivant différentes procédures. Les données qui en résultent arrivent sur de nombreux canaux et dans de nombreux formats et structures différents. Ce volume et cette complexité peuvent être plus que ce que les opérateurs humains peuvent gérer.

À moins que DevOps et les équipes informatiques n’obtiennent le contrôle de toutes ces données, l’observabilité sera hors de portée. Pour relever ce défi, ces équipes ont besoin d’une solution de livraison d’applications qui fonctionne avec n’importe quelle combinaison d’emplacement, de serveurs, de clouds, de machines virtuelles, de conteneurs, de protocoles de trafic et d’applications. Une telle solution doit être capable de se connecter à chaque nœud simultanément, de naviguer dans les différences d’architecture et de structure de données, et de tout rassembler dans un référentiel de données et une interface utilisateur.

Par exemple, nos solutions de télémétrie sont conçues pour fonctionner de cette manière, fournissant ADC-as-a-service dynamiquement dans n’importe quel nombre de nœuds de réseau dans n’importe quelle combinaison de backends, collectant des données de télémétrie de chacun d’eux. En conséquence, ces solutions  produisent une télémétrie de bout en bout dans des environnements hybrides complexes.

Surveillance et tableau de bord basés sur l’intention

La surveillance est un mot à la mode dans le développement de logiciels et DevOps, et pour cause. La capacité des équipes à surveiller la télémétrie de leurs systèmes est essentielle pour garantir la disponibilité du système et également pour en savoir plus sur les modèles d’utilisation et les performances réelles. Cependant, bien que la surveillance elle-même soit une composante de l’observabilité, l’observabilité nécessite plus que la simple lecture de flux de données et l’action en conséquence.

Un déploiement « observable » est un déploiement dans lequel les données de télémétrie sont affichées de manière intelligente, de manière à afficher les bonnes données au bon moment (au moment le plus important) et afin que les principales parties prenantes puissent comprendre ce que les données signifient pour elles.

Par exemple, une solution de surveillance uniquement peut présenter des journaux, des traces et des événements dans le but de vérifier l’état et de dépanner un système. L’opérateur responsable devrait vérifier toutes ces données, identifier les problèmes et déterminer comment les résoudre.

En revanche, une solution d’observabilité peut également fournir des informations très granulaires sur le comportement des systèmes, des alertes lorsqu’un problème est détecté (ou prédit par un algorithme d’apprentissage automatique), ainsi que des informations contextuelles riches et des actions recommandées, parfaites à des fins de débogage. .

Il n’est pas possible de prédire toutes les manières possibles dont un système pourrait mal se comporter ou échouer, nous devons donc construire des systèmes qui peuvent être débogués avec des preuves et non des conjectures.

L’observabilité fournit également des tableaux de bord plus structurés qui s’adressent à différents publics. Alors que la surveillance s’adresse aux utilisateurs techniques des équipes ITOps et DevOps, l’observabilité fournit des informations pertinentes pour un plus large éventail d’audiences techniques et commerciales, en fonction de leurs besoins.

Par exemple, les rapports sur la latence des serveurs aident les équipes techniques à faire en sorte que les serveurs répondent rapidement au trafic, tandis que les rapports sur le nombre d’utilisateurs qui ont abandonné leur panier lorsque la latence était élevée aident les équipes commerciales à évaluer l’impact des problèmes techniques sur les revenus et à prioriser les ressources. pour régler ces problèmes.

Cela ajoute plus de valeur au processus de prise de décision dans toute une organisation.
Tests en conditions réelles avec les parties prenantes techniques et commerciales

Un déploiement « observable » est un déploiement observable en pratique et pas seulement en théorie. Voici quelques tests clés pour votre observabilité.

Vos équipes techniques sont-elles en mesure de démontrer qu’elles respectent les accords de niveau de service (SLA) définis ? Par example:

  • Il est temps de détecter les problèmes critiques pour l’entreprise.
  • Il est temps de résoudre les problèmes critiques pour l’entreprise et les clients.
  • Disponibilité et performances, par ex. latence sur les intégrations d’API.
  • Combien d’interfaces utilisateur chaque intervenant doit-il consulter pour répondre aux questions dont il est responsable ?  – Combien de temps cela prend-il?
  • Vos équipes commerciales savent-elles comment les KPI commerciaux et marketing ont été affectés par des facteurs techniques sur une période définie ?
  • Combien de décisions de vos équipes pour le prochain trimestre sont basées sur des données fiables et combien sont basées sur des données incomplètes, obsolètes ou non fiables ?
Comment nous pouvons améliorer l’observabilité de votre organisation

Pour votre pipeline de livraison d’applications – du développement aux tests en passant par le déploiement et l’amélioration continue – nos solutions de télémétrie peuvent améliorer l’observabilité de votre organisation.
Intégrez nos solutions de télémétrie à votre stratégie globale d’observabilité et découvrez ce que vous pouvez découvrir sur votre entreprise.

Share:

More Posts

Commençons à travailler ensemble sur votre projet

Nous sommes aussi enthousiastes par votre idée que vous l'êtes

Bayebi Consulting © 2022 All rights reserved
fr_FRFrançais