Aller au contenu principal
Version : 2.6.7

Inspection des résultats des expériences de chaos

Traduction Bêta Non Officielle

Cette page a été traduite par PageTurner AI (bêta). Non approuvée officiellement par le projet. Vous avez trouvé une erreur ? Signaler un problème →

Ce document explique comment utiliser Chaos Mesh pour vérifier l'état d'exécution et les résultats des expériences de chaos.

Introduction aux étapes d'une expérience de chaos

Dans Chaos Mesh, le cycle de vie d'une expérience de chaos est divisé en quatre étapes selon son processus d'exécution :

  • Injection : L'expérience de chaos est en cours d'injection de fautes. Normalement, cette étape est brève. Si l'étape d'Injection persiste longtemps, cela peut indiquer des anomalies dans l'expérience. Dans ce cas, consultez Events pour identifier la cause.

  • Exécution : Après l'injection réussie des fautes dans tous les pods cibles, l'expérience de chaos démarre son exécution.

  • Pause : lors de l'interruption d'une expérience en cours, Chaos Mesh restaure les fautes injectées dans tous les pods cibles, indiquant que l'expérience est mise en pause.

  • Terminé : si le paramètre duration est configuré et que l'expérience atteint cette durée, Chaos Mesh restaure les fautes injectées dans tous les pods cibles, indiquant que l'expérience est terminée.

Vérifier les résultats avec Chaos Dashboard

Vous pouvez consulter les étapes d'exécution des expériences de chaos sur les pages suivantes via Chaos Dashboard :

  • Liste des expériences de chaos :

    État expérimental
    État expérimental

  • Détails des expériences de chaos :

    État expérimental
    État expérimental

note
  • Si l'étape d'Injection persiste longtemps, cela peut indiquer des anomalies (ex. : les sélecteurs configurés n'ont pas ciblé de pods pour l'injection). Dans ce cas, consultez Events pour identifier la cause et vérifiez la configuration de l'expérience.
  • Chaos Dashboard n'affiche que les étapes principales d'une expérience de chaos. Pour des informations détaillées sur l'état et les résultats, exécutez la commande kubectl.

Vérifier les résultats avec la commande kubectl

Pour confirmer les résultats des expériences de chaos, utilisez la commande kubectl describe pour inspecter le Status et les Events des objets d'expérience.

kubectl describe podchaos pod-failure-tikv -n tidb-cluster

Le résultat attendu est le suivant :

...
Status:
Conditions:
Reason:
Status: False
Type: Paused
Reason:
Status: True
Type: Selected
Reason:
Status: True
Type: AllInjected
Reason:
Status: False
Type: AllRecovered
Experiment:
Container Records:
Id: tidb-cluster/basic-tikv-0
Phase: Injected
Selector Key: .
Desired Phase: Run
Events:
Type Reason Age From Message
---- ------ ---- ---- -------
Normal FinalizerInited 39s finalizer Finalizer has been inited
Normal Paused 39s desiredphase Experiment has been paused
Normal Updated 39s finalizer Successfully update finalizer of resource
Normal Updated 39s records Successfully update records of resource
Normal Updated 39s desiredphase Successfully update desiredPhase of resource
Normal Started 17s desiredphase Experiment has started
Normal Updated 17s desiredphase Successfully update desiredPhase of resource
Normal Applied 17s records Successfully apply chaos for tidb-cluster/basic-tikv-0
Normal Updated 17s records Successfully update records of resource

Ce résultat comporte deux parties :

  • Status

    Basé sur le processus d'exécution, le Status fournit quatre types d'enregistrements :

    • Paused : indique que l'expérience est à l'étape "Pause".
    • Selected : confirme que les pods cibles pour l'injection ont été correctement sélectionnés.
    • AllInjected : indique que les fautes ont été injectées avec succès dans tous les pods cibles.
    • AllRecoverd : confirme la restauration réussie des fautes dans tous les pods cibles.

    L'état réel des expériences de chaos peut être déduit de ces enregistrements. Par exemple :

    • Si Paused, Selected, AllRecoverd sont True et AllInjected est False, l'expérience est en pause.
    • Si Paused est True mais Selected est False, l'expérience ne peut pas sélectionner les pods cibles.
    note

    La combinaison de ces statuts fournit des informations complémentaires. Par exemple, quand Paused est True, cela indique que l'expérience est en pause, mais si Selected est False en même temps, cela signifie que l'expérience ne peut pas sélectionner les pods cibles.

  • Events

    Contient l'historique des actions durant tout le cycle de vie de l'expérience, utile pour vérifier l'état et diagnostiquer des problèmes.