Inspiré par un certain calendrier de l'Avent, je voudrais regretter ce que j'ai fait dans un environnement de production.
C'est l'événement de ma deuxième année en tant que membre de la société. A cette époque, j'étais en charge de la maintenance du système BtoB fonctionnant sur l'environnement cloud. En tant que membre de la maintenance, je me souviens qu'il y avait deux infrastructures et trois applications. J'étais responsable de l'infrastructure et l'autre membre était le chef.
Ce jour-là, j'étais censé modifier les paramètres du middleware du serveur. J'ai dit au propriétaire du système qu'il n'y avait pas de panne. Par conséquent, il n'y a pas de passage à l'écran de maintenance ou à la notification de maintenance. Comme d'habitude, j'ai envoyé un mail au propriétaire pour me contacter pour démarrer le travail de production et commencer le travail de production. Nous procéderons selon la procédure vérifiée. Lorsque le changement de paramètre lui-même a été terminé et que l'opération a été confirmée, j'ai été informé que le service était en panne. .. .. Je ne sais pas ce qui s'est passé et je me souviens que ma tête est devenue blanche. J'ai demandé de l'aide au chef et le chef a commencé l'enquête. Puis, le chef a dit: "Le nom d'hôte est étrange."
↓ Nom d'hôte à ce moment
^i
Il l'a remarqué en regardant le nom d'hôte affiché à l'invite après s'être connecté au serveur. Au fait, je n'ai pas remarqué parce que je ne me déconnectais pas du serveur ni ne lançais une nouvelle invite.
Si vous vérifiez l'historique, la commande suivante s'affiche. .. ..
hostname ^i
En tant que personne qui le comprend, j'ai réécrit le nom d'hôte. Je n'avais pas réalisé que j'avais réécrit le nom d'hôte en tapant par erreur "hostname -i" comme "hostname ^ i". Je ne savais pas à l'époque que la commande hostname était également une commande qui pouvait changer le nom d'hôte.
Exemple d'exécution de commande | La description |
---|---|
hostname | Afficher le nom d'hôte |
hostname -i | Afficher l'adresse IP |
hostname <string> | Nom d'hôte<string>changer en |
La modification du nom d'hôte avec la commande hostname devient invalide au redémarrage du système d'exploitation (retourne au nom d'hôte avant la modification). Par conséquent, le système d'exploitation a été redémarré et le nom d'hôte a été restauré. L'échec a été récupéré avec succès.
-Vous avez tapé manuellement une commande qui ne figure pas dans le manuel de procédure. Seules les commandes minimales ont été décrites dans le manuel de procédure et les commandes de confirmation ont été omises. ・ Le travail a été réalisé par une seule personne. Il y avait aussi un problème de main-d'oeuvre, donc c'était essentiellement un travail d'un seul homme.
Ce qui a été mis en œuvre comme mesure de prévention des récidives à l'époque -N'exécutez aucune commande autre que celles décrites dans le manuel de procédure. Décrivez toutes les procédures nécessaires telles que les commandes de confirmation. ・ Assurez-vous de copier et coller les commandes, pas à la main. Éliminez les erreurs de saisie de commande manuelle. -Utilisez des commandes qui n'affectent pas le système lors de la vérification. Évitez autant que possible d'utiliser des commandes susceptibles de modifier les paramètres. ・ Assurez-vous d'effectuer le travail par deux personnes et effectuez une double vérification. Sécurisez un système pour remarquer immédiatement les fautes de frappe. En répartissant les responsabilités entre les deux personnes, il y a de la place dans le cœur. Ce à quoi je peux penser maintenant -Automatiser le travail lui-même. Minimisez la marge d'intervention humaine et réduisez les erreurs humaines.
C'est tout pour moi. Merci pour la lecture.