Rain Lag

아날로그 장애 스토리 거울의 장: 장애 속에서 나의 역할을 보는 법

장애를 ‘누가 잘못했는가’를 찾는 자리가 아니라 통찰을 비추는 거울의 장으로 바꾸는 방법—역사, 도전자 역할, 일상적인 공감 습관을 통해 끊임없이 배우는 운영 문화를 만드는 법.

아날로그 장애 스토리 거울의 장: 장애 속에서 나의 역할을 비추는 종이 거울 벽 만들기

장애가 터지는 순간은 늘 혼란스럽습니다. 페이저는 계속 울리고, 대시보드 지표는 치솟고, 임원들은 복구 예상 시간을 묻습니다. 하지만 진짜 위험은 장애 그 자체가 아니라, 이후에 벌어지는 일입니다. 잘못된 교훈을 배우거나, 아예 아무것도 배우지 못하는 것 말이죠.

여기서 등장하는 개념이 바로 **“아날로그 장애 스토리 거울의 장(Analog Incident Story Cabinet of Mirrors)”**입니다. 장애 히스토리를 과거 실패의 묘지로 보지 말고, 수많은 거울로 가득 찬 벽으로 생각해 보세요. 각 장애는 시스템과 팀, 그리고 그 안에서의 나 자신의 역할에 대해 어떤 진실을 비추는 하나의 거울입니다.

송나라의 역사서인 『자치통감(資治通鑑, Comprehensive Mirror in Aid of Governance)』에서 영감을 얻었습니다. 이 책은 통치자가 과거를 통해 자신의 행동을 더 분명하게 바라보도록 돕기 위해 편찬된 역사적 연대기입니다. 마찬가지로, 우리는 장애를 다루는 방식을 설계할 때, 현대 시스템을 부인보다는 통찰로, 훈계보다는 지혜로 운영하도록 돕는 “거울”로 만들 수 있습니다.

이 글에서는 다음 내용을 다룹니다.

  • 장애 학습을 위한 핵심 은유로서 거울을 활용하는 법
  • 장애 리뷰를 심문이나 재판이 아닌, 성찰의 시간으로 설계하는 법
  • 각 장애나 중요한 의사결정에 공식적인 “챌린저(Challenger)” 역할을 붙이는 법
  • 장애를 둘러싼 **일상적인 미세 공감 습관(micro‑habits of empathy)**을 만드는 법
  • 가볍지만 지속적인 성찰 메커니즘을 운영하는 법
  • 정기적으로 멈추어 인사이트를 수확하고 팀 목표를 조정하는 법

머그샷이 아닌 거울: 장애 히스토리를 다시 바라보기

『자치통감』은 과거를 비난하기 위해 쓰인 책이 아닙니다. 오히려 미래의 리더들이 자신을 더 잘 볼 수 있도록 돕는 거울 역할을 했습니다. 이 “거울”의 목적은 정죄가 아니라 인식이었습니다.

하지만 많은 조직은 장애 히스토리를 일종의 머그샷 갤러리처럼 다룹니다.

  • 티켓은 남기고, 닫고, 그 뒤에는 파묻힌 채로 잊혀진다.
  • 포스트모템(Postmortem)은 규정을 채우기 위한 서류 작업으로 전락한다.
  • 사람들은 “누가 프로덕션을 날렸는지”만 기억하고, 시스템이 무엇을 보여줬는지는 잊는다.

**거울의 장(cabinet of mirrors)**은 전혀 다르게 작동합니다.

  • 각 장애를 **사건 기록이 아니라 “스토리”**로 남긴다.
  • 이야기의 포커스는 누가 잘못했는가가 아니라, 그때의 조건, 트레이드오프, 예상 밖의 전개에 맞춰진다.
  • 항상 던지는 핵심 질문은 이렇습니다.
    “이 장애는 우리가 실제로 어떻게 일하고 있는지를 무엇으로 보여줬는가?”

이 마인드셋을 팀이 받아들이면, 질문이 달라집니다.
“누가 망쳤어?”에서 “이 사건이 우리 시스템과 우리 자신에 대해 무엇을 비춰줬지?”로 바뀝니다.


장애 리뷰를 재판이 아니라 “거울 보기”로 설계하기

장애를 진짜 거울처럼 쓰고 싶다면, **리뷰라는 사회적 의식(ritual)**부터 다시 설계해야 합니다.

목적 문장부터 바꿔라

각 리뷰를 시작할 때, 의도를 분명히 선언하세요.

“이 리뷰의 목적은 책임을 추궁하거나 우리가 옳았음을 증명하는 것이 아니라, 과거에서 통찰을 얻기 위한 것입니다.”

그리고 이를 다음과 같은 그라운드 룰로 반복해서 강화합니다.

  • 비난 언어 금지
    ("누가 이걸 야기했나요?" → "어떤 조건들이 이 상황을 쉽게 만들었나요?")
  • 역량 가정(Assume competence)
    (당시 정보를 기준으로, 모두 최선을 다해 행동했다고 전제한다)
  • 루트코즈 한 줄 요약이 아니라 서사에 집중
    (원인 한 줄로 끝내지 말고, 사건의 전개를 이야기로 풀어낸다)

성찰을 이끌어내는 질문을 던져라

단순히 타임라인과 영향 범위를 나열하는 데서 끝내지 말고, 이런 질문을 포함해 보세요.

  • 여기서 우리가 기대했던 것은 무엇이었고, 실제로는 무엇이 우리를 놀라게 했나요?
  • 이 상황에서 시스템은 당시 들어온 신호를 기준으로 할 때 합리적으로 행동한 부분이 있었나요?
  • 장애 중에 우리가 내린 결정들에는 어떤 인센티브, 압박, 혹은 습관이 영향을 미쳤나요?
  • 이 장애를 통해, 당신 개인이 자신의 반응이나 가정에 대해 새롭게 알게 된 점은 무엇인가요?

목표는 각자가 자기 자신의 거울을 보는 것입니다.
내가 어떻게 생각하는지, 어디서 터널 비전에 빠지는지, 스트레스 상황에서 어떤 패턴으로 반응하는지를 보는 것.
이건 “설정 파일 하나를 고쳤다”는 또 하나의 bullet point보다 훨씬 값집니다.


챌린저: 중요한 결정마다 붙는 두 번째 거울

역사 속 통치자들은 연대기를 거울처럼 사용했을 뿐 아니라, 자신의 가정을 정면으로 도전하는 참언(諫言)하는 신하에게도 의존했습니다. 이 패턴을 그대로 빌려올 수 있습니다.

모든 중요한 운영 결정(예: 위험한 롤아웃, 큰 아키텍처 변경)과 의미 있는 장애 포스트모템마다 공식적인 **챌린저(Challenger)**를 지정해 보세요.

  • 해당 변경이나 장애에 직접적인 책임이 없는 사람이어야 합니다.
  • 가정, 논리, 결론을 질문할 수 있는 권한을 부여합니다.
  • 드러나지 않는 압박이나 보복으로부터 명시적으로 보호받아야 합니다.

챌린저는 실제로 무엇을 하는가

챌린저의 역할은 발목을 잡는 것이 아니라, 사고를 더 날카롭게 만드는 것입니다. 예를 들어, 이런 질문을 던질 수 있습니다.

  • “이 결론을 뒷받침하는 근거는 무엇인가요?”
  • “이 관찰들에 들어맞는 다른 설명은 없을까요?”
  • “이 결정의 영향을 받는데도 아직 목소리를 못 들은 사람은 누구인가요?”
  • “한 달 뒤에 이게 잘못된 결론이었다는 게 드러난다면,
    우리가 오늘 미리 어떤 질문을 해뒀더라면 좋았을까요?”

설계상, 챌린저는 두 번째 거울 역할을 합니다.
무슨 일이 벌어졌는지만 비추는 것이 아니라, 팀이 그 일을 어떻게 해석하고 있는지까지 비춥니다.


챌린저 역할을 상징이 아니라 “제도”로 만들기

챌린저가 공식적으로 힘을 부여받지 못하면, 이 역할은 조용히 사라집니다. 예를 들면:

  • 위계: “이건 이미 리더십에서 결정했어. 더 논의할 시간 없어.”
  • 시간 압박: “이번 한 번만 챌린지 절차는 건너뛰자. 릴리스가 급해.”
  • 사회적 불편함: “괜히 까다로운 사람처럼 보이고 싶진 않아.”

이를 막으려면, 챌린저를 온콜(on‑call) 로테이션처럼 다루어야 합니다.

  • 역할을 문서화하세요: 책임, 권한, 그리고 한계를 명확히 적습니다.
  • 로테이션 캘린더를 만드세요: 어떤 결정/장애에 누가 챌린저인지 기록합니다.
  • 챌린저가 일을 할 수 있도록 회의 시간과 아젠다의 공간을 보장합니다.
  • 챌린저 절차를 건너뛰기 어렵게 만드세요: 챌린저가 발언하기 전에는 결정이 “완료”되지 않도록 합니다.

중요한 점은, 챌린저가 “이기는 것”이 목적이 아니란 겁니다.
그들의 질문이 진지하게 다루어지고, 명시적으로 답변되어야 한다는 뜻입니다. 슬쩍 무시하거나 “나중에 얘기하죠” 하고 넘어가서는 안 됩니다.

이게 루틴이 되면, 챌린지는 싸우자는 제스처가 아니라 장인 정신(craftsmanship)의 일부로 느껴지게 됩니다.


장애 중에 드러나는 작은 공감 습관 만들기

거울은 때로 냉혹합니다. 성찰이 수치심으로 변질되지 않게 하려면, 반대편에 일상적인 공감을 놓아야 합니다.

공감적인 문화는 포스트모템 회의 한 번으로 만들어지지 않습니다.
그건 작고 지속적인 제스처에서 나옵니다.

  • 인시던트 채널에서 이렇게 묻습니다.
    “지금 다들 괜찮으세요? 잠깐 쉬고 싶은 분 있나요?”
  • 요청이 없어도 먼저 돕습니다.
    “제가 노트 정리나 커뮤니케이션 맡을게요. 디버깅에 집중하세요.”
  • 긴 밤을 보낸 다음 날, 짧게 안부를 묻습니다.
    “어제 많이 고됐죠. 어제 일 중에, 우리가 고칠 수 있었으면 하는 부분이 있었나요?”
  • 휴식을 당연하게 만듭니다.
    “지금 몇 시간째 붙들고 계신데… 이제 핸드오프를 하거나 잠깐 쉬는 게 좋겠어요.”

이런 **마이크로‑습관(micro‑habits)**은 두 가지 효과가 있습니다.

  1. 실수나 모르는 부분을 인정하는 정서적 비용을 낮춥니다.
  2. 명확한 메시지를 보냅니다.
    “당신은 이 장애보다 더 소중하다.”

사람들이 안전하고 존중받는다고 느낄 때에만,
여러분이 공들여 만든 이 거울들을 진짜로 활용하게 됩니다.


가벼운, 그러나 계속되는 성찰: 살아 있는 거울의 장 만들기

정식 포스트모템은 필요합니다. 하지만, 작은 배움을 놓치기에는 빈도가 너무 낮습니다.
지속적인 학습을 일상화하려면, 가벼운 성찰 채널을 추가해야 합니다.

한 가지 쉬운 패턴은, 공유 “incident learnings” 채팅 스레드나 라이트한 문서를 운영하는 것입니다.

작동 방식은 이렇습니다.

  • 누구나 장애나 near‑miss(큰일 날 뻔한 상황) 이후에 짧은 인사이트를 올릴 수 있습니다.
    • “배운 점: 대시보드에서 부분 장애는 안 보이고, 전체 장애만 눈에 띈다.”
    • “늘 DNS는 괜찮다고 가정하더라… 런북에 빠른 DNS 체크를 추가해야겠다.”
  • 형식은 최소화합니다. 몇 문장이나 bullet point면 충분합니다.
  • 리액션이나 follow‑up discussion은 선택 사항입니다. 필수가 아닙니다.

핵심은 마찰이 낮아야 한다는 것입니다.
짧은 이야기, 순간의 깨달음, 인식의 변화가 모여서 종이 거울 벽을 이루도록 하는 것이죠.

나중에는 이 벽에서 패턴을 뽑아낼 수 있습니다.

  • 무엇이 우리를 반복해서 놀라게 하는가?
  • 어떤 개인 습관이나 가정이 계속 다시 등장하는가?

이렇게 하면 학습이 드문 이벤트가 아니라,
백그라운드 프로세스처럼 항상 돌아가게 됩니다.


정기적인 멈춤: 인사이트 수확과 목표 재정렬

일상적인 마이크로‑성찰이 있더라도, 주기적으로는 한 번 멈추어 더 높은 레벨에서 의미를 정리해야 합니다.
보통 주간 혹은 월간 사이클로 짧은 팀 세션을 운영해 볼 수 있습니다.

포커스는 두 가지입니다.

  1. 개인적 인사이트 공유

    • 각자에게 이렇게 물어보세요.
      “이번 달에 장애를 겪으며, 내가 일하는 방식에 대해 새로 알게 된 게 한 가지만 있다면?”
    • 예를 들면:
      • “하나의 가설에 너무 오래 매달리는 경향이 있더라.”
      • “리더십이 들어와 있으면, 도움을 요청하는 걸 주저하게 된다.”
      • “로그에 몰입하면, 스테이크홀더 업데이트를 자꾸 잊는다.”
  2. 목표 업데이트

    • 이 인사이트를 작고 구체적인 목표로 바꿉니다.
      • “다음 장애 때는 깊게 들어가기 전에 가능한 원인 세 가지를 먼저 적어 보기.”
      • “인시던트 런북에 15분 간격의 스테이크홀더 업데이트를 추가하기.”
      • “고위험 장애에서 primary를 맡으면, 처음부터 buddy를 한 명 꼭 붙이기.”

이 목표들을 모두가 볼 수 있는 곳에 남겨 두세요.
거울의 장은 단지 반사만 하는 곳이 아니라, 방향을 다시 잡아 주는 곳이어야 합니다.


종합: 현대의 아날로그 장애 스토리 거울의 장 만들기

오늘날의 아날로그 장애 스토리 거울의 장은 실제 두루마리를 벽에 붙이는 건 아닙니다.
그래도 이 비유는 여전히 유효합니다.

  • 모든 장애는 하나의 스토리입니다. 단순한 숫자가 아닙니다.
  • 리뷰는 재판이 아니라 거울이어야 합니다.
  • 챌린저는 우리가 스스로 만든 내러티브를 의심하게 하는 두 번째 거울입니다.
  • 공감은 솔직한 성찰을 정서적으로 지속 가능하게 만듭니다.
  • 가벼운, 지속적인 성찰은 큰 이벤트 사이에서도 학습을 계속 흐르게 합니다.
  • 정기적인 멈춤과 수확은 인사이트를 팀의 목표와 방향으로 연결합니다.

장애는 결코 즐거운 경험이 될 수 없습니다.
하지만 문화와 프로세스를 잘 설계하면, 장애는 엄청나게 유용한 자산이 될 수 있습니다.
우리가 그 안에 비친 거울을 정면으로 바라볼 준비만 되어 있다면요.

결국 선택의 문제입니다.
장애를 그때그때 불을 끄고 잊어버리는 단발성 화재로 취급할 것인가,
아니면 시간이 흘러도 계속해서 시스템과 나 자신을 더 분명히 보여주는 살아 있는 거울의 아카이브로 만들 것인가.

아날로그 장애 스토리 거울의 장: 장애 속에서 나의 역할을 보는 법 | Rain Lag