아날로그 인시던트 스토리 퍼즐 캐비닛: 종이 타일을 맞춰 숨겨진 신뢰성 패턴을 드러내기
종이 타일, 모듈형 ‘퍼즐 캐비닛’, 시스템 맵핑을 활용해 인시던트 포스트모템을 숨겨진 신뢰성 패턴을 찾는 구체적이고 협업적인 활동으로 바꾸는 방법을 소개합니다.
소개
대부분의 팀은 인시던트 리뷰를 ‘해야 하는 일’ 정도로 여깁니다. 포스트모템 템플릿을 채우고, 그래프를 조금 붙여 넣고, 액션 아이템에 동의한 뒤, 다음 일로 넘어가는 식이죠. 결과물은 대개 “무슨 일이 있었는지”는 잘 정리되어 있지만, “왜 비슷한 인시던트가 계속 반복되는지”는 잘 드러나지 않는 문서입니다.
디지털 도구는 정보를 저장하고 조회하는 데는 탁월하지만, 사람들이 패턴과 시스템을 눈으로 보게 만드는 데에는 늘 뛰어나지 않습니다. 여기서 의외의 조력자가 등장합니다. 바로 종이입니다.
이 글에서는 아날로그 인시던트 스토리 퍼즐 캐비닛(Analog Incident Story Puzzle Cabinet) 이라는 아이디어를 살펴봅니다. 인시던트의 구성 요소(원인, 영향, 완화책 등)를 종이 타일에 옮겨, 실제로 손으로 만지고, 옮기고, 재배열할 수 있는 퍼즐처럼 만드는 물리적·모듈형 접근법입니다. 인시던트를 이렇게 촉각적인 퍼즐로 바꾸면, 정적인 문서나 대시보드 속에서는 잘 보이지 않던 숨겨진 신뢰성 패턴을 드러낼 수 있습니다.
표준화된 포스트모템만으로는 부족한 이유 (그래도 필수인 이유)
표준화된 인시던트 포스트모템 템플릿은 이미 좋은 출발점입니다. 이런 템플릿은:
- 공통 필드를 강제합니다. (예: 영향(impact), 근본 원인(root cause), 타임라인, 완화책(mitigations), 후속 조치(follow‑up actions))
- 인시던트를 서로 나란히 비교하기 쉽게 만듭니다.
- 새로운 팀원이 조직이 신뢰성(reliability)에 대해 어떻게 이야기하는지 빠르게 이해하도록 돕습니다.
무엇보다도, 이러한 템플릿은 신뢰성을 위한 공유된 어휘(shared vocabulary) 를 만들어 줍니다. 우리는 비슷한 방식으로 원인을 말하고, 비슷한 관점으로 영향을 설명하며, 공통된 구조로 완화책을 정리하게 됩니다.
하지만, 아무리 잘 만든 구조화 템플릿이라도 한계가 있습니다.
- 인시던트가 개별 문서나 티켓로 고립된 섬처럼 존재합니다.
- 인시던트 간에 반복되는 교차 패턴을 보기 어렵습니다.
- 복잡성이 시스템으로 탐구되기보다는, 글머리표 몇 줄로 납작하게 압축됩니다.
핵심은 표준화된 템플릿은 그대로 유지하되, 그 안의 내용을 물리적으로 꺼내서 재배열·재조합·재매핑할 수 있게 만드는 것입니다.
여기서 종이 타일이 등장합니다.
종이 타일로 신뢰성을 손에 잡히게 만들기
디지털 도구는 대개 추상적으로 느껴집니다. 데이터베이스의 행(row), UI의 필터, 읽기 힘든 긴 텍스트 타임라인 같은 것들 말이죠. 반면 물리적이고 아날로그인 형식은 신뢰성 작업을 더 구체적이고 협업적인 경험으로 만들어 줍니다.
포스트모템 템플릿의 결과물을 잘라서 각각 종이 타일로 만든다고 상상해 보세요. 각 타일은 인시던트 이야기의 한 조각을 나타냅니다.
- 인시던트 제목 타일
- 원인(Cause) 타일 (예: “Config 플래그 X의 기본값이 안전하지 않은 값으로 설정됨”, “/v2/report 엔드포인트에 rate limiting 부재”)
- 영향(Impact) 타일 (예: “사용자 결제 실패”, “읽기의 23%에서 데이터 정합성 문제(데이터 staleness) 발생”, “p95 latency SLO 위반”)
- 기여 요인(Contributing factor) 타일 (예: “온콜 담당자가 해당 서브시스템에 익숙하지 않음”, “시끄러운 알람으로 인한 alert fatigue(알람 피로)”)
- 완화책(Mitigation) 타일 (예: “circuit breaker 추가”, “데이터베이스 페일오버 runbook 개선”)
- 후속 조치(Follow‑up) 타일 (예: “throttling 관련 테스트 커버리지 추가”, “에스컬레이션 정책 정교화”)
이 타일을 테이블이나 화이트보드 위에 펼쳐 놓습니다. 팀은 이렇게 할 수 있습니다.
- 서로 다른 인시던트 간에 유사한 원인을 옆에 나란히 배치
- 영향을 사용자 여정(user journey) 별로 묶기
- 동일한 구조적 약점을 겨냥하는 완화책을 클러스터링
여기서 물리성이 중요합니다. 사람들은 타일을 집어 들고, 돌려 보고, 이게 어떤 카테고리에 속하는지 논쟁하고, 다른 자리에 옮겨 붙입니다. 이 단순한 행위만으로도, 인시던트 리뷰가 문서를 읽는 시간에서 함께 시스템을 모델링하는 시간으로 전환됩니다.
“퍼즐 캐비닛” 접근법: 보, 기둥, 그리고 높이 조절 가능한 프레임
이 작업을 반복 가능하게 만들려면, 아날로그 셋업 전체를 모듈형 퍼즐 캐비닛(modular puzzle cabinet) 으로 생각해 보세요. 모듈형 엔지니어링 개념에서 영감을 받은 구조입니다.
- 보(beam): 특정 카테고리의 타일이 놓이는 가로 행/트랙입니다. (예: 맨 위 보에는 “영향(Impacts)”, 중간 보에는 “원인(Causes)”, 아래 보에는 “완화책(Mitigations)”)
- 기둥(pillar): 서로 관련된 타일을 카테고리 간에 세로로 묶는 단위입니다. (예: 인시던트 1개당 기둥 1개, 혹은 공통 주제당 기둥 1개)
- 높이 조절(Adjustable height): 상세 수준을 더하거나 빼며 “줌 인/줌 아웃” 할 수 있는 능력입니다. (예: 상위 수준의 원인 vs. 세부적인 기여 요인)
각 인시던트를, 서로 다른 렌즈에 꽂아 넣을 수 있는 모듈형 유닛으로 생각해볼 수 있습니다.
- 인시던트 기준 뷰: 한 인시던트의 모든 타일(원인, 영향, 완화책)을 한 세로 열에 모으면, 그 인시던트의 하나의 완결된 스토리가 됩니다.
- 테마 기준 뷰: 여러 인시던트에서 뽑아낸 원인 타일을 다시 모아, 새로운 열로 재구성할 수 있습니다. (예: “모니터링 갭”, “릴리스 프로세스 이슈”, “의존성 불안정성”)
- 라이프사이클 기준 뷰: 타일을 사전(before), 사고 중(during), *사후(after)*라는 시간 흐름에 따라 재배열해, 여러 인시던트에서의 역동성을 한눈에 볼 수 있습니다.
이 캐비닛 같은 구조는 벽, 코르크 보드, 이동식 화이트보드 어디에나 만들 수 있습니다. 시간이 지나면서, 이는 진화하는 신뢰성 스토리 라이브러리 로 자라납니다. 시스템에 대한 이해가 깊어질수록, 이 구조도 계속 리팩터링하고 재구성하게 됩니다.
인시던트를 고립된 실패가 아닌 시스템 맵으로 다루기
대부분의 포스트모템은 한 번의 인시던트에만 초점을 맞춥니다. 하지만 우리의 시스템과 조직은, 서로 얽힌 피드백 루프의 집합으로 작동합니다.
인시던트 데이터를 시스템 맵(systems map) 으로 다루기 시작하면, 자연스럽게 이런 질문이 나옵니다.
- 무엇이 계속 함께 등장하는가?
- 어떤 원인이 서로 다른 여러 종류의 영향과 연결되는가?
- 어디서 완화책이 근본 구조가 아닌 증상만 반복해서 다루고 있는가?
퍼즐 캐비닛을 활용하면, 단순하지만 강력한 시스템 관점을 시각화할 수 있습니다.
-
원인 → 영향 체인(cause‑to‑impact chains)
원인 타일과 영향 타일 사이를 화살표로 그리거나 실(sting)을 연결합니다. 실이 여러 개 모여 엉켜 있는 곳이, 곧 시스템의 취약한 지점입니다. -
공유되는 기여 요인(shared contributing factors)
타일에 색깔 스티커를 붙입니다. (예: 파란색은 프로세스 이슈, 빨간색은 기술 부채(technical debt), 초록색은 조직적 요인) 그러면 어디서 비기술적 요인이 지배적인지 금세 보입니다. -
피드백 루프(feedback loop)
예를 들어, “알람 피로(alert fatigue) → 대응 지연 → 영향 범위 확대 → 알람 증가 → 피로 증가” 같은 루프를 생각해볼 수 있습니다. 타일 묶음 옆에 손으로 간단히 루프를 그려 넣는 것만으로도, 대화의 초점을 개인 비난에서 구조로 옮길 수 있습니다.
목표는 정교한 학술적 시스템 다이어그램을 만드는 것이 아닙니다. 고립된 노드가 아닌 ‘거미줄’ 전체를 보는 것이 목적입니다.
시스템 사고를 게임처럼 만들기
시스템 맵핑이라는 말을 들으면 사람들은 어렵고 추상적인 이론으로 느끼곤 합니다. “stocks and flows”, “reinforcing loops” 같은 용어는, 매일 온콜로 불을 끄는 사람들에게는 현실감이 떨어져 보일 수 있습니다.
아날로그 방식의 게임 같은 연습은 이런 장벽을 크게 낮춰 줍니다.
- 카드 소팅(Card sorting): 참가자들에게 원인 타일을 주고, “비슷함”, “관련 없음”, “잘 모르겠음” 세 그룹으로 나눠보라고 합니다. 사실 가장 가치 있는 것은 최종적으로 만들어진 그룹이 아니라, 나누는 과정에서 오가는 대화입니다.
- 패턴 찾기 라운드(Pattern hunt rounds): 작은 그룹을 만들어 10–15분 정도 시간을 주고 다음을 찾아보게 합니다.
- 세 번 이상 반복되는 영향 패턴
- 두 번 이상 반복되는 기여 요인
- 세 개 이상의 인시던트에 등장하는 동일한 완화책 하나
- What‑if 퍼즐: 특정 타일 하나(예: 어떤 완화책이나 프로세스 통제)를 보드에서 제거해 보고, “이게 사라지면 몇 개의 타일이 영향을 받을까?”를 묻습니다. 이는 레버리지 포인트(lever point) 를 직관적으로 탐색하는 방법입니다.
이런 활동은 심리적 부담을 낮춥니다. “시스템 리스크를 분석해야 한다”가 아니라, “이 조각들을 옮겨 보면 어떤 모양이 나오는지 한 번 볼까?”라는 느낌이 되죠. 학습과 호기심이, 방어와 비난을 대신하게 됩니다.
디지털 인시던트 도구와 아날로그 맵핑을 잇는 다리 놓기
이 접근법은 기존 인시던트 관리 도구를 버리자는 이야기가 아닙니다. 오히려 그 도구들을 보완(augment) 하자는 제안입니다.
두 세계를 연결하는 방법은 다음과 같습니다.
-
디지털에서 시작해, 아날로그로 옮기기
- 지금 쓰고 있는 인시던트 도구로, 표준화된 포스트모템을 계속 작성합니다.
- 중요한 필드를 간단한 CSV로 export 합니다.
- 워크숍에서 사용할 타일(또는 포스트잇)에 이를 출력하거나 손으로 옮겨 적습니다.
-
아날로그에서 주석을 달고, 다시 디지털로 반영하기
- 퍼즐 캐비닛 세션 동안 “승인 병목(approval bottlenecks)”, “팀 X 과부하”, “소유권 불명확(ambiguous ownership)” 같은 새로운 테마가 많이 등장할 것입니다.
- 이런 것들을 인시던트 도구 안에서 새로운 태그나 필드로 만들어 기록해 두면, 나중에 쿼리하고 분석할 수 있습니다.
-
피드백 루프 만들기
- 아날로그 세션에서 얻은 인사이트를 활용해 포스트모템 템플릿 자체를 개선합니다.
- 예를 들어, “조직적 기여 요인(Organizational contributing factors)”이나 “관련 인시던트(Known related incidents)” 같은 구조화 필드를 새로 추가할 수 있습니다.
- 시간이 지날수록 디지털 데이터의 구조와 품질이 좋아지고, 이는 다음 아날로그 세션에서 훨씬 깊은 인사이트를 가능하게 만듭니다.
-
반복 등장하는 패턴을 정식 패턴으로 정의하기
- “사용자 관점 모니터링 부재로 인한 탐지 지연” 같은 구조가 여러 번 반복된다면, 이를 신뢰성 플레이북(reliability playbook) 안의 명명된 패턴(named pattern) 으로 정의합니다.
- 그 패턴을 보인 인시던트를 인시던트 도구 안에서 서로 링크합니다.
- 다음 아날로그 세션 때는, 타일을 패턴 이름별로 배치해 볼 수도 있습니다.
아날로그 작업은 디지털 도구에 더 나은 구조와 메타데이터를 제공하고, 디지털 도구는 아날로그 인사이트를 끌어낼 원재료(raw material) 를 제공합니다.
팀과 함께 직접 시도해 볼 수 있는 실용적인 단계
복잡한 장비는 필요 없습니다. 한 번의 워크숍에서 바로 실행할 수 있는 최소 구성 인시던트 스토리 퍼즐 캐비닛 예시는 다음과 같습니다.
- 지난 분기에서 3–5개의 인시던트를 고릅니다.
- 각 포스트모템에서 핵심 필드를 뽑습니다. (원인, 영향, 기여 요인, 완화책)
- 타일을 만듭니다. 인덱스 카드나 포스트잇을 사용하고, 한 카드에 한 항목만 적습니다.
- 화이트보드나 벽에 가로로 세 개의 밴드를 그립니다. 위에서부터 차례로 Impacts(영향), Causes/Factors(원인/요인), Mitigations(완화책).
- 인시던트별로 타일을 세로 열로 배치합니다. 인시던트 하나당 열(colum) 하나를 써서, 각 인시던트의 이야기가 세로로 읽히게 합니다.
- 모두가 각 인시던트를 한 번씩 살펴본 뒤, 함께 타일을 재배열합니다.
- 여러 인시던트에서 유사한 원인을 모아 묶기
- 공유되는 영향을 클러스터링
- 반복적으로 등장하는 완화책을 찾아 라벨링
- 발견된 패턴과 의외의 지점을 토론합니다. 개별 포스트모템에서는 보이지 않았던 어떤 테마가 눈에 띄는지 이야기합니다.
- 이 인사이트를 디지털 도구와 신뢰성 로드맵에 다시 옮겨 적습니다.
이 활동을 분기마다 반복하면, 여러분의 벽은 점점 “시스템과 조직이 스트레스 상황에서 어떻게 행동하는지”를 보여주는 시각적이고 진화하는 기억장치가 됩니다.
결론
인시던트는 복잡한 시스템과, 그 시스템을 운영하는 사람들이 압박 속에서 어떻게 상호작용하는지에 대한 이야기입니다. 표준화된 포스트모템 템플릿은 이 이야기에 구조를 부여하지만, 동시에 복잡성을 납작하게 만들고, 인시던트 간에 반복되는 패턴을 가리기도 합니다.
인시던트 구성 요소를 아날로그 퍼즐 조각으로 바꾸고, 이를 모듈형 캐비닛 구조로 조립하게 하면, 팀은 다음을 할 수 있습니다.
- 신뢰성 개념을 손으로 만지고, 옮기고, 재구성해 보기
- 개별 실패가 아닌 시스템과 피드백 루프를 눈으로 보기
- 게임 같은 연습으로 시스템 사고의 진입 장벽 낮추기
- 디지털 도구의 강점과 물리적 맵핑의 창의성을 연결하기
아날로그 인시던트 스토리 퍼즐 캐비닛은 단순한 ‘공예 활동’이 아닙니다. 신뢰성 패턴을 보이게 만들고, 손에 잡히게 만들며, 함께 이해하도록 돕기 위한 의도적인 방법입니다. 이를 통해 조직은 마지막 인시던트에만 반응하는 것을 넘어, 그 인시던트를 계속 만들어내는 시스템 자체에 대응할 수 있게 됩니다.