아날로그 인시던트 컴퍼스 ‘포치(현관)’: 워룸에 들어가기 전에, 먼저 종이 위에 이정표를 그려라
단순한 아날로그 의식, 물리적인 지도, 그리고 손으로 쓰는 상황 노트가 팀의 사고를 선명하게 하고, 복잡한 인시던트의 리스크를 줄이며, 워룸에 들어가기 전부터 모두를 정렬시키는 방법을 다룹니다.
아날로그 인시던트 컴퍼스 포치
워룸에 들어가기 전에, 종이 위에 이정표를 그리기
대형 장애, 제품 론칭, PR 위기 같은 고위험 순간이 오면 대부분의 팀은 곧장 워룸(war room) 으로 달려갑니다. 화면이 켜지고, 대시보드는 늘어나고, 사람들은 어떤 문제를 풀고 있는지 합의도 안 된 상태에서 해결책부터 쏟아내기 시작하죠.
이건 순서가 완전히 잘못된 겁니다.
‘전쟁’을 하러 워룸에 들어가기 전에, 먼저 포치(porch, 집 앞 현관 같은 공간) 가 필요합니다.
여기서 말하는 포치는 워룸에 들어가기 전, 조용한 아날로그 공간입니다. 스케치를 하고, 손으로 메모를 남기고, 종이와 물리적인 아티팩트 위에서 서로의 머릿속 모델을 맞춰가는 곳이죠. 여기서 잠깐 속도를 늦춰서 생각을 또렷하게 만들면, 본격적으로 속도를 올릴 때 모두가 같은 방향으로 달릴 수 있습니다.
이 글에서는 아날로그 인시던트 컴퍼스 포치(Analog Incident Compass Porch) 를 만드는 방법을 다룹니다. 특별한 도구가 아니라, 간단한 의식들—빨/노/초 대시보드, 프리모텀(pre‑mortem), 상황 노트, 물리적 지도, 그리고 현실이 바뀔 때마다 공동의 그림을 업데이트하는 ‘플로터(plotter)’ 역할—만으로도 충분합니다.
왜 워룸 전에 ‘포치’가 필요한가
디지털 도구는 세부 정보를 캡처하는 데는 뛰어나지만, 압박이 큰 상황에서 공유된 직관을 만드는 데는 형편없습니다. 탭은 늘어나고, 슬랙은 끝없이 스크롤되고, 핵심 정보는 스레드 속 노이즈에 묻힙니다.
아날로그 포치는 세 가지를 해줍니다:
- 반응 속도가 아니라, 생각의 속도를 늦춘다. 종이와 물리적 모델을 들고 15–30분만 투자해도, 우리가 실제로 무엇에 대응하려는지 훨씬 선명해집니다.
- 공유된 멘탈 모델을 만든다. 모두가 같은 지도, 색깔로 표시된 리스크, 한 장짜리 상황 노트를 보면, 같은 현실을 두고 이야기하게 됩니다.
- 숨은 가정을 드러낸다. 세 사람 머릿속에만 있는 계획에서는 빠진 단계를 알아차릴 수 없습니다.
항공, 원자력, 산업 제어 시스템처럼 안전이 핵심인 분야에서는 사람들에게 첫 번째이자 가장 빠른 스토리를 곧이곧대로 믿지 말고, 체크리스트, 지도, 서면 요약 위에서 반드시 스트레스 테스트를 하도록 훈련합니다. 그 습관을 빌려오면 됩니다.
복잡성을 눈에 보이게 만드는 간단한 아날로그 의식들
별난 툴이 필요 없습니다. 로우테크지만 신호가 강한 습관이면 충분합니다.
1. 손으로 만질 수 있는 빨–노–초(Red–Yellow–Green) 대시보드
중요한 인시던트 대응이나 핵심 의사결정 전에, 눈앞에 보이는 물리적 R/Y/G(빨/노/초) 대시보드를 벽이나 테이블에 만드세요.
- Red(빨강) – 이미 깨졌거나, 지금 깨지고 있거나, 흐름을 막는 상태
- Yellow(노랑) – 성능 저하, 불안정, 불확실한 상태
- Green(초록) – 건전, 신뢰 가능, 확인된 정상 상태
시스템, 팀, 벤더, 리스크 등을 포스트잇이나 카드로 만들고, 사람들이 직접 가져다 두거나 옮기게 합니다.
- “지금 결제 API는 빨간색인가요, 노란색인가요?”
- “고객 감정은 초록인가요, 사실은 노랑에서 빨강으로 가는 중 아닌가요?”
이렇게 하면 두 가지 이점이 생깁니다:
- 명확성을 강제합니다. 색을 반드시 골라야 하니, 모든 걸 “좀 안 좋음” 정도로 뭉뚱그릴 수 없습니다.
- 이견을 표면으로 끌어냅니다. 같은 카드를 두 사람이 서로 다른 색에 두려고 한다면, 지금 극도로 중요한 ‘인식 불일치’를 찾은 것입니다.
2. 프리모텀(Pre‑mortem)과 실패 이후 스토리텔링
프리모텀(pre‑mortem) — 일을 시작하기 전에:
- 이번 인시던트 대응이나 프로젝트가 형편없이 망했다고 가정합니다.
- 묻습니다: “가장 가능성 높은 실패 원인은 무엇일까?”
- 떠오르는 구체적인 실패 모드들을 종이에 적습니다.
이건 항공/원자력 현장에서 따온 트릭입니다. 미리 실패 방식 카탈로그를 만들어두면, 그중 하나가 실제로 나타났을 때 덜 놀라게 됩니다.
실패 이후 스토리텔링(Post‑failure storytelling) — 일이 끝난 뒤에는:
누군가를 찾기보다, 다음과 같은 이야기 형태로 정리합니다.
“우리가 이렇게 믿었고, 이런 시도를 했고, 실제로는 이렇게 흘렀고, 그래서 이런 걸 배웠다.”
그리고 이런 언어를 정상화합니다: “이게 통할 줄 알았는데, 안 통했다.”
이 문장이 포치와 워룸 양쪽에서 자연스럽게 나와야, 사람들이 안심하고 불확실성을 이야기할 수 있습니다. 심리적 안전감은 ‘좋은 분위기’ 문제가 아니라, 불편한 진실이 얼마나 빨리 드러나느냐를 좌우하는 실질적인 성능 지표입니다.
안전이 중요한 도메인에서 빌려오기: 먼저 종이 위에서 스트레스 테스트하라
실패가 곧 사람 목숨과 직결되는 산업—항공, 원자력, 자동차, 산업 제어—에는 공통적인 본능이 있습니다. 현실에서 사고가 나기 전에, 종이 위에서 재난을 여러 번 리허설한다는 점입니다.
당신의 전략이나 인시던트 대응 계획을 만들 때, 아래와 같은 간단한 평가 관점을 적용해보세요.
- 단일 장애점(Single point of failure)은 없는가? 특정 시스템/사람 하나가 실패하면 무엇이 깨지나?
- Fail‑safe인가, Fail‑dangerous인가? 이 계획이 부분적으로 실패했을 때, 안전하게 성능이 내려앉는가, 아니면 한 번에 폭발적으로 터지는가?
- 탐지 지연(Detection latency) 은 어느 정도인가? 이게 잘못되고 있다는 사실을 알아차리기까지 얼마나 걸리나?
- 에스컬레이션 경로(Escalation path) 는 어떤가? X가 실패하면, 누가 Y를 할 권한이 있고, 얼마나 빨리 움직일 수 있나?
- 가역성(Reversibility) 은 어느 정도인가? 우리가 틀렸을 때 이 결정을 되돌리기 얼마나 어려운가?
실행 전에 이런 렌즈로 종이 위에서 계획을 훑어보세요. 그 결과를 지도나 상황 노트에 직접 표시합니다. 이게 바로 아날로그 스트레스 테스트입니다. 비용은 거의 안 들고, 속도는 빠르며, 가장 위험한 간과를 막아줄 때가 많습니다.
상황 노트(Situation Note): 모두를 맞추는 한 장짜리 정렬 도구
특히 워룸을 본격 가동하기 직전, 혹은 중요한 논의가 끝날 때마다 상황 노트(situation note) 라는 한 장짜리 문서를 만듭니다. 누구든 2분 안에 읽고 “지금 어디까지 왔는지 알겠다”라고 말할 수 있어야 합니다.
좋은 상황 노트에는 보통 이런 내용이 들어갑니다:
- 사실(Facts) (시간 스탬프 포함)
- 무엇이 확실히 알려졌는지, 그리고 출처는 어디인지.
- 어떤 시스템/지역/고객 군이 영향을 받고 있는지.
- 상충되는 보고(Competing reports)
- “온콜은 레이턴시 정상이라고 말하지만, 로그는 스파이크를 보여준다.”
- “CS팀은 고객 불만이 폭주한다고 하는데, 모니터링은 여전히 초록이다.”
- 시각 자료(Visual)
- 시스템 다이어그램, 유저 플로우, 토폴로지, 간단한 타임라인 등.
- 열린 질문(Open questions)
- “이슈가 EU 트래픽에만 국한된 건가?”
- “데이터 무결성이 깨졌는지 여부를 알고 있는가?”
- 인식 스냅샷(Perception snapshot)
- 고객: 침착한가, 혼란스러운가, 분노했는가?
- 미디어: 모르는가, 추적 중인가, 이미 보도 중인가?
- 내부: 정렬되어 있는가, 분열/혼선 상태인가?
이걸 출력해서 테이블이나 벽에 붙이고, 정보가 들어올 때마다 업데이트합니다. 디지털 사본은 물론 있어도 좋지만, 물리적인 버전이 논의를 고정하는 기준점이 됩니다.
현실뿐 아니라, ‘인식(Perception)’도 함께 추적하라
요즘 인시던트에서는 내러티브 자체가 인시던트의 일부입니다.
- 사소한 기술적 이슈도, 커뮤니케이션을 잘못하면 큰 위기로 번집니다.
- 반대로, 심각한 장애도 투명하고 시의적절한 소통으로 평판 리스크를 관리할 수 있습니다.
따라서 항상 두 가지를 명시적으로 추적해야 합니다:
- 운영 상태(Operational state): 시스템과 프로세스에서 실제로 무슨 일이 일어나고 있는가.
- 인지된 상태(Perceived state): 고객, 파트너, 규제기관, 미디어, 내부 이해관계자들이 이 상황을 어떻게 경험하고, 어떻게 말하고 있는가.
포치 보드나 상황 노트 한쪽에 간단한 ‘인식 패널’을 추가하세요:
- 고객 감정(Customer sentiment): Green / Yellow / Red + 한 줄 설명
- 미디어 주목도(Media attention): Low / Emerging / High + 예시
- 이해관계자 신뢰(Stakeholder confidence): Stable / Wobbling / Breaking
이렇게 해야 워룸이 기술적으로는 옳지만, 평판상으로는 최악인 결정을 내리는 일을 막을 수 있습니다.
물리적으로 만들기: 책상 위의 지도, 토큰, 모델
디지털 화이트보드는 유용하지만, 손으로 직접 움직일 수 있는 물건만큼 깊게 사람을 몰입시키지는 못합니다.
테이블 위에 이런 것들을 올려두세요:
- 지도나 다이어그램: 시스템 아키텍처, 조직도, 고객 여정, 공급망 흐름 등
- 출력한 데이터: 핵심 그래프, 에러율, 타임라인, 지원 티켓 볼륨 등
- 토큰이나 모델: 카드, 레고 블록, 동전 등—자산, 팀, 고객, 리스크를 표현할 수 있는 무엇이든
그리고 실제로 이걸 사용합니다:
- 토큰을 옮겨 시스템이 초록에서 빨강으로 바뀌었음을 표현합니다.
- 중요 의존성 주변에 리스크 카드를 모아둡니다.
- 팀 토큰을 재배치하며, 다른 대응 역할 구성을 실험해봅니다.
이런 공간적 표현은 세 가지 효과를 냅니다:
- 멘탈 모델을 외부화합니다. 추상적인 이야기를 서로 하는 대신, “나는 여기 이 연결이 걱정됩니다”라고 손가락으로 짚을 수 있습니다.
- 빠른 시나리오 테스트가 가능합니다. “이 리전이 내려가면 어떻게 되지?” 토큰 하나를 옮기고, 어떤 연쇄 반응이 생기는지 눈으로 봅니다.
- 모두를 같은 페이지에 둡니다. 물리적 배치는 곧 공유된 그림입니다. 누군가 머릿속으로 다른 그림을 그리고 있으면, 그 차이가 즉시 눈에 띕니다.
플로터(Plotter): 공유된 그림의 관리자
인시던트가 빠르게 전개되면, 아날로그 보드는 현실과 금세 어긋나기 쉽습니다. 따라서 누군가는 이 보드를 책임지고 관리해야 합니다. 그 사람이 바로 플로터(plotter) 입니다.
플로터(혹은 퍼실리테이터)의 역할은 다음과 같습니다:
- 정보가 바뀔 때마다 물리적 모델을 즉시 갱신합니다.
- 핵심 결정, 상태 변화, 시간 정보를 보드와 상황 노트에 기록합니다.
- 사람들의 발언과 보드 위 내용이 어긋나면, 불일치를 즉시 지적합니다.
플로터는 결정을 내리지 않습니다. 대신 일관성(coherence) 을 지키는 역할을 합니다. 군대나 긴급 대응 센터에서 지도 테이블과 상태 보드를 전담으로 업데이트하는 인력이 있는 것과 같은 개념입니다.
당신의 조직에서는 플로터를 이렇게 둘 수 있습니다:
- 운영/프로그램 관리 쪽에서 돌아가며 맡는 퍼실리테이터
- 아날로그 매핑 교육을 받은 SRE나 인시던트 커맨더
역할은 단순하지만 중요합니다. 포치(그리고 이후의 워룸)가 언제나 하나의, 정확한 공통 그림 위에서 움직이도록 만드는 사람입니다.
“이게 통할 줄 알았는데, 안 통했다”를 일상적인 문장으로 만들기
사람들이 틀렸다고 말하기를 두려워한다면, 지금까지 이야기한 것은 모두 실패합니다.
다음과 같은 문장이 자연스럽게 오가는 문화를 만드세요:
- “우리는 X라고 믿었고, 그걸 테스트했는데, 우리가 틀렸다는 걸 알았다.”
- “우리 멘탈 모델이 불완전했다. 여기서 빠뜨린 부분은 이것이다.”
이걸 의식 속에 녹여 넣을 수 있습니다:
- 포치 디브리프(porch debrief): 큰 인시던트가 끝난 뒤 포치에서 만든 아티팩트를 리뷰하며, “어디서 우리의 가정이 현실과 어긋났는가?”를 묻습니다.
- 스토리텔링 라운드: 온콜 엔지니어, 고객지원, 커뮤니케이션 리드 등 서로 다른 역할이 짧고 솔직한 이야기를 나누되, 범인을 찾지 않습니다.
시간이 지나면, 팀은 포치를 학습의 장으로 받아들이게 됩니다. 재판장이 아니라는 걸 알게 되는 것이죠. 이런 심리적 안전감이 있어야, 압박이 최고조일 때도 더 빠르고 더 나은 결정을 내릴 수 있습니다.
모두 엮어보기
다음 번 큰 인시던트나 위험한 론칭을 앞두고, 아래 순서를 한 번 시도해보세요:
- 워룸을 본격 가동하기 20–30분 전, 모두가 한 공간(가능하면 물리적인 공간)에 모입니다.
- 핵심 시스템, 이해관계자, 인식을 위한 빨–노–초 보드를 만듭니다.
- 짧은 프리모텀을 돌립니다: “이번 대응이 실패했다고 치자—왜 망했을까?”
- 한 장짜리 상황 노트를 작성합니다. 사실, 상충 보고, 시각 자료, 열린 질문을 담습니다.
- 시스템, 팀, 고객을 나타내는 지도, 출력 데이터, 토큰을 책상 위에 펼칩니다.
- 보드와 상황 노트를 공유된 단일 진실의 근원(single source of shared truth) 으로 관리할 플로터를 지정합니다.
- 기술적 상태뿐 아니라 인식(perception) 도 명시적으로 추적합니다.
- 모든 게 잘 풀렸더라도, 끝나고 나면 실패 스토리텔링 세션을 진행합니다. 항상 ‘거의’ 안 됐던 무언가가 있기 마련이니까요.
아날로그 포치는 당신을 느리게 만들지 않습니다. 오히려 혼란, 불일치, 말하지 않은 가정에서 오는 마찰을 제거합니다. 그래서 워룸에 들어갈 때, 이미 나침반(컴퍼스), 지도, 그리고 우리가 무엇과 싸우고 있는지에 대한 공유된 이야기를 갖고 들어가게 됩니다.
판이 커질수록, 이런 작은 차이가 진짜 우위를 만듭니다.