아날로그 인시던트 컴퍼스 플레이매트: 전 팀이 함께 밟고 걷는 대형 종이 장애 맵 만들기
바닥에 깔아 쓰는 거대한 종이 ‘인시던트 컴퍼스’가 전통적인 테이블탑 훈련을, 팀 전체가 함께 몰입해 걷고 탐색하는 장애 워크스루로 바꾸어 신뢰성·커뮤니케이션·학습을 키우는 방법.
아날로그 인시던트 컴퍼스 플레이매트: 전 팀이 함께 밟고 걷는 대형 종이 장애 맵 만들기
“테이블탑(tabletop) 연습”이라고 하면, 보통 사람들이 회의실 책상에 둘러앉아 바인더와 노트북, 커피를 놓고 토론하는 모습을 떠올리기 쉽습니다. 물론 이런 방식도 유용하지만, 특히 평소에 인시던트 대응을 많이 하지 않는 사람들에게는 집중력이 쉽게 떨어질 수 있습니다.
이제 전혀 다른 장면을 상상해 보세요. 바닥 가득 펼쳐진 거대한 종이 "인시던트 컴퍼스(incident compass)" 플레이매트—팀 전체가 실제로 그 위를 걸어 다니며, 서서, 움직이며 장애 시나리오를 함께 탐색할 수 있는 물리적 지도입니다.
이것이 바로 **아날로그 인시던트 컴퍼스(Analog Incident Compass)**의 아이디어입니다. 장애 워크스루를 더 몰입감 있고, 협업적이며, 기억에 남게 만들기 위해 설계한, 크고 시각적인 저기술(low‑tech) 도구입니다. 여전히 정신적으로는 테이블탑 연습이지만, 이제 “테이블”은 방 전체라고 할 수 있습니다.
이 글에서는 테이블탑 연습이 왜 중요한지, 아날로그 인시던트 컴퍼스 플레이매트가 어떻게 작동하는지, 그리고 더 넓은 대비·신뢰성 프로그램 안에 잘 녹아들도록 어떻게 설계할 수 있는지 살펴보겠습니다.
테이블탑 연습이 중요한 이유 (그리고 자주 실패하는 이유)
테이블탑 인시던트 대응 연습은 팀이 사이버 보안 사고나 운영 장애를 다루는 연습을 할 수 있는 저압(低壓)의 모의 환경을 제공합니다. 실제 인시던트가 터져서야 문제를 발견하는 대신, 안전하게 다음을 리허설합니다.
- 누가 가장 먼저 대응하고, 어떻게 트리아지(triage)를 하는지
- 정보가 팀 간에 어떻게 공유되는지
- 사람들이 실제로 어떤 툴·대시보드·런북(runbook)을 사용하는지
- 리더십과 외부 이해관계자에게 어떻게 상황을 업데이트하는지
무엇보다 중요한 것은, 주요 목표가 학습이라는 점입니다. 공식 계획과 절차를 통과·탈락 시험하듯 평가하는 자리가 아니라는 뜻입니다. 제대로 설계된 테이블탑 연습은 다음을 가능하게 합니다.
- 수행 평가지 대신 자유로운 토론을 장려
- 오해와 기대 불일치를 드러냄
- 문서가 없거나, 오래되었거나, 실제로는 쓰이지 않는 부분을 밝혀냄
- 압박 상황에서 함께 일하게 될 사람들끼리 친숙함을 쌓음
하지만 많은 테이블탑 세션은 다음과 같은 문제를 안고 있습니다.
- 지나치게 추상적임 (“장애가 났습니다… 자, 어떻게 하시겠어요?”)
- 문서 중심으로 흐름 (모두가 PDF를 돌아가며 읽는 수준)
- 너무 수동적임 (몇 명만 말하고 나머지는 방청객처럼 구경)
아날로그 인시던트 컴퍼스 플레이매트는 연습을 구체적이고, 공간감 있으며, 모두가 공유하는 활동으로 바꾸어 이 문제를 해결하려 합니다.
테이블 위에서 바닥 위로: 아날로그 인시던트 컴퍼스란?
**아날로그 인시던트 컴퍼스(Analog Incident Compass)**는 플로터(plotter) 용지나 여러 장의 종이를 테이프로 이어 만든, 대형 포맷의 종이 플레이매트로, 바닥이나 큰 테이블에 깔아 사용하는 도구입니다. 인시던트 상황을 시각적인 ‘사고 공간’의 지도로 표현한 것으로, 전체 팀이 함께 참여하도록 설계되어 있습니다.
다음의 하이브리드라고 생각하면 이해하기 쉽습니다.
- 위기 관리 보드(crisis management board)
- 서비스 토폴로지 다이어그램(service topology diagram)
- 장애 시나리오를 위한 보드게임판
사람들은 지도 주변(혹은 위)에 서서, 스티키 노트, 토큰, 카드 등을 움직이며 다음을 표현합니다.
- 시스템과 서비스
- 팀과 역할
- 의사결정과 실행 조치
- 정보 흐름과 커뮤니케이션 채널
이제 우리는 추상적으로 인시던트를 두고 이야기하는 것이 아니라, 그 안을 걸어 다니고, 가리키며, 함께 통과해 나가는 것에 가깝게 됩니다.
인시던트 컴퍼스 설계하기: 핵심 요소
인시던트 컴퍼스는 조직 환경에 맞게 얼마든지 커스터마이징할 수 있지만, 효과적인 디자인에는 공통적으로 포함되는 구성 요소들이 있습니다.
1. 맵의 핵심 존(Core Zones)
플레이매트를, 실제 인시던트에서 조직이 일하는 방식을 반영하는 **명확한 존(zone)**으로 나누고 라벨을 붙입니다. 예를 들어:
- 탐지 & 신호 (Detection & Signals) – 모니터링, 알림(alert), 사용자 신고, 이상 징후 대시보드
- 트리아지 & 진단 (Triage & Diagnosis) – 온콜(on‑call) 대응자, SRE/운영 엔지니어, 보안 분석가
- 완화 & 복구 (Mitigation & Recovery) – 런북, 롤백 경로, 페일오버(failover) 절차
- 커뮤니케이션 & 이해관계자 (Communication & Stakeholders) – 내부 채널, 리더십 브리핑, 고객 커뮤니케이션
- 사후 분석 & 학습 (Post‑Incident & Learning) – 인시던트 리뷰, 액션 아이템, 후속 테스트
이러한 존은 참가자들에게 공유된 멘탈 모델을 제공합니다. 시나리오가 전개됨에 따라, 사람들은 노트와 토큰을 존 사이로 실제로 옮기며 대응이 어떻게 진화하는지 표현하게 됩니다.
2. 시나리오 트랙과 시간 마커
시간이 정해진 세션(예: 2시간 연습)에 맞추기 위해, 맵에 단순한 **타임라인 아크(timeline arc)**를 추가합니다.
- T0 – 첫 번째 알림 또는 신호 발생
- +15분 – 에스컬레이션(escalation) 결정
- +30–60분 – 주요 완화 조치
- +90–120분 – 복구 및 안정화
퍼실리테이터는 이 타임라인을 따라가며 각 시점에 어떤 새로운 정보가 주어지는지 설명합니다. 참가자들은 이 트랙을 따라 자신의 계획된 행동을 배치하고, 이를 통해 트레이드오프와 지연이 한눈에 보이도록 합니다.
3. 이해관계자 및 시스템 토큰
인시던트의 움직이는 구성 요소를 표현하기 위해 물리적인 오브젝트를 사용합니다.
- 팀 토큰: SRE, 보안, 네트워킹, 애플리케이션 팀, 리더십, 법무, PR, 헬프데스크 등 역할이 적힌 카드
- 시스템 토큰: 주요 서비스, 데이터베이스, 외부 의존성, 핵심 사용자 플로우를 나타내는 아이콘
토큰을 각 존에 배치하면서 다음 질문에 답하게 됩니다.
- 현재 조치를 누가 담당하고 있는가?
- 지금 영향을 받는 시스템은 무엇이고, 잠재적으로 위험한 시스템은 무엇인가?
- 커뮤니케이션 병목은 어디에서 발생하는가?
이렇게 하면 모두가 한눈에 누가 참여 중이며 누가 빠져 있는지 볼 수 있기 때문에, 팀 간 커뮤니케이션을 자연스럽게 촉진합니다.
시나리오 기반 템플릿 활용: ESK, T.E.S.T. 등
연습 구조를 완전히 처음부터 만들 필요는 없습니다. ESK, T.E.S.T. 같은 시나리오 기반 템플릿과 가이드(및 유사한 공개 프레임워크)는 퍼실리테이터가 다음을 하는 데 도움을 줍니다.
- 연습의 목표와 범위를 정의
- 인젝트(inject: 새 이벤트나 정보)의 순서를 표준화
- “좋은 대응”이 무엇인지 이해관계자 간 기준을 정렬
이 템플릿들을 인시던트 컴퍼스와 함께 사용하면, 템플릿은 게임판을 위한 스크립트가 됩니다.
- ESK/T.E.S.T.는 스토리라인과 의사결정 포인트를 제공합니다.
- 플레이매트는 그 결정을 시각화할 공간을 제공합니다.
예를 들어, 다음과 같이 진행할 수 있습니다.
- 시나리오 선택: 교육청 랜섬웨어, 공공 서비스에 대한 DDoS, 대형 이벤트 중 결제 시스템 장애 등
- 템플릿으로 단계 구성: 탐지, 봉쇄, 제거, 복구, 커뮤니케이션
- 이 단계들을 인시던트 컴퍼스의 존과 타임라인에 옮겨 담기
이 조합을 통해, 연습은 반복 가능하고 비교 가능하면서도, 현장에서 살아 움직이는 듯한 역동성을 유지하게 됩니다.
연습 진행하기: 플레이매트가 바꾸는 역학
바닥 크기의 인시던트 컴퍼스는 시각 요소뿐 아니라 참가자들의 행동 양식 자체를 바꿉니다.
1. 모두가 같은 그림을 본다
각자 노트북 화면만 들여다보는 대신, 모두가 하나의 공유 아티팩트를 바라봅니다. 이로 인해 다음이 가능해집니다.
- 숨겨진 가정이 드러남 (“잠깐, 이건 SRE가 아니라 네트워크 팀 담당인 줄 알았는데?”)
- 사일로 안에서 이루어지는 뒷이야기 감소
- 비기술 이해관계자도 장애 흐름을 쉽게 이해
2. 열린, 협력적인 토론을 이끈다
사람들이 서서 움직이고, 가리키고, 협상합니다.
- “보안팀이 여기 붙잡혀 있으면, 이 시스템은 누가 보고 있는 거죠?”
- “이 의존성이 안정되기 전까지는 저런 완화 조치는 못 합니다.”
- “학교장 / 이벤트 주최 측 / 임원진에게는 누가 언제 알리죠?”
이는 실제 인시던트 현장과 비슷합니다. 빠른 대화 교환, 눈에 보이는 트레이드오프, 팀 간 조율이 핵심이지, 조용히 메모만 하고 형식적인 발표만 하는 자리가 아닙니다.
3. 세션을 집중되고 시간 안에 끝내게 한다
퍼실리테이터는 시간 마커를 따라 그룹을 이끕니다.
- “지금은 +30분 시점입니다. X를 시도했지만 실패했습니다. 다음은 무엇을 하시겠습니까?”
- “지금 +90분입니다. 시스템은 부분적으로 복구됐지만, 고객들은 혼란스러워합니다. 커뮤니케이션 계획은 무엇인가요?”
이 물리적인 타임라인 덕분에 2시간짜리 연습을 계획대로 진행할 수 있고, 탐지부터 복구까지 모든 단계를 빠짐없이 다루게 됩니다.
결과 수집하기: 리포트와 교훈 정리
인시던트 컴퍼스의 시각적 특성은 사후 평가를 훨씬 수월하게 만듭니다.
플레이매트를 철거하기 전에 사진을 찍고, 핵심 정보를 다음과 같은 리포트 템플릿에 옮겨 담습니다.
- 잘 된 점: 명확한 오너십, 효과적인 런북, 적절한 에스컬레이션 경로
- 실패하거나 부족했던 점: 문서화되지 않은 시스템, 불분명한 의사결정 권한, 취약한 의존성
- 액션 아이템: 문서 업데이트, 런북 작성, 모니터링 개선, 교육·훈련 필요 사항
참가자들은 세션 내내 자신의 멘탈 모델을 맵 위에 **외화(外化)**했기 때문에, 디브리핑은 훨씬 덜 추상적입니다.
- “이 토큰이 몰려 있는 구간 보이시죠? 여기서 세 팀이 한 명의 결정을 기다리고 있었습니다.”
- “60분이 지나기 전까지 아무도 ‘이해관계자 커뮤니케이션’ 존에 서 있지 않았네요. 이건 명백한 갭입니다.”
인시던트 컴퍼스는 이처럼 교육 도구이자 진단 도구가 됩니다.
더 큰 대비·신뢰성 프로그램 안에서의 위치
바닥에서 하는 대형 연습이 다소 과한 것처럼 느껴질 수 있지만, 고위험 환경에서는 매우 중요한 도구가 될 수 있습니다.
- 기간 시설(전력, 상하수도, 교통 등)
- 학교와 대학
- 병원과 공공 보건 시스템
- 대형 이벤트(스포츠, 콘서트, 페스티벌)
이런 환경에서는 실제 장애 시 혼란의 비용이 막대합니다. 인시던트 컴퍼스는 더 큰 평가·대비 프로그램의 한 구성 요소로, 예를 들어 다음과 같은 것들과 함께 운영됩니다.
- 정기적인 소규모 테이블탑 드릴
- 툴링·모니터링 개선
- 온콜 및 에스컬레이션 연습
- 실제 인시던트 이후의 블레이믈리스 포스트모템(blameless postmortem)
마지막 항목이 특히 중요합니다. 테이블탑 드릴과 블레이믈리스 포스트모템을 함께 운영하면, 다음과 같은 선순환을 만들 수 있습니다.
- 실제 인시던트 발생 → 비난 없는(blameless) 리뷰 진행
- 커뮤니케이션, 툴링, 이해 부족 등의 갭을 발견
- 그 약점을 중심으로 새로운 인시던트 컴퍼스 시나리오 설계
- 연습을 실행하고, 개선하고, 문서를 업데이트
- 다음 실제 인시던트 발생 시 → 더 잘 대비된 상태로 대응하고, 다시 리뷰 진행
시간이 지날수록, 이는 신뢰성·협업·지속적 개선의 문화를 만들고, 두려움과 책임 전가 문화는 줄입니다.
시작하는 방법
아날로그 인시던트 컴퍼스를 도입하는 데 디자인 팀이나 큰 예산이 꼭 필요한 것은 아닙니다.
- 먼저 종이에 스케치하세요. 화이트보드나 큰 종이에 존과 타임라인을 그려봅니다.
- 단순한 대형 맵을 출력합니다. 플로터를 쓰거나 A3/A4 용지를 여러 장 이어 붙여도 충분합니다.
- 스티키 노트와 인덱스 카드 사용. 이것들이 팀·시스템 토큰이 됩니다.
- 소규모 파일럿을 돌려보세요. 60–90분짜리 연습을 한 번 해보고, 무엇이 도움이 되었고 무엇이 헷갈렸는지 피드백을 받습니다.
- 반복·개선합니다. 조직이 실제로 어떻게 대응하는지와 맵이 잘 맞아떨어질 때까지 존, 라벨, 토큰을 계속 다듬습니다.
목표는 예술 작품을 만드는 것이 아니라, 장애 스토리가 전개되고 모두가 그 안에서 자신의 역할을 볼 수 있는 공유된 물리적 공간을 만드는 것입니다.
맺음말
테이블탑 연습은 원래도 인시던트 대응을 저위험·모의 환경에서 연습할 수 있는 강력한 방법입니다. 여기에 바닥 크기의 아날로그 인시던트 컴퍼스 플레이매트를 더하면, 연습은 한층 더 시각적이고, 몸으로 느끼는 경험이며, 집단적인 활동이 됩니다.
ESK, T.E.S.T. 같은 시나리오 기반 템플릿과, 시스템·팀·타임라인을 그려 넣은 물리적 맵을 결합하면 다음을 이룰 수 있습니다.
- 팀 간 열린 커뮤니케이션을 촉진
- 추상적인 장애를 구체적이고 따라가기 쉬운 스토리로 전환
- 교훈을 더 쉽게 포착하고 개선 과제를 우선순위화
- 연습(테이블탑)과 현실(블레이믈리스 포스트모템) 사이의 다리를 강화
시스템은 갈수록 복잡해지고, 장애 한 번의 파급력이 커지는 세상에서, 가장 효과적인 도구가 놀랍도록 단순할 때가 있습니다. 바닥 위에 펼친 커다란 종이, 몇 개의 마커와 스티키 노트, 그리고 함께 배우려는 사람들이 가득한 방. 그게 바로 이 아날로그 인시던트 컴퍼스입니다.