Rain Lag

아날로그 장애 워룸: 사고 대응을 위한 접이식 종이 지휘 센터 만들기

장애, 사이버 인시던트, 보안 운영을 위해, 인시던트 지휘 체계를 눈에 보이는 공유 지휘 센터로 구현하는 접이식 종이 기반 ‘워룸’을 설계하는 방법.

소개

대형 장애나 사이버 인시던트가 터졌을 때 우리를 곤경에 빠뜨리는 건 복잡성 자체가 아니라, 보이지 않는 복잡성입니다.

브라우저 탭은 끝없이 늘어나고, 대시보드는 사방에 펼쳐집니다. 각자 보고 있는 화면과 맥락이 다릅니다. 채팅창은 중요한 결정을 순식간에 밀어내 버립니다. 그 와중에 누군가 이렇게 묻습니다. 인시던트 대응에서 가장 위험한 질문입니다.

“잠깐만… 지금 실제로 무슨 일이 일어나고 있는 거죠?”

이에 대한 단순하고 로우테크(저기술)인 해법이 다시 주목받고 있습니다. 바로 아날로그 워룸—한 공간에 인시던트를 시각화하는 접이식 종이 기반 지휘 센터입니다.

이건 화이트보드에 대한 향수가 아닙니다. 제대로 설계하면, 인시던트 커맨드 시스템(Incident Command System, ICS) 이론을 구체적인 시각적 워크플로우로 번역한 의도적인 시스템입니다. 아날로그 칸반 보드처럼 동작하며, 방 안의 모든 사람이 공유하는 단일 기준점이 됩니다.

이 글에서는 장애, 사이버 인시던트, 보안 운영(SecOps) 조정을 위해 접이식 종이 워룸을 설계하고 활용하는 방법을 단계별로 살펴봅니다.


왜 디지털 인시던트에 아날로그를 쓰는가?

종이 워룸은 티켓 시스템, SIEM, 협업 도구, 상태 페이지를 대체하기 위한 것이 아닙니다. 이것은 조정(코디네이션) 표면이지, 데이터 저장소가 아닙니다.

압박 상황에서 특히 잘 작동하는 이유는 다음과 같습니다.

  1. 하나의 공유된 현실 그림
    모두가 상태, 우선순위, 작업 내역을 한눈에 봅니다. 채팅에 묻히거나 툴 속에 파묻힌 맥락이 사라지지 않습니다.

  2. 학습 곡선이 0에 가까움
    인덱스 카드, 매직, 테이프만 있으면 됩니다. 온보딩도, 권한 설정도, 로그인도 필요 없습니다.

  3. 고대비 신호
    가치가 높고, 지금 당장 실행해야 할 것만 보드에 올라옵니다. 자연스럽게 노이즈가 필터링되고, 지금 중요한 것에만 집중하게 해 줍니다.

  4. 물리적 제약이 명료성을 강제
    공간이 제한되어 있기 때문에 우선순위를 강제로 정하게 됩니다. 200개의 티켓을 추적할 수는 없습니다. 대신, 봉쇄와 복구를 좌우하는 10개에 집중하게 됩니다.

  5. 툴 장애 시에도 작동
    채팅, 대시보드, VPN이 불안정할 때도 물리적인 보드는 그대로 작동합니다.

  6. 더 강한 협업
    실제 보드 앞에 모두가 서서 함께 보는 경험은, 화면 공유만으로는 잘 이루어지지 않는 수준의 정렬을 사이버, SecOps, 인프라, 리더십 사이에 만들어 줍니다.

요약하자면, 이것은 디지털 시스템 위에 얹는 아날로그 렌즈입니다. 복잡한 내용을 요약하고, 정리하고, 보이지 않던 일을 눈에 보이게 만듭니다.


ICS 이론을 시각 시스템으로 번역하기

인시던트 커맨드 시스템(ICS)은 인시던트 커맨더, 오퍼레이션(Operations), 기획(Planning), 커뮤니케이션(Communications) 등 표준화된 역할과 프로세스를 제공합니다. 하지만 실제 운영에서는, 눈앞에 구현되어 보이지 않으면 ICS는 추상적으로 느껴지기 쉽습니다.

접이식 워룸은 ICS를 눈에 보이는 워크플로우로 바꿔 줍니다.

최소한, 보드에는 다음 영역을 마련하는 것이 좋습니다.

  • 인시던트 개요

    • 인시던트 이름 / ID
    • 시작 시각
    • 현재 단계(탐지, 트리아지, 봉쇄, 근절, 복구, 사후 분석)
    • 심각도(Severity) 레벨
  • 역할 및 책임(ICS)

    • 인시던트 커맨더(Incident Commander, IC)
    • 오퍼레이션 리드(Operations Lead)
    • 커뮤니케이션 리드(Communications Lead)
    • 외부 이해관계자/부서 연락 담당(Liaison)
    • 서기 / 기록 담당(Scribe / Documentation)
      누가 어떤 역할을 맡고 있는지 명확히 보이게 합니다. 사람당 하나의 카드를 쓰고, 역할이 교대될 때는 카드를 옮겨 달기만 하면 됩니다.
  • 목표 및 전략

    • 현재 단계에서의 최우선 목표 3–5개
    • 시간 제한 설정(예: “15:30까지 우리는 …을 완료한다”)
      이 영역이 전략과 업무를 연결하는 ‘북극성(north star)’ 역할을 하며, 개별 작업이 큰 방향과 정렬되도록 돕습니다.
  • 운영 작업(칸반 레인)

    • To Do
    • In Progress
    • Waiting / Blocked
    • Done

보드 위의 각 카드는 정확히 정의된 하나의 작업을 의미하며, 다음 정보를 포함합니다.

  • 담당자(이름 또는 팀)
  • 마감 / 리뷰 시각
  • 시스템 또는 범위(예: “API-GW-1”, “이메일 게이트웨이”, “EU 법인 노트북”)
  • 필요 시 디지털 레코드 참조(티켓 번호, 케이스 ID 등)

이 레이아웃을 통해 팀은 표준화된 역할과 반복 가능한 프로세스로 혼란을 관리하게 되고, 즉흥적인 ‘영웅 플레이’에 덜 의존하게 됩니다.


접이식 종이 워룸 설계하기

비싼 장비는 필요 없습니다. 필요한 것은 똑똑한 레이아웃입니다.

1. 물리적 형태 선택

다음과 같은 옵션이 잘 맞습니다.

  • 3단 폼보드 또는 포스터 보드
    휴대 가능하고, 혼자 세울 수 있으며, 보관도 쉽습니다. 작은 회의실에 적합합니다.

  • 대형 접이식 벽 차트
    롤지(roll) 종이나 플로터로 인쇄한 템플릿을 벽에 테이프로 붙이는 형태입니다.

  • 모듈형 패널
    A3/Tabloid 크기 정도의 작은 보드 여러 개를 집게나 클립으로 이어 붙여, 시간이 지나며 섹션을 재배치할 수 있게 합니다.

핵심 요구사항은 하나입니다. 5분 안에 셋업 가능하고, 재사용 가능한 구조를 유지한 채로 손쉽게 접어 보관할 수 있어야 합니다.

2. 보드의 핵심 존(Zone)

다음과 같은 기본 레이아웃으로 시작해 볼 수 있습니다.

  1. 상단 바(Top Bar): 인시던트 헤더

    • 인시던트 이름, ID, 날짜, 심각도, IC 이름
    • 색상으로 구분한 심각도 스트립(예: 초록/노랑/주황/빨강)
  2. 좌측 패널: 사람 & 커뮤니케이션

    • ICS 역할 및 현재 담당자
    • 주요 이해관계자 연락처
    • 외부 의존 관계(벤더, 규제 기관, 수사기관 등)
  3. 중앙 패널: 운영 칸반

    • 큰 레인: To Do → In Progress → Waiting/Blocked → Done
    • 레인별 카드 상한(WIP limit)을 정해 과부하를 방지합니다.
  4. 우측 패널: 타임라인 & 팩트(Facts)

    • 주요 이벤트 타임라인(주요 발견, 조치, 결정)
    • 확정된 사실 vs 추정(서로 다른 색 노트로 구분)
    • 조사를 이끄는 미해결 질문들

시간이 지나면 이 존들을 정교하게 다듬고 모듈화할 수 있습니다. 포렌식 전용 미니 패널을 추가하거나, “규제/법무(Regulatory/Legal)” 전용 레인을 따로 만드는 식입니다.

3. 카드 시스템과 색상 코드

기본 단위는 **인덱스 카드 또는 포스트잇(Sticky Note)**입니다.

추천 색상 체계:

  • 흰색 – 일반 운영 작업
  • 노란색 – 조사해야 할 질문 / 미지의 영역
  • 빨간색 – 치명적인 블로킹 이슈 또는 리스크
  • 파란색 – 커뮤니케이션 / 이해관계자 공지 관련 작업
  • 초록색 – 주요 마일스톤 완료(모든 Done 작업이 아니라, 의미 있는 성과만)

카드 포맷은 단순하게 유지합니다.

  • 짧고 행동 지향적인 제목
  • 담당자
  • 시작/업데이트 시각
  • (선택) 티켓 ID 또는 시스템 태그

카드 설명이 한 줄을 넘어가기 시작하면, 작업 단위가 너무 큰 것일 수 있습니다. 더 작은 작업으로 쪼개는 것이 좋습니다.


빠르게 움직이는 작업을 위한 아날로그 칸반으로 쓰기

디지털 칸반 도구들은 훌륭하지만, 강도 높은 인시던트 상황에서는 즉시성·공유 가시성 측면에서 한계를 보일 때가 많습니다.

물리적인 보드는 다음을 제공합니다.

  • 즉각적인 가시성: 눈으로 스캔만 해도 50개의 작업 상태를 2초 안에 파악할 수 있습니다.
  • ‘몸으로 느끼는’ 커밋먼트: 여러 사람 앞에서 카드를 ‘In Progress’로 옮기는 행위는, 작지만 실제로 심리적 책임감을 만들어 줍니다.
  • 자연스러운 스탠드업 리듬: 15–30분마다 팀이 보드 앞에 모여 다음을 확인합니다.
    • 무엇이 Done으로 이동했는가?
    • 무엇이 Blocked에 묶여 있는가?
    • 새 정보로 인해 To Do에 추가해야 할 것은 무엇인가?

아날로그이기 때문에, 스트레스 상황에서 도움이 되는 미세한 행동 패턴들도 자연스럽게 생깁니다.

  • Blocked에 빨간 카드가 몰려 있으면, 사람들이 그 구역에 모여듭니다.
  • IC는 손가락으로 직접 가리키고, 배정하고, 우선순위를 재정렬할 수 있습니다.
  • 채팅으로 작업이 ‘푸시’되는 대신, 보드에서 작업을 직접 ‘풀(Pull)’해서 가져가는 방식이 됩니다.

핵심은 규율입니다. 디지털 도구에 기술적 세부 내용이 얼마나 많이 있든, 작업의 안무(누가 무엇을 언제 하는지)에 대한 단일 소스 오브 트루스는 보드가 되어야 한다는 점입니다.


사이버, SecOps, 인프라를 하나의 뷰로 정렬시키기

보안 인시던트는 팀 단위로 쉽게 쪼개집니다.

  • 사이버 / 탐지(D&R, Threat Detection)
  • SecOps / 대응
  • 인프라 / 플랫폼
  • 애플리케이션 팀
  • 법무 / 커뮤니케이션

각 팀은 서로 다른 툴과 약어를 씁니다. 종이 보드는 이들 사이에 놓이는 중립적인 조정 레이어가 됩니다.

도움이 되는 방식은 다음과 같습니다.

  • ICS 역할을 통한 공통 언어
    “SIEM 쪽 책임자가 누구야?” 대신 “지금 Operations Lead가 누구야?” 같은 질문을 하게 됩니다.

  • 작업 카드가 팀 간 연결점 역할
    예를 들어, “SecOps + Infra: 10.x 서브넷 격리 후 조사” 같은 카드가 있을 수 있습니다. 이 카드는 특정 팀의 툴 안이 아니라, 보드 위에서 팀 사이에 놓입니다.

  • 플레이북(Playbook) 가동이 눈에 보임
    랜섬웨어, 피싱, DDoS 플레이북을 발동하면, 이를 다음과 같이 표현합니다.

    • 명확히 라벨링된 섹션 또는 카드 묶음(예: “Ransomware Playbook Step 1–5”)
    • 표준 운영 절차(SOP) 중에서도 지금 당장 가치가 높은 액션만 보드에 올리고, 세부 절차는 문서에 남겨 둡니다.

이 물리적 표현 덕분에 협업 우선순위 결정이 쉬워집니다.
“이 네 장의 카드 중 어떤 것을 먼저 해야 봉쇄에 가장 빨리 다가갈 수 있을까?” 같은 질문을 함께 논의하게 됩니다.


SOP와 플레이북을 실제로 쓰이게 만들기

많은 조직이 상세한 SOP와 인시던트 플레이북을 가지고 있지만, 정작 실제 상황에서는 아무도 찾지 못하거나, 찾아도 따라가지 못합니다.

아날로그 워룸은 이 모델을 뒤집습니다.

  1. SOP와 플레이북은 위키나 런북 등 디지털에 그대로 둡니다.
  2. 그 가운데서 결과에 직접적인 영향을 주는 핵심 스텝만 보드 위 카드로 승격합니다.
  3. 보드는 방대한 절차 라이브러리 중 전술적으로 필요한 슬라이스만 잘라서 보여 주는 역할을 합니다.

효과적으로 유지하려면 다음을 지키면 좋습니다.

  • 문서가 아니라, ‘결정’을 표면으로 올릴 것.
    카드는 “고객 공지 범위 결정”이라고 써야지, “7페이지짜리 고객 커뮤니케이션 정책 읽기”라고 써서는 안 됩니다.

  • 활성 스텝 수를 제한할 것.
    피싱 플레이북에 25단계가 있더라도, 지금 이 순간 관련 있는 3–7개만 보드에 올립니다.

  • 체크리스트로 마이크로 스텝을 묶을 것.
    “포렌식 스냅샷: 메모리, 디스크, 로그”라는 한 장의 카드에 작은 체크리스트를 함께 두고, 이를 10장의 카드로 쪼개지 않는 식입니다.

시간이 지날수록 실제 인시던트에서 반복적으로 중요해지는 SOP 스텝이 무엇인지 감이 잡히게 됩니다. 그러면 보드 레이아웃과 카드 템플릿은 인시던트 대응 시스템에 대한 진화하는 인터페이스가 됩니다.


아날로그와 디지털 뷰 통합하기

아날로그 워룸은 디지털 툴과 경쟁하는 것이 아니라, 함께 사용할 때 가장 빛을 발합니다.

효과적인 결합 패턴은 다음과 같습니다.

  • 디지털 타임라인 ↔ 물리적 하이라이트
    세부 타임스탬프와 로그는 인시던트 관리 툴에 남깁니다. 그중 주요 이벤트만 보드의 “타임라인” 스트립에 옮겨 적어, 상황 인식을 한눈에 할 수 있게 합니다.

  • 그래프/의존성 뷰 ↔ 카드의 시스템 태그
    CMDB나 그래프 뷰로 영향 범위(Blast Radius)를 파악한 뒤, 각 카드에 관련 시스템 태그를 추가합니다. 보드는 “무슨 일을 할지(Work)”를 보여주고, 그래프는 “어떤 구조 위에서 일어나는지(Structure)”를 보여줍니다.

  • 티켓 ↔ 카드 ID
    각 카드는 필요 시 티켓 ID를 참조값으로 포함합니다. 인시던트 종료 후 서기(Scribe)가, 보드에서 일어난 일을 시스템 기록과 대조해 정리합니다.

  • 사진으로 상태 스냅샷 남기기
    예를 들어 봉쇄 달성, 복구 단계 전환 같은 시점에 보드를 사진으로 남깁니다. 사후 인시던트 리뷰(Post-Incident Review)에 이 사진을 포함하면, 어떤 흐름으로 의사결정이 이루어졌는지 복원하는 데 큰 도움이 됩니다.

아날로그는 빠르고 맥락 있는 스냅샷을 제공하고, 디지털은 깊이와 감사 추적(Audit Trail)을 책임집니다.


시스템을 유연하게 유지하고 계속 진화시키기

첫 번째 버전의 워룸은 틀릴 가능성이 높습니다. 그것이 정상입니다. 그래서 처음부터 모듈형이고, 쉽게 바꿀 수 있게 설계해야 합니다.

실용적인 팁은 다음과 같습니다.

  • 레인 이름과 섹션 제목은 인쇄로 박제하지 말고, 테이프와 탈부착 가능한 라벨을 사용합니다.
  • 미지의 유형의 인시던트에 빠르게 전용 섹션을 만들 수 있도록, 일부는 ‘빈’ 존으로 남겨 둡니다.
  • 큰 인시던트가 끝날 때마다 짧은 **보드 회고(Retrospective)**를 진행합니다.
    • 아무도 보지 않았던 섹션은 줄이거나 제거합니다.
    • 우리가 즉석에서 만들어 썼던 구조(예: 급하게 만든 타임라인 섹션)가 있다면 정식 구조로 승격합니다.
    • 플레이북 카드 중 항상 유용했던 것과, 항상 노이즈에 가까웠던 것을 구분합니다.

이 과정을 반복하다 보면, 교과서 속 이상적인 모델이 아니라 자신들의 실제 업무에 딱 맞는 인시던트 지휘 인터페이스에 점점 가까워지게 됩니다.


결론

복잡한 툴과 끝없는 대시보드의 시대에, 접이식 종이 워룸은 의외로 강력한 업그레이드입니다.

ICS 이론을 물리적이고 시각적인 워크플로우로 바꿈으로써, 다음을 얻을 수 있습니다.

  • 모두가 즉시 이해할 수 있는 공유 지휘 센터
  • 긴급 작업과 우선순위가 명확히 드러나는 아날로그 칸반
  • 사이버, SecOps, 인프라, 리더십을 하나의 현실 그림에 정렬시키는 실질적인 방법
  • 방대한 SOP 가운데, 압박 상황에서 진짜로 중요한 고가치·실행 가능한 작업만 뽑아내는 다리 역할

완벽함을 갖추고 시작할 필요는 없습니다. 접이식 보드, 인덱스 카드, 매직, 그리고 레이아웃에 대한 약간의 고민만 있으면, 다음 대형 인시던트를 더 선명하고 덜 혼란스럽게 운영할 수 있습니다.

그리고 인시던트 프로그램 자체와 마찬가지로, 아날로그 워룸도 매 장애, 매 교훈마다 함께 진화시켜 나가면 됩니다.