아날로그 인시던트 스토리 컴퍼스 오러리 데스크: 충돌하기 전에 종이 우주를 손으로 돌려보는 위험 시뮬레이션
안티키테라 장치를 모티브로 한 hand‑crank(손잡이) 종이 오러리가 테이블탑 연습을 ‘일어나기 전’ 인시던트, 장애, 연쇄 위험을 눈으로 보는 생생한 도구로 바꾸는 방법.
소개: 종이 하늘에서 폭풍을 예측하기
1900년대 초, 그리스 안티키테라 섬 앞바다에서 잠수부들이 녹슨 청동 덩어리 하나를 건져 올렸습니다. 검사를 해보니 그건 놀라운 물건이었습니다. 바로 고대의 아날로그 "컴퓨터"였죠. 안티키테라 메커니즘(Antikythera mechanism) 은 손잡이를 돌려 움직이는 오러리(orrery), 즉 일식과 천문 현상을 예측하기 위해 하늘을 기계적으로 구현한 장치였습니다.
이 장치는 행성의 움직임을 멈추지도, 일식을 막지도 못합니다. 대신, 보이지 않던 것을 보이게 만들었습니다. 복잡한 천체의 춤을 눈으로 보고, 손으로 돌리고, 이해할 수 있는 것으로 바꾸어 준 것이죠.
인시던트에도 똑같은 일을 할 수 있습니다.
현대의 분산 시스템에서 장애는 피할 수 없습니다. 서비스가 다운되고, 의존성이 멈추고, 공격자가 방어선을 두드리고, 전원이 나가고, "사소한" 설정 실수가 전체 생태계에 파장을 일으킵니다. 이런 일은 일어나지 않을 거라고 믿는다고 해서 더 안전해지지 않습니다. 우리를 지켜주는 것은 이 일들을 이해하고, 모델링하는 것입니다.
여기서 등장하는 것이 바로 아날로그 인시던트 스토리 컴퍼스 오러리 데스크(Analog Incident Story Compass Orrery Desk) 입니다. 손으로 돌리는 종이 기반의 우주 모델을 통해, 서로 다른 위험과 장애가 어떻게 충돌할 수 있는지 팀이 미리 탐색해 볼 수 있으며, 그것이 실제 프로덕션에서 일어나기 전에 실험해 볼 수 있습니다.
안티키테라에서 인시던트로: 왜 ‘위험의 오러리’인가?
안티키테라 메커니즘은 우리가 위험과 신뢰성(reliability)을 어떻게 생각할 수 있는지 잘 보여주는 강력한 은유입니다.
- 기계적 제약을 활용해 복잡성을 모델링합니다.
- 손잡이를 돌려 시간을 시뮬레이션합니다. 돌리면 미래를 볼 수 있죠.
- 겉보기엔 무관해 보이는 주기들을 기어로 연결해, 상호작용을 드러냅니다.
이제, 행성과 위성이 아니라 다음과 같은 것들로 구성된 오러리를 상상해봅시다.
- 서비스와 마이크로서비스
- 서드파티(3rd‑party) 의존성
- 네트워크 세그먼트와 리전(region)
- 공격 벡터와 장애 모드
- 인시던트 대응팀과 플레이북
궤도와 합(Conjunction) 대신, 우리는 다음과 같은 것들을 봅니다.
- 장애가 정기 점검(maintenance window)과 겹치는 순간
- 새로운 공격이, 이미 알려진 취약점과 겹치는 상황
- 리전 단위 클라우드 인시던트가 트래픽 피크 타임과 충돌하는 순간
물리적인, 아날로그 스토리 컴퍼스 오러리 데스크는 다음을 가능하게 하는 도구입니다.
- 장애가 어떻게 전파되는지에 대한 팀의 멘탈 모델을 외부로 끄집어내기
- 추상적인 위험 다이어그램을 손으로 만질 수 있는 공유 아티팩트로 바꾸기
- 손잡이를 돌려 시간을 흘려보내며, 여러 위험이 한 줄로 정렬될 때 무슨 일이 일어나는지 관찰하기
분산 시스템의 장애: 언제가 아니라 어떻게의 문제
분산 시스템은 일정한 패턴으로 망가집니다. 대표적인 장애 모델은 다음과 같습니다.
- 부분 실패(Partial failure): 일부 컴포넌트는 죽거나 느려지지만, 다른 부분은 멀쩡하게 동작하는 상태
- 네트워크 파티션(Network partition): 시스템 일부가 서로 통신을 잃지만, 로컬에서는 계속 작동하는 상태
- 비잔틴 실패(Byzantine failure): 컴포넌트가 불규칙하게 혹은 악의적으로 동작하는 상태(예: 침해된 노드)
- 타이밍/레이턴시 이슈: 시스템은 논리적으로는 “살아” 있지만, 너무 느려서 쓸 수 없는 상태
- 연쇄 장애(Cascading failure): 작은 오류가 재시도, 타임아웃, 리소스 고갈을 거치며 대규모 붕괴로 이어지는 상태
우리는 보통 이를 문서로 정리합니다. 아키텍처 다이어그램, 리스크 매트릭스, 의존성 그래프 등이죠. 다 유용하지만 평면적인 표현입니다.
오러리 스타일의 모델을 사용하면 다음을 할 수 있습니다.
- 각 장애 모델을 행성(planet), 위성(moon), 궤도(orbit) 로 표현
- 시스템 간의 의존성, 결합도를 중력(gravity)처럼 표현
- “소규모 네트워크 파티션 + 재시도 폭풍(retry storm) + 트래픽 급증” 같은 합(conjunction) 이 어떻게 실제 인시던트로 변하는지 탐색
핵심은 완벽한 정확성이 아닙니다. 핵심은 다음 목표입니다.
팀에게, 장애가 어떻게 상호작용하는지에 대한 공유되고 조작 가능한 모델을 제공하는 것.
스토리 컴퍼스 오러리 데스크: 종이로 만든 시나리오 우주
당신의 시스템을 위한 ‘내러티브 오러리’처럼 작동하는 물리적 데스크 셋업을 상상해보세요.
- 시스템, 리전, 팀, 핵심 외부 의존성을 나타낸 큰 베이스 맵
- 서로 다른 종류의 위험(예: 인프라, 애플리케이션 버그, 휴먼 에러, 벤더, 자연재해, 사이버 공격)을 나타내는 종이 디스크나 링
- 시간 범위(예: 시간, 일, 주, 분기) 혹은 심각도 에스컬레이션 레벨을 나타내는 동심원 궤도
- 아래와 같은 구체적 시나리오가 적힌 토큰(행성): “S3 리전 장애”, “공유 드라이브 랜섬웨어 감염”, “DNS 오설정”, “새 기능 롤백 실패”, “결제 서비스 레이트 리밋(rate‑limit)”, “오피스 정전” 등
여기에 실제 손잡이(크랭크, crank) 를 더합니다.
- 손잡이를 돌리면 “인시던트 시간”이 앞으로 나아갑니다.
- 각 디스크는 서로 다른 속도로 돌아가며 발생 가능성, 주기, 선행 지표(leading indicator) 를 상징합니다.
- 디스크가 돌아가다 특정 토큰 둘 이상이 겹쳐지면, 그 순간이 바로 합(conjunction) 이벤트, 즉 테이블탑 인시던트의 시작점입니다.
이 물리적인 움직임이 중요한 이유는 다음과 같습니다.
- 사람은 자신이 손으로 움직인 것을 잘 기억합니다.
- 어떤 장애도 고립되어 있지 않고, 궤도가 서로 교차한다는 것을 눈으로 보게 됩니다.
- 시간, 의존성, 우연이 모두 합쳐져 인시던트를 만든다는 사실을 몸으로 느끼게 합니다.
장애 모델을 어떻게 물리적 오러리에 매핑할까
오러리는 실제 당신 조직과 시스템의 작동 방식에 맞게 설계할 수 있습니다. 예를 들어:
1. 인프라 궤도(Infra Orbit)
- 행성: 데이터센터 장애, 리전 전체 손실, 네트워크 파티션, 스토리지 성능 저하
- 위성: 백업 실패, 용량 고갈, 잘못 설정된 오토스케일링
2. 애플리케이션 & 데이터 궤도
- 행성: 잘못된 스키마 마이그레이션, 캐시 스탬피드, 떼로 몰리는 요청(Thundering herd), 데드락
- 위성: 오남용된 피처 플래그, 잘못된 폴백 로직
3. 사람 & 프로세스 궤도
- 행성: 온콜 피로(on‑call fatigue), 잘못 라우팅된 알람, 느린 에스컬레이션, 충돌하는 런북
- 위성: 첫 단독 온콜에 투입된 신입, 섀도우 IT, 즉흥 패치
4. 외부 & 환경 궤도
- 행성: 주요 클라우드 제공자 인시던트, 핵심 벤더 장애, 공급망(Supply chain) 공격
- 위성: 자연재해, 오피스 폐쇄, 인터넷 백본(backbone) 이슈
5. 위협 궤도(보안)
- 행성: 피싱 캠페인, 크리덴셜 스터핑(credential stuffing), 랜섬웨어, 내부자 위협
- 위성: 노출된 관리자 패널, 패치되지 않은 서비스, 잘못 구성된 IAM
각 궤도는 다음과 같이 서로 다르게 회전할 수 있습니다.
- 다른 속도: 얼마나 자주 발생하거나 떠오르는 위험인지
- 다른 위상(phase): 계절성 트래픽, 컴플라이언스 감사 시기, 마케팅 캠페인 시점 등
세션을 진행할 때는 다음과 같이 합니다.
- 크랭크를 돌립니다.
- 겹치는 토큰을 확인합니다.
- 그 합(conjunction)을 인시던트 시드 시나리오(seed scenario) 로 사용합니다.
테이블탑 연습을 손으로 돌리는 내러티브로 만들기
전통적인 테이블탑(tabletop) 연습만으로도 이미 엄청난 가치를 얻을 수 있습니다.
- 사이버 보안 인시던트 시뮬레이션
- 자연재해 / 비즈니스 연속성(BCP) 워크스루
- 클라우드 제공자나 ISP 장애 대응 훈련
- 내부자 위협이나 데이터 유출 롤플레이
사람들을 한자리에 모으고, 시나리오를 제시하고, “지금 무엇을 하시겠습니까?”라고 묻고, 타임라인을 진행시키는 식이죠.
오러리 데스크는 이런 연습을 눈으로 보고 손으로 조작할 수 있는 이야기로 바꿔줍니다.
단계별: 오러리 기반 테이블탑 진행 방법
-
컨텍스트 설정
- 이번 세션에 사용할 궤도와 토큰을 고릅니다.
- 각 궤도와 토큰이 무엇을 의미하는지 간단히 공유합니다.
-
우주를 가동하기
- 손잡이를 몇 번 돌립니다.
- 첫 번째 의미 있는 합(conjunction)을 찾습니다. (예: “트래픽 피크 주간” + “DNS 오설정” + “새로 온 SRE 온콜”)
- 이 시점을 T0: 인시던트 감지 시점으로 선언합니다.
-
시간을 이산적인 단계로 진행하기
- 크랭크 한 번을 15분, 1시간, 또는 하루 등으로 정합니다.
- 매 단계마다 조건 변화를 읽습니다. 새로운 위험이 겹치거나, 일부는 해소됩니다.
- 묻습니다. 지금 우리가 아는 것은? 지금 무엇을 해야 하는가? 누가 관여해야 하는가?
-
연쇄 영향 추적하기
- 실, 마커, 인덱스 카드 등을 사용해 베이스 맵 위에 영향 경로를 그립니다.
- 어느 팀이 과부하인지, 어떤 SLA가 깨졌는지, 어떤 고객이 영향을 받는지를 표현합니다.
-
취약 지점 포착하기
- 어디서 “누가 소유자인지”를 두고 논쟁이 생겼나요?
- 어떤 시점에 “어떤 툴이나 런북을 써야 할지”가 불분명했나요?
- 어떤 수동 프로세스가 지나치게 오래 걸렸나요?
-
맵을 펼쳐둔 채로 디브리핑하기
- 모두가 책상 주변에 모여 이 종이 우주에 주석을 달며 논의합니다.
- 깨달음을 구체적인 액션 아이템으로 바꿉니다. 새 런북, 교육, 아키텍처 변경, 정책 수정 등으로 이어지게 합니다.
왜 또 하나의 디지털 다이어그램보다 아날로그 도구인가
물론, 이 모든 것을 정교한 디지털 툴로 모델링할 수도 있습니다. 실제로 많은 팀이 그렇게 합니다. 하지만 아날로그, 물리적 도구에는 분명한 장점이 있습니다.
-
손에 잡히면 기억에 남는다
토큰을 직접 옮기고, 손잡이 저항을 느끼고, 두 토큰이 부딪히는 장면을 눈으로 보는 경험은 추상적인 위험 개념을 물리적 경험으로 고정시켜 줍니다. -
집중의 공유
큰 종이 맵과 오러리는 모두의 시선을 한 지점으로 모읍니다. 각자 자기 브라우저 탭 속으로 사라지지 않습니다. 사람들은 가리키고, 제스처를 쓰고, 토론하며 그 과정에서 공유 멘탈 모델을 만들어갑니다. -
낮은 마찰, 높은 적응성
연필로 새로운 서비스를 스케치하고, 새로운 위험 토큰을 테이프로 붙이고, 궤도 라벨을 즉석에서 바꿀 수 있습니다. 권한 설정도, 라이선스도 필요 없습니다. 종이, 펜, 상상력만 있으면 됩니다. -
심리적 안전감
아날로그 도구는 평가나 감사보다는 놀이에 더 가깝게 느껴집니다. 그래서 “여긴 구멍이 있어요”, “이건 사실 누가 책임지는지 모르겠어요” 같은 솔직한 대화가 더 잘 나옵니다. -
다양한 분야의 참여 유도
비기술 직군도 책상 앞으로 나와 함께 참여할 수 있습니다. 마이크로서비스 그래프는 이해하기 어려울 수 있지만, 궤도와 충돌, 스토리는 누구나 직관적으로 이해합니다.
나만의 인시던트 스토리 오러리 만들기
반짝이는 황동 장치를 주문 제작할 필요는 없습니다. (물론 있다면 멋지긴 하겠죠.) 다음만 있으면 시작할 수 있습니다.
- 큰 종이(또는 화이트보드 테이블)
- 원형 템플릿이나 오래된 보드게임의 다이얼 부품
- 인덱스 카드, 포스트잇, 실, 마커
- 간단한 골판지/나무 손잡이 메커니즘, 혹은 그냥 “링을 같이 돌리자”라는 구두 합의
그다음 단계는 다음과 같습니다.
- 핵심 시스템, 의존성, 팀을 목록으로 정리합니다.
- 대표적인 장애 모드와 위협을 식별합니다.
- 유형이나 레이어(인프라, 앱, 사람, 외부, 위협)에 따라 궤도에 배치합니다.
- 각 시나리오에 대한 물리적 토큰을 만듭니다.
- 크랭크 한 번당 시간 단위를 정의합니다.
- 이 종이 우주를 hand‑crank(손으로 돌려) 보는 테이블탑 세션을 정기적으로 스케줄합니다.
시간이 지나면, 당신의 오러리 데스크는 조직이 위험을 어떻게 바라보는지, 그리고 그 관점이 어떻게 변해 왔는지를 보여주는 살아 있는 기록이 됩니다.
결론: 현실이 크랭크를 돌리기 전에 우리가 먼저 돌리기
안티키테라 메커니즘은 하늘을 통제하지 않았습니다. 대신, 하늘을 예측했습니다. 압도적으로 복잡해 보이던 밤하늘을, 사람들이 보고, 만지고, 이해할 수 있는 것으로 바꾸었습니다.
우리의 시스템, 그리고 그 시스템이 직면한 위험도 그에 못지않게 복잡합니다.
아날로그 인시던트 스토리 컴퍼스 오러리 데스크는 팀에게 다음을 할 수 있는 방법을 제공합니다.
- 장애가 필연적이라는 사실을 받아들이기
- 그 장애들이 어떻게 서로 충돌할 수 있는지 모델링하고 시각화하기
- 구조화된 테이블탑 연습을 통해 대응을 연습하기
- 프로덕션, 규제 기관, 공격자가 그 약점을 발견하기 전에 우리가 먼저 발견하기
손으로 종이 우주를 돌려보는 것은, 조직에 아주 귀한 능력을 선물합니다. “아무 일도 일어나지 않을 것”이라는 약속이 아니라, 무슨 일이 일어나더라도 함께 항해할 수 있는 연습된, 공유된 역량입니다.