아날로그 인시던트 스토리 글로브: 시스템의 숨은 장애 지대를 비춰주는 3D 종이 세계 만들기
단순한 3D 종이 지구본 하나로, 건조한 선형 인시던트 리포트를 협업 중심의 공간적 탐색으로 바꾸고, 시스템 속에 숨은 장애 지대와 리스크 핫스팟을 드러내는 방법을 소개합니다.
소개
대부분의 팀은 인시던트를 스프레드시트의 한 줄이나 슬라이드의 글머리 기호 정도로 취급합니다. 우리는 그것들을 정렬하고, 필터링하고, 색깔을 입히지만… 결국 평면적인 목록일 뿐입니다. 문제는 복잡한 시스템이 목록처럼 행동하지 않는다는 데 있습니다. 실제로 시스템은 서로 뒤엉킨 세계처럼 움직입니다. 장애는 예상치 못한 곳에 모여서 나타나고, 구성 요소 간에 직관적이지 않은 방식으로 파급됩니다.
여기서 등장하는 것이 바로 **아날로그 인시던트 스토리 글로브(Analog Incident Story Globe)**입니다. 시스템을 지구본처럼 3차원으로 표현하고, 그 위에 인시던트와 숨은 장애 지대를 직접 매핑해볼 수 있는 3D 종이 모델입니다.
또 하나의 대시보드를 멍하니 바라보는 대신, 팀은 종이 지구본을 둘러싸고 서서 마커를 붙이고, 선을 긋고, 리스크가 모여 있는 지점이 마치 행성의 운석 충돌 자국처럼 드러나는 것을 함께 지켜봅니다. 낮은 기술 수준, 손으로 만지는 감각, 그런데 의외로 강력합니다.
이 글에서는 인시던트 스토리 글로브가 무엇인지, 어떻게 만들고 사용하는지, 그리고 이런 아날로그 산출물이 인시던트 분석, SRE 포스트모템, 장기적인 신뢰성 작업을 어떻게 실질적으로 개선할 수 있는지 살펴봅니다.
아날로그 인시던트 스토리 글로브란 무엇인가?
아날로그 인시던트 스토리 글로브는 당신의 시스템 리스크 지형을 나타내는 물리적인 3D 모델입니다.
- 보통 인쇄된 조각을 조립해서 만드는 종이 지구본 형태입니다. (DIY 종이 지구본 만들기와 비슷한 방식)
- 지구본의 각 표면 영역은 아키텍처나 인프라의 한 구역을 의미합니다. 예: 서비스, 도메인, 데이터 플로우, 플랫폼, 환경 등
- 위치 마커(스티커, 점, 실, 펜 등)를 사용해 인시던트, 의존 관계, 잠재적 장애 지대를 표현합니다.
당신의 시스템으로 이루어진 하나의 행성을 만든 뒤, 과거 장애, 근접 사고(near-miss), 이미 알고 있는 약점들을 그 표면 위에 표시한다고 생각해보세요. 시간이 지날수록 이 지구본은 시스템이 어디서 자주 망가지는지, 그리고 그럴 때 무엇이 위험에 처하는지를 보여주는 살아 있는 3D 지도 역할을 하게 됩니다.
왜 인시던트를 ‘공간’으로 만들어야 할까?
우리는 보통 장애를 선형 문서 형태로 기록합니다.
- 인시던트 트래커
- 포스트모템 문서
- Jira 티켓 또는 유사한 이슈 관리 시스템
이런 도구들은 책임 추적과 검색에는 유용하지만, 눈앞에 있는 패턴을 숨겨 버리곤 합니다. 인시던트가 테이블의 행으로만 존재할 때, 다음과 같은 클러스터를 ‘몸으로’ 느끼기 어렵습니다.
- 특정 서비스나 서브시스템 주변
- 깨지기 쉬운 통합 지점이나 데이터 파이프라인
- 공통 인프라 레이어(예: 인증, 네트워킹, 스토리지)
반면 지구본은:
- 공간적 사고를 촉진합니다. 어디에 인시던트가 몰려 있고, 어디가 텅 비어 있는지 한눈에 볼 수 있습니다.
- 관계와 거리감을 눈에 보이게 만듭니다. 지구본 위의 경로나 선은 데이터 플로우, 의존 체인, 블라스트 레디어스(영향 반경)를 나타낼 수 있습니다.
- 숨은 장애 지대를 드러냅니다. “아직 인시던트는 없지만, 한번 터지면 치명적일 곳” 같은 불편한 영역들입니다.
아날로그 형태라는 점도 중요합니다. 모두가 함께 서서, 같은 산출물을 손가락으로 가리키며 이야기할 때 다음과 같은 효과를 얻습니다.
- 모두가 공유하는 구체적이고 물리적인 기준점
- 비전문가도 “어디에서 무슨 일이 벌어지는지” 직관적으로 이해할 수 있는, 더 포용적인 대화
- 비난 중심이 아니라 학습 중심으로 이어지는, 느리고 성찰적인 대화 속도
스토리 글로브 만들기
특별한 장비는 필요 없습니다. 기본적인 사무용품만으로도 인시던트 스토리 글로브를 만들 수 있습니다.
1. 지구본 만들기 또는 인쇄하기
다음과 같은 옵션이 있습니다.
- 인쇄용 종이 지구본 템플릿 (예: “paper globe net”, “geodesic paper globe template”로 검색)
- 빈 지구본 키트 또는 어린이용 공작 지구본
- 스티로폼 또는 골판지 구체 위에 종이 조각을 붙이는 방식
팀이 함께 작업할 수 있도록 여럿이 둘러싸고 보기 좋은 크기를 추천합니다. 배구공 정도 크기가 적당합니다.
2. “지형” 정의하기
지구본 표면이 시스템의 어떤 요소를 나타낼지 결정합니다. 몇 가지 패턴 예시는 다음과 같습니다.
- 대륙 = 주요 도메인
예: 고객 경험, 내부 도구, 데이터 플랫폼, 인프라스트럭처 - 위도/경도 = 레이어
예: 북쪽은 사용자 지향 앱, 남쪽은 인프라, 적도는 공용 플랫폼 - 시간대 = 환경
예: 프로덕션(Prod), 스테이징, 개발(Dev), 실험(Experiments)
완벽할 필요는 없습니다. 중요한 건 일관성입니다. 각 영역이 아키텍처의 어디에 대응되는지 설명하는 범례(legend)를 하나 만들어 두세요.
3. 마커(표시 방법) 정하기
단순하고 분명한 시각 언어를 사용하는 것이 좋습니다.
- 색깔이 다른 점 스티커로 인시던트 표시
(예: 빨강 = Sev1, 주황 = Sev2 등 심각도 표현) - 삼각형 스티커나 다른 색으로 near-miss(근접 사고) 표시
- 선이나 실로 의존 관계나 데이터 플로우 표현
- 음영 처리된 영역으로 고위험 구역이나 알려진 기술 부채(tech debt) 표시
지구본 근처에 작은 키(key)를 붙여 두세요. 처음 보는 사람도 한눈에 읽을 수 있어야 합니다.
운석 충돌처럼 인시던트 찍어 보기
이제 지구본 준비가 끝났다면, 인시던트를 매핑하기 시작할 수 있습니다.
인시던트를 배치하는 방법
각 인시던트(또는 포스트모템)마다 다음 단계를 따라 진행합니다.
-
주요 영향 구역 식별
장애가 어디에서 드러났는지 정의합니다.
예: 결제 API, 인증 서비스, 데이터 수집 파이프라인 등 -
진입 지점 표시
인시던트가 처음 “떨어진” 지점을 점으로 표시합니다.
운석 충돌 지점처럼 생각하면 됩니다. -
블라스트 레디어스(영향 반경) 그리기
어떤 컴포넌트들이 다음 단계로 영향을 받았는지 선이나 호(arc)로 표시합니다. -
심각도와 리스크 표시
점의 색, 크기, 라벨 등을 활용해 심각도, 고객 영향, 금전적 리스크를 표현합니다. -
컨텍스트 추가
작은 포스트잇이나 인덱스 카드에 다음을 적습니다.- 날짜
- 짧은 요약
- 근본 원인 / 기여 요인
- 핵심 학습 내용 또는 개선 테마
이 카드를 지구본 주변이나 인접한 보드에 배치하고, 인시던트 ID 같은 간단한 식별자로 연결해 둡니다.
무엇이 보이기 시작하는가
인시던트 몇 개만 매핑해도 종종 다음과 같은 패턴이 드러납니다.
- 밀집 클러스터: 같은 서브시스템이나 통합 지점에서 반복되는 고통
- 교차 지점: 여러 의존 선이 만나는 곳 (공유 리스크가 집중된 구역)
- 조용하지만 치명적인 영역: 인시던트는 적지만, 한 번 터지면 매우 위험한 구역
(대개 모니터링이나 테스트가 부족한 구역일 때가 많습니다.)
이런 패턴은 스프레드시트에서는 놓치기 쉽지만, 지구본에서는 매우 명확하게 보입니다.
리스크 프로파일링 도구로서의 지구본
스토리 글로브는 단순한 회고용 장난감이 아니라, 리스크 프로파일링을 돕는 손에 잡히는 도구입니다.
다음과 같은 질문을 던질 때 활용할 수 있습니다.
- 새로운 장애가 발생한다면, 어디에서 터지는 것이 가장 비용이 많이 들까?
- 어느 영역이 장애 시 규제·컴플라이언스 문제를 촉발할 수 있을까?
- 잠재적 영향에 비해 방어가 부족한 곳은 어디인가?
(예: 이중화, 가시성(observability), 런북이 부족한 구역)
이 정보를 지구본 위에 레이어처럼 덧입힐 수 있습니다.
- 굵은 외곽선으로 규제 리스크가 높은 영역을 두르기
- 해칭(hatching)이나 음영 처리로 만성적인 기술 부채가 있는 시스템 영역 표시
- **별(star)이나 깃발(flag)**로 내년/다음 분기 레질리언스 개선 타깃 영역 표시
이렇게 하면 지구본은 단순히 “과거 인시던트가 있었던 곳”을 넘어, 다음 큰 장애가 어디에서 발생할 가능성이 크고, 어디에서 가장 파괴적일지 보여주는 3D 리스크 지도가 됩니다.
블레임리스 포스트모템과 함께 쓰기
스토리 글로브는 블레임리스(blameless) SRE 스타일 포스트모템과 매우 잘 어울립니다.
“누가 온콜이었나?”, “뭐가 깨졌나?” 같은 질문으로 시작하는 대신, 이렇게 시작합니다.
“이번 이야기는 우리 세계의 어디에서 벌어졌나요?”
실제로 적용하는 방법은 다음과 같습니다.
-
포스트모템 회의 중에
- 한 사람이 지구본 옆에 서서, 회의에서 나오는 이야기를 실시간으로 매핑합니다.
- 진입 지점
- 장애가 확산된 경로
- 완화/복구가 진행된 경로
- 참석자들이 관련된 영역을 직접 가리키며 논의하게 합니다.
- 한 사람이 지구본 옆에 서서, 회의에서 나오는 이야기를 실시간으로 매핑합니다.
-
포스트모템 이후에
- 최종 마커를 정리하고, 리스크 음영이나 주석을 업데이트합니다.
- 인시던트 마커에 포스트모템 링크나 ID를 연결해 둡니다.
이 방식은 인시던트를 사람이 실패한 사건이 아니라, 시스템 전체에서 전개되는 이야기로 재구성합니다. 지구본은 다음을 돕는 공동의 스토리 장치가 됩니다.
- 시스템 사고를 강화하고,
- 심리적 안전감을 높입니다. (문제는 “사람”이 아니라 지구본 위 특정 영역에 존재합니다.)
- 학습을 시각적이고 협업적인 활동으로 만듭니다.
인시던트 목록에서 살아 있는 아티팩트로
몇 달, 또는 분기가 지나면 인시던트 스토리 글로브는 단순한 공작물이 아니라, 시스템의 다음을 담은 살아 있는 아티팩트가 됩니다.
- 인시던트 히스토리
- 아키텍처 핫스팟
- 리스크 집중 구역
- 신뢰성 개선의 발자취
이 아티팩트를 다음과 같이 활용할 수 있습니다.
-
로드맵 논의에 활용
“이 영역이 Sev1 인시던트 밀도가 가장 높은 곳입니다. 다음 분기에 여기에는 어떤 투자를 할 수 있을까요?” -
시간에 따른 변화 리뷰
- 분기마다 사진을 찍어 패턴을 비교합니다.
- 클러스터가 줄어드는지, 이동하는지, 혹은 늘어나는지 추적합니다.
-
신규 팀원 온보딩
- 지구본을 함께 보며 “이 시스템은 주로 여기서 아파 왔다”를 설명할 수 있습니다.
-
이해관계자 정렬(alignment)
- 리더십에게 “왜 레질리언스 작업이 중요한지”를 직관적인 시각 자료로 보여줄 수 있습니다.
지구본이 기존 인시던트 툴을 대체하는 것은 아닙니다. 다만, 보이지 않던 패턴을 눈에 보이고, 손에 잡히고, 함께 공유할 수 있도록 보완해 줍니다.
나만의 스토리 글로브 시작하기
팀과 함께 이 실험을 해보고 싶다면, 다음 순서로 진행해 보세요.
-
시간 상자를 정한다
60–90분 정도 워크숍을 잡아, 첫 버전을 함께 만들고 주석을 달아 봅니다. -
스코프를 정한다
최근 3–6개월 동안의 프로덕션 인시던트부터 시작합니다. -
매핑 규칙을 정의한다
영역, 색깔, 선이 무엇을 의미하는지 모두 합의합니다. -
함께 인시던트를 매핑한다
엔지니어, SRE, 프로덕트, 고객 지원 등 다양한 역할을 초대합니다. -
마무리는 리플렉션으로
다음 질문을 던져 봅니다.
“우리를 놀라게 한 패턴은 무엇인가?”
“앞으로 더 탐구하거나 바꿔야 할 것은 무엇인가?”
지구본은 눈에 잘 띄는 공용 공간에 두세요. 인시던트 리뷰나 포스트모템 의식을 진행할 때마다 업데이트하는 루틴을 만드는 것이 좋습니다.
결론
아날로그 인시던트 스토리 글로브는 겉으로 보면 단순합니다. 종이, 펜, 약간의 실 정도가 전부입니다. 하지만 시스템을 하나의 3D 세계로, 인시던트를 그 표면에 남은 충돌 자국으로 표현함으로써, 공간적이고 시스템적이며 공동의 관점에서 생각하도록 유도합니다.
이제 인시던트를 고립된 문제로 처리하고 잊어버리는 대신, 지구본을 통해 다음과 같은 일을 할 수 있습니다.
- 클러스터와 숨은 장애 지대를 발견하고,
- 리스크와 비용이 실제로 시스템의 어디에 존재하는지 프로파일링하며,
- 포스트모템을 더 블레임리스하고, 협업적이며, 시각적인 활동으로 만들고,
- 시간이 지날수록 신뢰성과 레질리언스 작업을 이끌어줄 살아 있는 아티팩트를 구축합니다.
디지털 대시보드가 넘쳐나는 시대에, 단순한 아날로그 지구본 하나가 실패로부터 학습하고 시스템이 살아가는 세계(월드)를 다시 설계하는 데 있어 가장 강력한 도구 중 하나가 될 수 있습니다.