하나의 고통스러운 장애를 여러 이해관계자의 관점을 회전시키는 “관람차” 활동으로 바꿔, 공감을 키우고 반복 가능한 학습 의식(ritual)로 만드는 방법.
스마트 시스템이 실패할 때, 가장 먼저 사라지는 것은 깨지기 쉬운 단서와 사람들의 이야기다. 이 글은 인시던트를 ‘역 보관함 벽’—수많은 작은 아날로그 아티팩트와 살아 있는 내러티브가 들어 있는 격자—처럼 다루는 방식이 어떻게 팀이 장애를 이해하고, 기억하고, 대응하는 방식을 근본적으로 바꿀 수 있는지 살펴본다.
산만한 현실 incident 대응을 벽 전체를 쓰는 아날로그 ‘종이 런북’으로 시각화해, 실제로 무슨 일이 일어나는지 드러내고, 프로세스의 빈틈을 밝혀내며, 더 나은 디지털 런북과 더 빠른 복구로 이어지게 만드는 방법을 소개합니다.
장난스러운 ‘골판지 플라네타리움’ 은유를 통해, 어떻게 작은 국지적 실패가 거대한 장애로 연쇄 붕괴하는지, 왜 시뮬레이션과 모델이 자주 거짓말을 하는지, 그리고 실패 물리학 관점, 의존성 시각화, 더 나은 알림 설계가 시스템을 종이로 만든 트램웨이처럼 무너지는 것에서 어떻게 지켜줄 수 있는지를 살펴본다.
실제와 가까운 고가치 인시던트 대응 테이블탑 연습을 설계해 커뮤니케이션의 빈틈을 드러내고, 장애 플레이북을 검증하며, 팀을 실제 위기에 대비시키는 방법.
약한 신호와 근접 사고를 시스템을 가로지르는 골판지 관측 트램처럼 다루면, 보안·복원력·엔지니어링 문화를 어떻게 바꿀 수 있는지에 대해 이야기합니다.
키보드 없이도 테이블 위 “스토리 조차장”을 이용해 복잡한 장애를 시뮬레이션하고, 인시던트 대응을 리허설하며, 분산 시스템에 대한 직관을 깊게 쌓는 방법을 소개합니다.
종이 체크리스트, 인덱스 카드, 로우테크 의식이 어떻게 클라우드 인시던트 대응을 더 신뢰할 수 있고, 더 인간적이며, 도구에만 의존하는 것보다 놀랍도록 더 효과적으로 만들어 주는지에 대해 다룹니다.
저기술(로우테크) 방식의 ‘실패 도면’과 가볍고 비난 없는 인시던트 리뷰 프로세스를 사용해, 장애로부터 진짜로 학습하는 온콜 문화로 조용히 리모델링하는 방법을 소개합니다.
종이 비행기, 시각 은유, 사람 중심 포스트모템을 통해 인시던트 대응을 ‘탓하기 위한 소방훈련’이 아니라 ‘시스템 수준의 학습 엔진’으로 바꾸는 방법.