엉킨 장애 포스트모템을 시스템 장애, 실패 탐지, 서킷 브레이커 동작을 한눈에 보여주는 지하철식 종이 노선도로 시각화하는 방법을 소개합니다.
아날로그 ‘리듬 보드’와 타임박스 기반 워크플로가 어떻게 난장판 같은 장애 대응을 탐지부터 완전 복구까지 이어지는 구조화된 인시던트 여정으로 바꿔줄 수 있는지 살펴봅니다.
현대 디지털 인시던트 관리 흐름을 반영하면서도 아날로그 도구를 적극 활용해, 복잡한 장애 상황에서 대응자들을 단계별로 안내하는 ‘스토리 기반 물리 파일링 시스템’을 구축하는 방법을 다룹니다.
추상적인 보안 리스크를, 팀이 한눈에 읽고 매일의 의사결정을 가장 위험한 일 쪽으로 살짝 밀어주는 책상 크기의 아날로그 ‘리스크 풍경’으로 바꾸는 방법.
장애를 열차 시간표처럼 시각화해 팀, 임원, 온콜 담당자가 무엇이 언제 왜 일어났는지를 한눈에 파악하는 방법.
아날로그 인시던트 스토리 라이트하우스 시계가 디지털 인시던트 데이터를 ‘시간·리스크·신호’의 차분한 물리적 시각화로 바꾸어, 전통적인 리스크 도구를 비판하면서도 ‘조용한 경고(quiet warnings)’ 철학을 어떻게 구현하는지 살펴봅니다.
과거 장애를 재사용 가능한 내러티브로 바꿔 재발 방지 라이브러리로 축적하고, DevSecOps 플레이북을 강화하며, 조직을 ‘소방 모드’에서 ‘학습 조직’으로 전환시키는 인시던트 스토리 캐러셀(incident story carousel) 라이브러리를 설계하는 방법.
사고 관리, 블레이멀리스 SRE식 사후 분석(postmortem), 칸반 시각화를 결합해, 작은 직장 내 사고들이 커다란 파도가 되기 전에 종이 위의 ‘얕은 shoreline’에서 안전하게 소멸하도록 돕는 ‘아날로그 리스크 조수 웅덩이’를 만드는 방법을 소개합니다.
물리적인 종이 기반 ‘트레인야드’ 시스템으로 온콜 인시던트를 트리아지하고, 인지 부하를 관리하며, 경쟁하는 우선순위를 눈에 잘 보이고 다루기 쉽게 만드는 방법을 다룹니다.
철도 안전, 형식 기법, AI 기반 라우팅에서 얻은 교훈을 바탕으로, 작은 장애가 서로 충돌해 대형 인시던트로 번지기 전에 전환·완화하는 ‘인시던트 스위칭 스테이션’으로 인시던트 프로세스를 설계하는 법을 다룹니다.