책상 위에 올려두는 간단한 아날로그 철도식 출발 안내판이, 여기저기 흩어진 약한 신호와 ‘거의 사고 날 뻔한’ 사례들을 한눈에 보이는 추적 가능한 리스크로 바꾸어, 작은 일탈이 대형 운영 사고로 번지기 전에 팀이 개입할 수 있게 해 주는 방법을 소개합니다.
장애를 살아 있는 ‘스토리 라이브러리’로 바꾸는 방법 — 종이책 같은 감각의 아날로그 지식을 움직이는 선반처럼 연결해, 장애 복구를 더 빠르게, 재발 방지를 더 쉽게, 온보딩을 더 강력하게 만드는 방법.
가상의 벽면 초대형 아날로그 미로 ‘열차조차 미로(Trainyard Labyrinth)’를 걸어 다니듯 체험하며, 전력 계통 같은 복잡한 시스템에서 연쇄 장애가 어떻게 발생하는지, 그리고 모니터링·시뮬레이션·스마트한 개입이 어떻게 대정전을 막아 주는지 알아본다.
MTTR 같은 추상적인 숫자 대신, 아날로그 스타일의 ‘시간의 벽’을 통해 장애가 실제로 어떻게 전개되는지, 그리고 장애 대응 프로세스가 정확히 어디에서 무너지는지를 생생한 공통 스토리로 시각화하는 방법을 다룹니다.
책상 위에 올려두는 접이식 디오라마라는 은유로 인시던트 대응을 다시 설계해 본다: 이해관계자 정렬, 커뮤니케이션 명료화, 오픈소스 도구를 활용해 장애를 여러 각도에서 동시에 바라보는 방법.
저기술 T-카드 ‘카고 포트’로 온콜 혼란을 눈에 보이는, 관리 가능한 작업 흐름으로 바꾸는 방법과, 이를 현실적인 용량(캐퍼시티) 계획에 연결하는 방법을 다룹니다.
탈선하기 전에 추상적인 운영 리스크를 명확하고 공유 가능한 실행 스토리로 바꿔 주는, 아날로그와 디지털이 만나는 벽면 크기 인시던트 보드—“등대 철도” 신호 시스템을 설계하는 방법.
3D 종이 컨트롤 타워 돔이 추상적인 인시던트 조정을 어떻게 눈에 보이는 ‘공유 공역(airspace)’으로 바꿔, 온콜 팀의 상황 인식, 교육, 스토리텔링을 향상시키는지 소개합니다.
모든 장애를 하나의 이야기로, 모든 이야기를 시스템 개선으로, 그리고 모든 개선을 다음 배포를 조용히 지키는 수호자로 바꾸는 법—인시던트 회고, 구조화된 아카이브, 데이터 기반 신뢰성 실천으로 구현하는 방법.
강력한 물리적 데이터 모델링을 기반으로 한 ‘기차 세트’ 스타일의 물리적 메타포가, 팀이 현대 이벤트 중심·마이크로서비스 아키텍처의 실제 런타임 동작을 이해·시각화·디버깅하는 데 어떻게 도움이 되는지 설명합니다.