단순한 물리적 카드 월이 어떻게 인시던트 스트림을 살아 있는, 모두가 공유하는 ‘리스크 레이더’로 바꿔 주어 온콜 문화·협업·학습을 강화하면서도 기존 디지털 도구를 대체하지 않고 보완하는지 소개합니다.
장애 포스트모템을 눈에 보이는 연간 ‘스토리 캘린더’로 바꿔, 배운 교훈을 살아 있게 만들고, 신뢰성을 높이며, 같은 유형의 장애 재발을 막는 방법을 소개합니다.
종이로 만든 물리적 ‘스토리 가든 패스’ 산책로를 이용해 연극처럼 인시던트를 리허설하고, 대응 프로세스를 프로토타이핑하며, 실제 장애 전에 팀을 준비시키는 방법을 다룹니다.
프로덕션 인시던트를 아날로그 스토리보드 코믹스로 바꿔서, 포스트모템을 더 잘하고, 근본 원인 분석을 날카롭게 만들고, 새 도구나 대시보드 없이도 팀이 더 빨리 배우도록 돕는 방법을 소개합니다.
타로 카드 스타일의 ‘운명 카드’를 활용해 장애 대응 연습을 협업적이고, 부담 낮고, 재미있는 게임으로 바꾸어 역량, 심리적 안전감, 그리고 시스템 회복탄력성을 높이는 방법을 소개합니다.
장난스럽지만 진지한 ‘이상 징후 밤하늘’을 물리적으로 만들어 관측 가능성을 깊게 하고, 디버깅 근육을 키우며, 특히 복잡하고 규제가 많은 도메인에서 팀의 공유 시스템 직관을 쌓는 방법.
되풀이되는 버그를 팀이 반복해서 연습하고 해결할 수 있는 구조화된 ‘레벨’로 바꾸는 방법—인시던트 리포트, 게임화, AI 네이티브 툴을 결합해 개발자가 스스로 들어가서 플레이하고 싶어 하는 디버깅 아케이드를 만드는 법을 다룹니다.
단순한 아날로그 엽서 진열대와 메타포 중심의 시각화를 활용해, 쉽게 잊히는 장애 포스트모템 문서를 팀이 함께 공유하는 ‘살아있는 학습 기억 시스템’으로 바꾸는 방법을 소개합니다.
옛 아이디어인 물리적 샌드 테이블이 어떻게 현대 엔지니어링 팀이 복잡한 시스템에서 연쇄 장애를 이해하고 예방하는 데 도움이 될 수 있는지 살펴봅니다.
고통스러운 장애조차도 모두 구조화된 회고, 탄탄한 온콜 운영, 그리고 AWS·Cloudflare·Facebook 같은 대형 서비스 장애에서 얻은 인사이트를 활용해 조직 학습의 ‘장애 퀼트’ 속 작은 패치로 바꾸는 방법을 소개합니다.