관측되지 않은 ‘아차’ 순간들이야말로 가장 가치 있는 신뢰성 데이터인 이유, 대시보드가 왜 이를 계속 놓치는지, 그리고 생성형 AI가 실제 장애로 번지기 전에 시스템 속에 숨어 있는 이야기들을 어떻게 끌어낼 수 있는지에 대해 다룹니다.
단순한 종이 미로가 어떻게 사고 대응 훈련을 바꾸고, 숨겨진 의존성과 취약한 가정, 그리고 실제 실패 경로를 위기가 오기 훨씬 전에 드러내는지 살펴봅니다.
인덱스 카드 ‘엽서’ 거치대 하나로 신뢰성 실패를 흥미로운 이야기, 매일 하는 학습 의식, 그리고 지연 시간·가용성의 복리 개선으로 바꾸는 방법.
드릴, 포스트모템, 실패 분석을 손에 잡히는 공유 신뢰성 실천으로 전환하는 방법—아날로그 도구와 의도적인 스토리텔링을 통해 인시던트를 ‘그 순간’ 이후까지 의미 있게 남기는 법.
복잡한 인시던트 대시보드를 물리적인 ‘종이 회로 워룸’으로 대체하면, 인지적 과부하를 줄이고, 책임 구도를 명확히 하며, 고위험 인시던트 상황에서 협업을 개선할 수 있는 방법을 다룹니다.
왜 인시던트 리뷰는 늘 건조하게 느껴질까? 그리고 어떻게 "아날로그 인시던트 스토리 캐비닛 오브 에코스"를 통해 장애 동안 팀이 실제로 겪는 복잡하고 인간적인 경험을 담아내어, 진짜로 배움이 일어나게 할 수 있을까에 대한 이야기.
저기술 도구와 단순한 의식만으로도, 화려한 소프트웨어나 복잡한 프로세스 없이 인시던트 리뷰를 사람 중심·스토리 중심의 신뢰성 실천으로 바꾸는 방법.
교대 근무 환경에서 인시던트 대응을 릴레이 경주처럼 설계해, 팀이 교대 시점마다 ‘리스크 바통’을 맥락·모멘텀·신뢰를 잃지 않고 넘기는 방법을 다룹니다.
벽과 실, 그리고 종이 로그만으로 시스템 속 숨겨진 의존성을 드러내고, 장애 대응을 더 빠르고 더 똑똑하게 만드는 방법에 대해 이야기합니다.
프로덕션을 건드리지 않고도 팀이 안전하게 장애를 시뮬레이션하고, 사회기술적 실패를 탐색하며, 실제 사고 전에 회복탄력성을 연습할 수 있게 해주는 ‘저위험 아날로그 실패 데스크’를 설계하는 방법을 소개합니다.