로우테크 테이블탑 ‘아날로그 인시던트’로 장애와 보안 사고를 연극처럼 리허설하면서, 진짜 위기가 오기 전에 기술 역량, 공감, 복원력을 키우는 방법.
저기압 기술과 걸어서 들르는 ‘신뢰성 길거리 마켓’을 통해, SRE 포스트모템과 장애 스토리를 조직 전체가 함께 배우는 공개 학습 의식으로 바꾸는 방법.
손으로 그리는 ‘신뢰성 스트리트 맵’이 추상적인 시스템 위험을 모두가 공유할 수 있는 시각적 언어로 바꾸어, 더 나은 기술·비즈니스 의사결정을 이끌어내는 방법을 소개합니다.
‘시계장치 복도(Clockwork Corridor)’라는 은유를 통해 현대 인시던트 관리 방식을 살펴봅니다. 과거 신뢰성 데이터, SLO, 실시간 데이터, 그리고 긴밀히 통합된 툴이 어떻게 수많은 아슬아슬한 순간들을 미리 포착해 내일의 뉴스 헤드라인을 막아주는지 알아보세요.
단순한 ‘종이 인시던트 스토리’ 서랍이 어떻게 아슬아슬한 상황을 포착하고, 반복 작업을 줄이며, 실제 장애로 번지기 전에 인시던트 관리 관행을 지속적으로 개선하게 만드는 강력한 팀 의식이 될 수 있는지 살펴봅니다.
기차역 관점, 종이 시각표, 그래프 기반 위험 분석을 활용해 인시던트 대비 태세를 근본적으로 개선하고, 다음 장애 러시아워를 살아남는 방법을 다룹니다.
손으로 그리는 간단한 ‘리스크 파도차트’만으로 흩어진 인시던트 신호들을 하나의 시각적인 리스크 스토리로 엮어, 다음 장애로 터지기 전에 ‘위험이 차오르는 모습’을 함께 볼 수 있다.
단순한 종이 템플릿 하나가 얼마나 혼란스러운 운영 장애 상황을 명확하고 구조화된 스토리로 바꿔, 더 나은 포스트모템과 더 신뢰할 수 있는 시스템으로 이어지게 해 줄 수 있는지에 대해 이야기합니다.
단순하고 손에 잡히는 ‘종이 도구’와 테이블탑 연습이 어떻게 추상적인 장애 대응 계획을 실제적이고 저스트레스로 만들고, 대규모 장애를 맞는 엔지니어링 팀에 근육 기억(머슬 메모리)을 심어줄 수 있는지에 대해 이야기합니다.
아날로그·로우테크 스토리 실천을 통해 팀 간 ‘다리’를 미리 구축하여, 더 나은 장애 대응, 더 풍부한 포스트모템, 그리고 더 탄탄한 사회기술적 시스템을 만드는 방법.