Rain Lag

아날로그 인시던트 꼭두각시 무대: 종이 캐릭터로 최악의 온콜 대화를 리허설하는 법

종이 캐릭터를 활용한 로우파이 테이블탑 연습으로, 팀이 실제 장애 전에 위험한 온콜 대화를 안전하게 연습하고, 인시던트 인수인계 품질을 높이며, 대응 계획의 빈틈을 미리 발견하는 방법을 소개합니다.

아날로그 인시던트 꼭두각시 무대: 종이 캐릭터로 최악의 온콜 대화를 리허설하는 법

온콜 근무를 마치고 나서 *“이번엔 운이 좋았지, 다음엔 진짜 크게 터질 수도 있겠다”*라는 생각을 해본 적이 있다면, 당신만 그런 게 아닙니다. 대부분의 팀은 위기 상황에서 인수인계가 끊기거나, 맥락이 사라지거나, 인시던트 커맨드가 혼란스러웠던 “전쟁 이야기”를 하나쯤 갖고 있습니다.

하지만 팀이 실제 장애를 겪을 때까지 기다리면서, 그때 가서야 어떻게 말하고, 어떻게 조율하고, 어떻게 책임을 넘길지를 시험해볼 필요는 없습니다. 이건 미리 연습할 수 있습니다. 값싸고, 안전하고, 심지어 약간은 재미있게요.

그 역할을 하는 것이 바로 아날로그 인시던트 꼭두각시 무대입니다.

종이 캐릭터(혹은 진짜 인형)를 활용한 테이블탑 연습은, 팀이 실제 상황이 벌어지기 전에 최악의 온콜 대화를 저위험 환경에서 연습해 볼 수 있게 해 줍니다.


테이블탑 연습이란 무엇이며, 온콜 담당자가 왜 신경 써야 할까?

**테이블탑 연습(tabletop exercise)**은 팀이 한 자리에 앉아 가상의 비상 상황이나 인시던트 시나리오에 대해 “어떻게 대응할지 말로만” 풀어 가는, 비용과 부담이 모두 낮은 시뮬레이션입니다. 실제 시스템은 위험에 노출되지 않고, 진짜 알람도 울리지 않습니다. 시나리오, 몇 가지 프롬프트, 그리고 사람들이 “무엇을 할지” 말로 설명하는 것만 있을 뿐입니다.

풀스케일 기술 게임데이(game day)나 카오스 엔지니어링 실험과 달리, 테이블탑 연습이 집중하는 것은 다음과 같습니다.

  • 의사결정: 누가 무엇을 결정하는가? 언제 에스컬레이션하는가? 어느 수준이면 배포를 유지하거나 롤백해도 “충분히 괜찮다”고 보는가?
  • 커뮤니케이션: 누가 고객과 이야기하는가? 누가 Slack에서 말하는가? 누가 인시던트 타임라인을 작성하는가?
  • 부서 간 조율: 시간이 촉박할 때, 엔지니어링·지원·프로덕트·리더십은 어떻게 정렬된 상태를 유지하는가?

이는 일종의 리허설 공간입니다. CPU나 페일오버를 테스트하는 게 아니라, 압박 속에서 사람들이 어떻게 협업하고 조율하는지를 테스트하는 거죠.

온콜 팀에게 이런 연습은 금광과도 같습니다. 실제 인시던트에서 문제가 되는 것의 대부분은, 빠진 스크립트나 깨진 대시보드가 아니라, 놓친 메시지, 불명확한 역할, 그리고 말해지지 않은 전제들입니다.


왜 온콜 대화를 굳이 연습해야 할까?

온콜은 본질적으로 기술 작업을 감싸고 있는 커뮤니케이션 업무입니다. 아무리 뛰어난 엔지니어라도 다음과 같은 순간에는 충분히 힘들어할 수 있습니다.

  • 새벽 2시에 이뤄지는 교대 인수인계에서, 근무를 마치는 엔지니어가 중요한 서비스를 겨우 버티게 해 주고 있는 “임시 핵(hack)” 이야기를 빼먹고 넘어가는 경우
  • 인시던트 브리지(incident bridge)에서 세 명 모두가 누군가 다른 사람이 고객 지원팀과 이야기하고 있다고 가정하는 경우
  • 대규모 장애가 터져 리더십은 답을 요구하는데, 온콜 담당자는 페이징, 디버깅, 메시지 전송을 동시에 처리하느라 정신이 없는 경우

이런 대화를 미리 연습해 두면 다음과 같은 효과가 있습니다.

  • 실제 인수인계 과정에서 맥락이 떨어져 나갈 위험을 줄이고
  • 역할이 훨씬 더 분명해집니다: 누가 무엇을 책임지고, 누가 언제 말해야 하는지
  • “잘 모르겠다”라고 인정하거나, 비현실적인 요구에 단호하게 선을 긋는 순간 같은 어려운 상황에 대한 근육 기억을 쌓고
  • 새로운 커뮤니케이션 프로토콜을 안전하게 시험해 보고, 손에 어떻게 느껴지는지 체험할 수 있습니다.

이걸 위해 실험실이나 전용 시뮬레이터가 필요한 건 아닙니다. 테이블 하나, 종이 몇 장, 그리고 조금 장난감처럼 놀아 볼 마음가짐이면 충분합니다.


꼭두각시 무대: 왜 로우파이 도구가 그렇게 잘 먹히는가

인시던트 상황의 사람들을 종이 캐릭터, 인덱스 카드, 종이 상자로 만든 “무대” 같은 걸로 표현하는 게 다소 우스꽝스럽게 들릴 수 있습니다. 바로 그 점 때문에 이 방법이 잘 작동합니다.

이런 저해상도(로우파이) 도구―즉, 종이 꼭두각시―는 다음과 같은 장점이 있습니다.

  • 감정적인 부담을 낮춥니다. 진짜 CTO를 마주 보고 말하는 대신, 종이로 만든 “CTO”를 이리저리 옮기며 대화를 연습하는 편이 훨씬 쉽습니다.
  • 역할이 눈에 보입니다. 각 캐릭터에 이름, 역할, 인시던트 중 주요 책임을 적어 둘 수 있습니다. “인시던트 커맨더” 카드가 테이블에서 사라지면, 그 사실이 정말 눈에 확 들어옵니다.
  • 참여를 이끕니다. 게임처럼 느껴지기 때문에, 평소 조용한 팀원들도 입을 열고 참여하기 쉬워집니다.
  • 툴이 아닌 대화에 초점을 맞춥니다. 멋진 인시던트 관리 플랫폼 뒤에 숨을 수 없습니다. 남는 건 오직 사람들이 무엇을 말하고, 무엇을 결정하고, 무엇을 넘기는지뿐입니다.

이 방식은 의도적으로 아날로그합니다. 이 어설프고 지저분한 부분이 결함이 아니라, 오히려 핵심적인 특징입니다.


아날로그 인시던트 꼭두각시 무대 준비하기

처음부터 거창하게 시작할 필요는 없습니다. 온콜과 인수인계에 초점을 맞춘 종이 기반 테이블탑 연습을 설계하는 한 가지 예시를 소개합니다.

1. 시나리오 정의하기

그럴듯하지만 팀에게 꽤 불편할 만한 인시던트를 하나 고릅니다. 예를 들면:

  • “대형 고객 웨비나 시작 10분 전, 크리티컬 API 레이턴시가 치솟는다.”
  • “결제 서비스가 소수의 고객에게 결제를 이중 청구하기 시작한다.”
  • “긴 연휴 동안 데이터 파이프라인이 조용히 멈춰 서 버린다.”

상황을 이해하는 데 필요한 기본적인 정보만 적당히 정리합니다. 더 자세한 정보는 연습을 진행하면서 단계적으로 공개합니다.

2. 종이 캐릭터 만들기

인덱스 카드나 포스트잇에 다음과 같은 캐릭터들을 만듭니다.

  • 온콜 엔지니어 (primary on-call)
  • 세컨더리 온콜
  • 인시던트 커맨더(Incident Commander)
  • 지원(고객지원) 리드
  • SRE / 플랫폼 엔지니어
  • 프로덕트 매니저
  • 고객 커뮤니케이션 / 마케팅 담당
  • 듀티 매니저 / 리더십(경영진)

각 카드에는 다음 내용을 적습니다.

  • 이름 (실제 이름이든 가명이든 상관 없음)
  • 역할(Role)
  • 인시던트 중 주요 책임

이 카드들을 테이블 위에 늘어놓고, 작은 출연자 목록(cast list)처럼 둡니다.

3. 커뮤니케이션 채널 맵 만들기

별도의 카드나 테이블 영역을 사용해, 다음과 같은 채널들을 표현합니다.

  • 인시던트 Slack 룸
  • 온콜 페이징 시스템
  • 상태 페이지 / 대외 공지
  • 내부 이메일 / 리더십 업데이트

이걸 통해 정보가 어디로 흘러가야 하고, 누가 무엇을 볼 수 있는지 눈으로 확인할 수 있습니다.

4. 라운드 단위로 인시던트 진행하기

연습은 시간으로 잘라낸 여러 “라운드”로 진행합니다. 각 라운드는 실제 인시던트 시간으로 10–20분 정도를 나타내도록 설정합니다.

각 라운드마다 다음을 수행합니다.

  1. 퍼실리테이터가 새로운 정보를 공개합니다. (예: “에러율이 두 배로 증가했다.”, “고객 지원팀에 화난 티켓이 들어오기 시작한다.”)
  2. 팀이 논의합니다: 누가 행동하는가? 누가 커뮤니케이션하는가? 무엇을 말하는가? 어디에 말하는가?
  3. 종이 캐릭터들을 사용하는 채널 쪽으로 옮깁니다. 예를 들어, “온콜 엔지니어” 카드를 “인시던트 Slack 룸” 영역으로 올려둡니다.
  4. 실제 대화를 나누듯, 역할 간에 어떤 말이 오가는지 소리 내어 서술하고 연기합니다.

또한 캐릭터를 움직이거나 말을 대신하는 사람을 라운드마다 바꿔 가며, 팀원 모두가 참여하게 만들 수 있습니다.

5. 인수인계와 교대(시프트 변경) 시뮬레이션하기

온콜 실무에 초점을 맞추고 싶다면, 다음과 같은 제약 조건을 추가합니다.

  • “지금은 온콜 교대 5분 전이다.”
  • “인시던트가 주말까지 이어진다. 금요일 온콜이 주말 온콜에게 넘겨줘야 한다.”

퇴근하는 온콜 캐릭터와 새로 들어오는 온콜 캐릭터가 다음을 수행하게 합니다.

  • 현재 상태를 함께 리뷰한다.
  • 아직 모르는 것들이 무엇인지 명확히 한다.
  • 이후 누가 무엇을 책임질지 확인한다.

그 다음에는 강제로 인수인계를 종료합니다. 즉, 퇴근하는 온콜 캐릭터 카드를 테이블에서 치웁니다. 이때 명확히 넘기지 못한 맥락은 그냥 사라진 것으로 간주합니다.

이 지점에서 빈틈이 얼마나 뼈아프게 드러나는지, 직접 느끼게 될 것입니다. 그게 바로 이 연습의 목적입니다.


대시보드로는 보이지 않는 것들을 드러내는 연습

단 한 번의 아날로그 테이블탑 연습만으로도, 인시던트 프로세스에 대한 불편한 진실들이 드러날 수 있습니다. 예를 들면:

  • 불명확한 소유권: 여러 사람이 자신이 인시던트 커맨더가 아니라고 생각하고 있어서, 결국 아무도 그 역할을 하지 않는 상황
  • 깨진 정보 흐름: 지원팀이 내부 채널이 아니라, 트위터를 통해 인시던트를 처음 알게 되는 상황
  • 부실한 인수인계 구조: 퇴근하는 온콜이 “오늘 조용했어요”라고 말하지만, 사실은 알람 하나를 꺼 둔 상태라는 사실은 언급하지 않는 경우
  • 역할 혼선: 엔지니어가 명확하게 소통하지 않자, 프로덕트 매니저가 기술적인 방향까지 지시하기 시작하는 경우

이 모든 일이 저위험 시뮬레이션에서 드러난다는 것은 실패가 아니라 큰 성공입니다. 실제 다리가 개통되기 전에 균열을 발견한 것과 같은 셈이니까요.


배운 것을 바탕으로 더 나은 온콜 인수인계 설계하기

테이블탑 연습의 핵심 가치는, 거기서 얻은 인사이트를 구조화된 온콜 인수인계 프로세스로 바꾸는 데 있습니다. 탄탄한 인수인계는 보통 다음 요소를 포함합니다.

  • 문서화(Documention)

    • 교대 동안 계속 업데이트되는 가볍고 공유된 핸드오프 문서나 런북(runbook)
    • 진행 중인 인시던트, 부분적인 완화책, 리스크 높은 영역에 대한 링크와 메모
  • 오버랩(교대 겹침) 시간

    • 퇴근하는 온콜과 새로 들어오는 온콜이 동시에 접속해 있는 몇 분간의 시간
    • “괜찮아요”라는 말로 끝내지 않고, 질문을 하기 위해 명시적으로 확보된 시간
  • 명확한 커뮤니케이션 프로토콜

    • 표준 질문들: “지금 뭐가 깨져 있나요? 뭐가 취약하죠? 뭐가 시끄러운(노이즈가 큰) 상태인가요?”
    • 알람, 에스컬레이션, 리더십 업데이트에 사용할 합의된 채널
  • 검증(Verification) 단계

    • 새 온콜이 페이징을 제대로 받을 수 있는지 직접 확인
    • 현재 활성화된 알람이나 성능 저하 중인 서비스에 대한 빠른 리뷰

이 모든 요소를 꼭두각시 무대 연습 속에서 시험하고 다듬을 수 있습니다.

예를 들어, 두 가지 버전의 인수인계를 비교해 볼 수 있습니다.

  1. 완전히 비구조적인 방식: “오늘 근무 어땠어요?”
  2. 체크리스트 기반 구조화 방식: “열린 인시던트, 적용된 완화책, 꺼 둔 알람, 불안정한 서비스 순으로 짚어 주세요.”

두 버전을 테이블 위에서 모두 연기해 보고, 인수인계 이후에 얼마나 많은 맥락이 보존되는지를 눈으로 확인해 보세요. 차이는 생각보다 훨씬 극적일 때가 많습니다.


효과적인 아날로그 인시던트 세션을 위한 팁

종이 기반 테이블탑 연습에서 최대한 많은 것을 얻어 내려면, 다음을 참고하세요.

  • 짧고 집중되게 진행합니다. 60–90분 정도, 하나의 시나리오, 하나의 핵심 학습 목표(예: 교대 인수인계)에만 집중합니다.
  • 크로스 펑셔널 인원을 초대합니다. 온콜은 엔지니어링만의 일이 아닙니다. 가능하면 지원, 프로덕트, 커뮤니케이션 담당도 함께 부르세요.
  • 불완전함을 정상으로 만듭니다. 이 연습의 목적은 사람들이 실력을 ‘보여주는’ 것이 아니라, 빈틈을 찾아내는 것임을 분명히 합니다.
  • 인사이트를 실시간으로 기록합니다. 모두가 볼 수 있는 보드나 문서에 “우리를 헷갈리게 했던 것들”과 “도움이 되었던 것들”을 목록으로 남깁니다.
  • 마지막에 구체적인 액션 아이템으로 마무리합니다. 발견한 문제를 런북 업데이트, 인수인계 스크립트 개선, 역할 정의 조정 등으로 이어지게 합니다.

이 연습의 목적은 연극을 위한 연극을 만드는 게 아닙니다. 이 “연극”은 문제를 부인할 수 없을 정도로 선명하게 드러내고, 결국 고칠 수 있게 하기 위해 존재합니다.


결론: 아프기 전에, 어려운 것들을 미리 연습하라

인시던트는 언제나 스트레스가 따를 것입니다. 하지만 반드시 혼돈이어야 할 필요는 없습니다.

아날로그 인시던트 꼭두각시 무대―종이 캐릭터 몇 장, 간단한 시나리오 하나, 그리고 테이블 하나만 있으면―를 활용하면 다음과 같은 일을 할 수 있습니다.

  • 최악의 온콜 대화를 실제 상황이 되기 전에 리허설하고
  • 인시던트 커뮤니케이션과 인수인계의 빈틈을 안전한 환경에서 드러내며
  • 문서화, 교대 오버랩, 검증을 위한 구조화된 프로세스를 강화하고
  • 평소 함께 연습할 기회가 거의 없는 여러 팀 간의 자신감과 명료함을 쌓을 수 있습니다.

새로운 툴 도입 승인이나 거창한 프로그램 예산이 필요하지도 않습니다. 사무실 비품만으로, 다음 주에도 첫 세션을 열 수 있습니다.

작게 시작하세요. 하나의 불편한 시나리오, 하나의 온콜 인수인계를 골라 꼭두각시 무대 위에 올려 보세요. 그 저위험 리허설에서 얻은 인사이트가, 실제 인시던트가 닥쳤을 때 **“운이 좋았다”**와 “우리는 준비돼 있었다” 사이를 가르는 차이가 될지도 모릅니다.

아날로그 인시던트 꼭두각시 무대: 종이 캐릭터로 최악의 온콜 대화를 리허설하는 법 | Rain Lag