아날로그 인시던트 스토리 카고 포트: 종이 도크야드로 온콜 업무를 진짜로 ‘하역’하기
저기술 T-카드 ‘카고 포트’로 온콜 혼란을 눈에 보이는, 관리 가능한 작업 흐름으로 바꾸는 방법과, 이를 현실적인 용량(캐퍼시티) 계획에 연결하는 방법을 다룹니다.
아날로그 인시던트 스토리 카고 포트: 종이 도크야드로 온콜 업무를 진짜로 ‘하역’하기
현대 팀들은 수많은 대시보드 속에서 허우적대면서도, 정작 이런 기본적인 질문에는 답을 잘 못 합니다.
- 지금 누가, 무엇에 대해, 온콜을 맡고 있는가?
- 무엇이 진행 중인가? 무엇이 막혔는가?
- 다음으로 중요한 작업을 어디에 안전하게 ‘하역’할 수 있는가?
이 지점에서, 거의 잊혀진 아날로그 도구 하나가 조용히 판을 바꿀 수 있습니다. 바로 **T-카드(T-Card)**입니다.
인시던트 커맨드 시스템(ICS)에서 T-카드(ICS 219)는 리소스의 실시간 상태를 추적하는 데 쓰입니다. 누가 어디서, 무엇을, 어떤 상태로 하고 있는지를 보여주는 것이죠. 비상 상황용 물리적 칸반 카드라고 생각하면 됩니다. 이제 그 동일한 원리를 온콜·트리아지 업무에 가져와서, 들어오는 일이 실제로 ‘하역’되는 **종이 기반의 카고 포트(“cargo port”)**를 설계해 보세요. 일이 눈에 보이고, 예측 가능하며, 실제 용량에 맞게 처리되는 곳입니다.
이 글에서는 그 아날로그 도크야드를 어떻게 설계하는지, 디지털 도구와는 어떻게 보완 관계를 맺는지, 그리고 스프린트 플래닝 같은 현실적인 캐퍼시티 플래닝에 어떻게 연결하는지까지 살펴봅니다. 팀이 단순히 일을 “처리”하는 수준을 넘어, 일을 안전하게 처리할 수 있도록 돕기 위해서입니다.
디지털 세상에 웬 아날로그 도크야드인가?
처음 들으면 종이 시스템은 다소 구식이거나 후퇴처럼 느껴질 수 있습니다. 하지만 T-카드 같은 아날로그 도구는, 특히 압박이 큰 상황에서 분명한 장점이 있습니다.
-
즉시 보이는 가시성
중앙에 놓인 물리적 T-카드 랙은 곧 즉각적으로 한눈에 보이는 라이브 대시보드가 됩니다. 누가 바쁜지, 무엇이 막혔는지, 남은 여유 용량이 어디에 있는지 바로 보입니다. -
낮은 인지 부하
로그인도, 메뉴도, 모달 창도 없습니다. 고압적인 인시던트나 트리아지 폭풍 한가운데서도, 카드를 2초 안에 옮길 수 있고, 그 변화는 모두에게 곧장 공유됩니다. -
디지털이 실패해도 버티는 복원력
장애, 네트워크 문제, 툴 과부하가 와도 물리 보드는 그대로 작동합니다. 말 그대로 여러분의 ‘레이어 0’ 운영 뷰입니다. -
공유된 상황 인식(Situational Awareness)
모두가 실제로 같은 보드 앞에 서 있으면, 일에 대한 공통의 정신 모델이 생깁니다. 이로 인해 핸드오프 마찰, 빠진 컨텍스트, 중복 작업이 줄어듭니다.
아날로그는 디지털을 대체하지 않습니다. 오히려 디지털을 앵커(anchor) 해 줍니다. T-카드 보드는 온콜·트리아지 모델의 물리적 프론트엔드에 가깝습니다.
T-카드 소개: 일을 담는 아날로그 컨테이너
ICS에서는 T-카드로 리소스(사람, 차량, 팀)와 그 상태를 추적합니다. 지식 노동 환경에서 우리의 “리소스”는 보통 사람이고, “카고(화물)”는 작업 단위입니다.
각 T-카드는 작은, 구조화된 스토리가 됩니다.
-
이 카드는 누구에 대한 것인가?
- 개인: "온콜 엔지니어 – 백엔드"
- 역할: "트리아지 리드", "인시던트 커맨더"
- 워크스트림: "데이터베이스 트리아지 큐"
-
지금 무엇을 하고 있는가?
- Free / Available (비어 있음 / 가용)
- Busy / Handling incident (바쁨 / 인시던트 처리 중)
- In handoff / Awaiting review (핸드오프 중 / 검토 대기)
-
어디에 있는가?
- 온콜 보드
- 에스컬레이션 랙
- 복구 / 포스트 인시던트 영역
또한 개별 작업 단위(예: 인시던트, 지원 티켓, 트리아지 태스크)마다 별도의 T-카드를 만들어, 랙을 통해 시스템 안에서 어떻게 이동하는지 보여줄 수도 있습니다.
여기서 핵심 설계 선택지는, 카드가 주로 사람/리소스를 나타내게 할지, 아니면 작업/카고를 나타내게 할지입니다. “카고 포트” 메타포를 쓸 때는 보통 아래 구성이 가장 잘 맞습니다.
- 한 색상의 T-카드는 사람/역할용 (배/선박 역할)
- 다른 색상의 T-카드는 작업 아이템용 (컨테이너 역할)
이렇게 하면 벽 전체가 살아 있는 배가 입항·접안하고, 화물을 싣고 내리고, 출항하는 모델이 됩니다.
종이 도크야드 설계하기: 핵심 레이아웃
벽이나 화이트보드를 하나의 카고 포트 다이어그램으로 생각해 보세요. 즉시 답하고 싶은 두 가지 질문이 있습니다.
- 지금 어디에 더 많은 작업을 안전하게 하역할 수 있는가?
- 어떤 것들이 배(사람)가 항구를 떠나는 것을 막고 있는가?
여기 바로 시작할 수 있는 간단한 레이아웃이 있습니다.
1. 입항 구역(Arrival Bay): 들어오는 작업
새로운, 아직 트리아지되지 않은 모든 항목을 위한 컬럼입니다.
-
컬럼 예:
- New / Untriaged (새로 도착 / 미트리아지)
- Sifted / Needs owner (1차 분류 완료 / 담당자 필요)
-
카드: 작업 T-카드 전용
- 주요 필드: ID, 유형(버그/인시던트/요청), 심각도, 접수 시각
여기는 원(raw) 인입 큐입니다. 한눈에 다음을 볼 수 있어야 합니다.
- 얼마나 많은 작업이 대기 중인지
- 각 항목이 얼마나 오랫동안 대기했는지
2. 도크사이드(Dockside): 온콜·트리아지 용량
여기는 온콜, 트리아지 담당자들이 T-카드 형태로 위치하는 곳입니다.
-
행(스윔레인): 각 역할별
- 1차 온콜(Primary)
- 2차 온콜(Secondary)
- 트리아지 리드
- 인시던트 커맨더(활성 시)
-
컬럼: 용량 상태
- Available (가용 – 새 작업 가능)
- At capacity (용량 꽉 참 – 더 이상 불가)
- Overloaded (과부하 – 너무 많은 인시던트 처리 중)
각 사람의 T-카드를 현재 상태에 맞는 컬럼에 둡니다. Available에 있는 자리가 곧 카고를 하역할 수 있는 빈 도크입니다.
3. 작업 접안 구역(Work Berths): 활성 인시던트·태스크
이제 카고(작업) 자체를 위한 접안 구역을 만듭니다.
- 컬럼 예:
- In triage (트리아지 중)
- Under investigation (원인 분석 중)
- Fix in progress (수정 작업 중)
- Waiting on external team (외부 팀 대기)
- Resolved / Monitoring (해결 / 모니터링 중)
각 작업 T-카드는 상황 변화에 따라 왼쪽에서 오른쪽으로 이동합니다. 필요하다면 각 작업 카드에 **‘배’ 카드(리소스 카드)**를 연결하세요.
- 현재 담당자의 리소스 T-카드를 해당 작업 카드 옆이나 아래에 붙입니다.
- 소유권이 바뀔 때마다, 리소스 카드를 새로운 작업 접안 구역으로 직접 옮기세요. 핸드오프가 물리적으로 드러납니다.
4. 출항 레인(Departure Lane): 완료 및 학습
작업이 진짜로 끝났다면, 활성 포트에서 나가야 합니다.
- 컬럼 예:
- Completed this cycle (이번 사이클 내 완료)
- Needs post-incident review (포스트 인시던트 리뷰 필요)
- Documented / Lessons captured (문서화 / 교훈 정리 완료)
이렇게 하면 포트는 라이브 트래픽만을 위한 공간으로 유지되고, 여전히 학습·후속 조치가 필요한 작업도 표면 위로 올릴 수 있습니다.
온콜을 ‘제대로’ 작동시키기: 카고를 배와 매칭하기
온콜·트리아지 모델이 실패하는 경우는, 개념이 나빠서라기보다 로컬 현실 때문에인 경우가 많습니다.
- 같은 사람에게 너무 많은 상충하는 요구가 몰리는 경우
- 팀 간 핸드오프가 불분명한 경우
- 실제로 누가 사용 가능한지에 대한 공유된 뷰가 없는 경우
모델을 바꾸기 전에, 먼저 현장의 **장애물(Barriers)과 촉진 요인(Facilitators)**을 이해하는 데 시간을 쓰세요.
-
Barriers(장애물):
- 온콜 작업이 항상 프로젝트 작업에 의해 끊기는가?
- 일부 팀이 트리아지 프로세스를 무시하고 ‘자기들이 좋아하는 엔지니어’에게 바로 가는가?
- 리더십이 용량 한계를 인정하지 않은 채, 인시던트 때마다 ‘히어로 모드’를 기대하는가?
-
Facilitators(촉진 요인):
- 이미 자연스러운 “트리아지 허브”(예: 슬랙 도움 채널)가 있고, 이를 공식화할 수 있는가?
- 보드를 함께 보는 데 쓸 수 있는 데일리 스탠드업, 운영 리뷰 문화가 있는가?
T-카드 보드를 사용해 이런 현실을 숨기지 말고 드러내세요. 예를 들어 보드에 다음이 반복해서 나타난다면:
- 특정 역할에 반복적으로 과부하가 걸리는 패턴
- 트리아지를 건너뛰고 직접 들어오는 작업
- 담당자 없이 쌓여가는 인시던트
…이제 프로세스를 개선하기 위한, 구체적이고 눈에 보이는 증거가 생긴 것입니다.
도크야드와 캐퍼시티 플래닝 연결하기
눈에 보이는 도크야드는 강력하지만, 이를 스프린트, 주 단위 계획, 온콜 로테이션 같은 정기적인 캐퍼시티 플래닝과 연결할 때 비로소 진가를 발휘합니다.
1. 단순한 캐퍼시티 모델부터 시작하기
각 온콜 기간 또는 스프린트마다 다음을 추정해 보세요.
-
팀의 총 가용 시간
(예: 5명 × 집중 근무 30시간 = 150시간) -
온콜·트리아지에 예약해 둘 용량
(히스토리컬 데이터 기반: 예를 들어 주당 평균 인터럽트 30시간)
그러면 남는 시간은 프로젝트(계획된) 작업에 쓸 수 있는 시간입니다.
예시:
- 총 150시간
- 온콜·인터럽트 용 30시간 예약
- 스프린트 계획 작업에 120시간 사용 가능
이제 도크야드를 이용해, 이 가정이 실제와 맞는지 실시간으로 검증합니다.
2. 보드를 살아 있는 용량 계기판으로 쓰기
스프린트나 온콜 로테이션 기간 동안 다음을 추적합니다.
- 온콜 담당자가 Overloaded 컬럼에 있는 빈도는 어느 정도인가?
- Waiting on external team에 멈춰 있는 작업 카드는 얼마나 되는가?
- 사람들이 프로젝트 작업에서 끌려 나와, 예기치 못한 카고를 처리하는 시간이 얼마나 되는가?
몇 사이클을 거치면, 실제 상황과 초기 계획을 비교할 수 있습니다.
- 온콜 레인이 대부분의 날에 과부하였다면, 인터럽트 용량을 과소 추정한 것입니다.
- 반대로 온콜 쪽에 한가한 시간이 많이 보인다면, 용량을 너무 많이 과잉 예약했을 수 있습니다.
이런 촘촘한 피드백 루프 덕분에, **감(guess)**이 아니라 **증거(evidence)**를 바탕으로 캐퍼시티 숫자를 조정할 수 있습니다.
3. 시각적 증거를 계획 입력값으로 바꾸기
플래닝 세션에 물리적 보드를 그대로 가져오세요.
- 지난 주나 지난 스프린트 동안 보드 사진을 찍어 패턴을 보여줍니다.
- 각 레인을 통해 흘러간 작업 아이템 수를 셉니다.
- 배(사람)가 용량 한계나 과부하 상태였던 빈도를 기록합니다.
이 데이터를 사용해 다음과 같은 질문에 답합니다.
- 주당 실제로 필요한 온콜 시프트 수는 얼마인가?
- 피크 시간대에 전담 트리아지 역할이 필요한가?
- 다음 스프린트에서 인터럽트용 버퍼를 얼마나 잡아야 하는가?
많은 팀이 10–30% 정도의 명시적인 인터럽트 버퍼를 추가로 두기만 해도, 온콜이 훨씬 덜 혼란스럽게 느껴지면서도 프로젝트 속도는 충분히 유지된다는 것을 발견합니다.
실천 팁: 완벽함보다 ‘최소 기능 도크야드’부터
완벽한 설계로 시작할 필요는 없습니다. 목표는 **최소 기능 도크야드(MVD: Minimum Viable Dockyard)**입니다.
-
기본 T-카드 랙을 사거나 만들어라
없으면 인덱스 카드 + 마스킹 테이프, 화이트보드만으로도 충분합니다. -
사람·작업 각각 3–5개 정도의 단순한 상태 컬럼 정의
나중에 언제든 개선할 수 있으니, 처음에는 단순하게 시작하세요. -
2–4주 동안 디지털 툴과 병행 운영
티켓 시스템은 계속해서 ‘싱글 소스 오브 트루스(단일 진실 원천)’로 두고, 보드는 운영상의 프론트엔드로 사용합니다. -
매일 보드를 리뷰하라
스탠드업이나 운영 리뷰에서 보드를 실제로 업데이트하고, 과부하, 흐름 상의 문제를 함께 봅니다. -
마찰을 기준으로 설계를 조정하라
아무도 카드를 안 움직인다면, 설계가 너무 복잡한 겁니다. 최소한의 노력으로 현실을 반영할 수 있을 때까지 간소화하세요.
결론: ‘포트’가 아니라 ‘쌓임’이 되어선 안 된다
온콜과 트리아지의 목적은 가용성을 높이고, 희소한 전문성을 더 잘 활용하기 위한 것입니다. 그러나 현실에서는 종종 보이지 않고, 경계도 없는 스트레스의 흐름이 되어 버립니다.
단순한 아날로그 T-카드 도크야드는 팀에 다음을 제공합니다.
- 누가 무엇을 하고 있는지에 대한 공유된 실시간 그림
- 일이 입항하고, 접안하고, 처리되고, 출항하는 물리적 장소
- 캐퍼시티 플래닝과 온콜 설계를 개선하기 위한 구체적 데이터
다시 말해, 인시던트와 인터럽트가 해안에 난파선처럼 밀려들어 오는 것이 아니라, 실제로 하역되고, 흐르고, 떠나가는 스토리 카고 포트를 만드는 것입니다.
더 많은 대시보드를 추가할 필요는 없습니다. 필요한 것은 더 명확한 포트입니다. 종이부터 시작하세요. 일이 눈에 보이게 하세요. 그리고 거기서 배운 것을 바탕으로, 팀이 ‘버티는’ 수준이 아니라 지속 가능하게 운영할 수 있는 온콜 모델을 설계하세요.