아날로그 인시던트 스토리 카드 카탈로그: 실패를 ‘직접 넘겨볼 수 있는’ 시스템으로 분류하기
프로덕션 인시던트와 실패를 팀이 실제로 찾아보고, 패턴을 발견하고, 시간이 지날수록 시스템을 개선하는 데 쓰는 ‘물리적 카드 카탈로그’로 바꾸는 방법을 소개합니다.
소개
대부분의 팀은 겉으로는 “실패로부터 배우고 싶다”고 말합니다. 인시던트 리뷰를 하고, 포스트모템을 쓰고, 링크를 공유합니다. 그러고 나면 그 기록들은 Confluence, Google Drive, 혹은 아무도 다시 열어보지 않는 인시던트 관리 도구 속으로 사라집니다.
보이지 않는 것에서는 배울 수 없습니다.
이 지점에서 의도적으로 저(低)기술인 아이디어가 놀라운 힘을 발휘합니다. 바로 아날로그 인시던트 스토리 카드 카탈로그를 만드는 것입니다. 도서관 카드 카탈로그처럼, 짧고 구조화된 인시던트 요약 카드들로 채워진 물리적인 서랍입니다. 각 카드는 하나의 실패를 담은 작은 이야기이고, 손으로 직접 넘겨볼 수 있는 일관된 분류 체계에 따라 정리됩니다.
이건 종이에 대한 향수가 아닙니다. 실패를 보이게 만들고, 둘러볼 수 있게 만들고, 조용히 무시하기 어렵게 만드는 방식입니다.
이 글에서는 다음을 다룹니다.
- 인시던트 스토리 카드 카탈로그란 무엇인가
- 카드를 ‘미니 포스트모템’처럼 설계하는 방법
- 택소노미(분류 체계)를 사용해 카드를 조직하고 정리하는 방법
- HFACS-Healthcare 같은 프레임워크에서 구조를 차용하는 방법
- 카탈로그를 살아 있는 시스템으로 유지하고 변화와 연결하는 방법
인시던트 스토리 카드 카탈로그란?
도서관 카드 카탈로그를 떠올려 보세요. 다만 각 카드는 이런 인시던트 하나를 나타냅니다.
- 프로덕션 장애
- 헬스케어 현장의 심각한 ‘아찔한’ 근접 사고(near‑miss)
- 보안 침해 시도
- 실패한 배포
각 카드는 압축된 내러티브입니다. 무엇이 일어났는지, 왜 일어났는지, 영향은 무엇이었는지, 무엇을 배웠는지에 대한 짧은 이야기죠. 카드는 ‘기술적 실패, 인간 요인, 프로세스 격차, 조직적 이슈’처럼 여러분 시스템을 반영한 택소노미에 따라 서랍에 정리됩니다.
여러분은 일종의 물리적인 시스템 메모리 아카이브를 만드는 것입니다.
왜 아날로그일까요?
- 적절한 지점의 마찰: 카드를 만들려면 요약하고 되돌아보는 과정이 필수입니다.
- 컨텍스트 전환 없음: 로그인도, 검색어도 필요 없습니다. 서랍을 열고 그냥 넘겨보면 됩니다.
- 심리적 무게감: “인증 장애로 가득 찬 서랍”을 눈으로 보는 건, 온라인 리스트를 필터로 보는 것과는 전혀 다른 감정을 줍니다.
- 공동 경험: 사람들은 서랍 앞에 모입니다. “와, 이거 기억나?” 같은 우연한 대화가 자연스럽게 생깁니다.
목표는 디지털 기록을 대체하는 것이 아니라, 그것들을 다시 찾아보게 만드는 형식으로 큐레이션하는 것입니다.
각 카드를 ‘미니 포스트모템’처럼 설계하기
각 카드는 건조한 티켓이 아니라 짧은 이야기처럼 읽혀야 합니다. 책임 추궁이 아닌 명료함과 학습을 목표로 하세요.
실무적으로 쓸 수 있는 카드 레이아웃 예시는 다음과 같습니다.
카드 앞면
- 제목(Title) – 사람이 읽기 쉬운 이름: “화요일 아침 인증 대혼란”
- 발생일(Date) – 인시던트가 발생한 날짜
- 관련 시스템 / 도메인(Systems / Domains) – 예: Auth, Payments, ICU, Lab Orders
- 영향 요약(Impact summary) – 쉬운 문장 1–2줄:
- “37분 동안 사용자가 로그인할 수 없었고, 약 12,000건의 로그인 실패가 발생했다.”
- “23명의 환자 검사 결과가 약 3시간 지연되었다.”
- 주요 카테고리 태그(Primary category tag) – 택소노미에서 선택 (예: Human Factors → Attention Management)
카드 뒷면
- 무엇이 일어났는가(서술) – 3–5문장:
- 핵심 타임라인
- 어떻게 감지·보고되었는지
- 어떻게 종료되었는지
- 왜 일어났는가(기여 요인, Contributing factors) – 택소노미와 연결된 불릿 포인트
- 무엇을 배웠는가(What we learned) – 구체적인 인사이트 3–5개
- 후속 조치(Follow‑up actions) – 실제로 취한 핵심 변화 2–3개
- 참고(Reference) – 전체 디지털 포스트모템의 링크나 ID
톤은 담백하고, 사람을 존중하는 방식이어야 합니다. 초점을 두어야 할 것은 다음입니다.
- 사람들이 어떤 조건에서 의사결정을 했는지
- 시스템의 제약과 설계 선택
- 툴, 교육, 프로세스의 빈틈
초점을 두지 말아야 할 것은 다음입니다.
- “Alice가 깜빡했다…”
- “Bob이 잘못 설정했다…”
누군가의 행동이 중요하다면, 맥락과 함께 설명하세요. 예: “온콜 엔지니어가 평소보다 일찍 교대하면서, 핸드오프 노트가 불완전한 상태였다…”
비난이 아니라 학습에 초점을 맞추기
이 카탈로그의 목적 전체는 학습과 개선을 돕는 것입니다. 이를 위해서는 다음이 필요합니다.
- 마녀사냥 금지 – 이름은 역할 이해에 꼭 필요할 때만 등장하고, 잘못을 특정하기 위해 쓰이지 않습니다.
- 시스템 관점 – “누가 망쳤나?” 대신 “어떤 조건들이 이 결과를 가능하게 만들었나?”를 묻습니다.
- 인간의 실수를 정상으로 보기 – 인시던트는 복잡한 시스템이 보내는 ‘예측 가능한 신호’로 취급하고, “나쁜 사람”이 만든 예외적인 사건으로 보지 않습니다.
이를 실제 관행으로 녹여내려면, 예를 들어 다음을 할 수 있습니다.
- 각 카드에 “System Contribution(시스템이 기여한 부분)” 섹션을 추가합니다:
- 예: “해당 주간에는 이미 알려진 다른 이슈들로 인해 페이저 알림량이 두 배였다.”
- 단일 원인 서사를 피합니다. 각 카드에는 최소 두 개 이상의 기여 요인을 적도록 요구합니다.
- 리뷰 세션에서 정기적으로 이런 질문을 던집니다: “다른 사람이 같은 상황에 있었다면, 이 일은 여전히 일어났을까?”
시간이 지나면 서랍 자체가 하나의 강력한 메시지가 됩니다. **“매번 반복해서 드러나는 건 결국 시스템이다”**라는 사실 말이죠.
정리하고 찾아볼 수 있는 택소노미 만들기
카탈로그를 쉽게 둘러보고 패턴을 찾으려면 **일관된 택소노미(분류 체계)**가 필요합니다. 완벽할 필요는 없습니다. 사람들이 ‘찾을 수 있을 만큼’ 안정적이면 충분합니다.
단순한 최상위 구조 예시는 다음과 같습니다.
- 기술적 요인(Technical Factors)
- 인프라 / 용량
- 소프트웨어 결함
- 통합 / 외부 의존성
- 모니터링 / 알림의 빈틈
- 인간 요인(Human Factors)
- 주의력 / 작업량
- 커뮤니케이션 / 핸드오프
- 교육 / 경험
- 인터페이스 사용성
- 프로세스 & 정책 격차(Process & Policy Gaps)
- 누락되었거나 오래된 런북
- 모호한 오너십
- 승인 / 변경 관리 이슈
- 불완전한 절차
- 조직적 요인(Organizational Factors)
- 인력 / 커버리지
- 상충하는 목표나 인센티브
- 문화적 규범 (예: 영웅주의, 사일로)
물리적인 구성에도 이 구조를 그대로 반영할 수 있습니다.
- 최상위 카테고리별로 서랍이나 섹션을 나눕니다.
- 서브카테고리마다 구분 카드(divider)를 둡니다.
- 서브카테고리 안에서는 알파벳순이나 시간순으로 정리합니다.
하나의 인시던트 카드는 여러 카테고리에 걸칠 수 있습니다. 물리적으로 이걸 처리하려면 다음처럼 할 수 있습니다.
- 카드는 항상 주요 카테고리 하나 아래에 꽂되,
- 작은 색깔 스티커나 점으로 보조 카테고리를 표시합니다 (예: 파랑 = Human Factors, 빨강 = Technical).
이렇게 하면 한 서랍만 봐도 색깔 패턴만으로도 트렌드를 감지할 수 있습니다.
HFACS-Healthcare 같은 프레임워크에서 구조 차용하기
분류 체계를 완전히 새로 만들 필요는 없습니다. HFACS-Healthcare(Human Factors Analysis and Classification System) 같은 구조화된 프레임워크는 기여 요인을 카테고리화하는 검증된 방식을 제공합니다.
HFACS는 보통 요인을 다음과 같은 레이어(층)로 나눕니다.
- 불안전한 행위(Unsafe acts) – 에러, 규정 위반 등
- 불안전한 행위의 전제 조건(Preconditions for unsafe acts) – 피로, 커뮤니케이션, 환경 등
- 불안전한 감독(Unsafe supervision)
- 조직적 영향(Organizational influences) – 문화, 자원 관리 등
소프트웨어 또는 헬스케어 환경에 맞게 이를 다음처럼 재구성할 수 있습니다.
- “불안전한 행위”를 최전선의 행동과 설계 결정에 매핑
- “전제 조건”을 툴링, 작업량, 환경, 인터페이스에 매핑
- “불안전한 감독”을 온콜 구조, 리뷰 관행, 리더십 결정에 매핑
- “조직적 영향”을 문화, 정책, 예산·우선순위 결정에 매핑
각 카드에 작은 필드를 하나 추가합니다.
HFACS 레이어: Preconditions, Organizational Influences
이렇게 하면 두 가지 효과가 있습니다.
- 시간이 지나도 분석 방식이 반복 가능하고 구조화됩니다.
- “전체 인시던트의 60%가 우리가 거의 이야기하지 않는 ‘조직적 영향’과 연관되어 있네?” 같은 패턴이 드러납니다.
STAMP, SEIPS 같은 다른 프레임워크에서 차용해도 좋습니다. 다만 물리 카드에 넣는 필드는 5–10분 안에 쓸 수 있을 만큼 단순해야 합니다.
누구나 넘겨보고 싶게 만드는 카탈로그 만들기
카탈로그는 사람들이 실제로 사용할 때만 의미가 있습니다. 물리적·사회적으로 ‘가까이 다가가기 쉬운’ 형태로 설계하세요.
- 팀 공간, 휴게실, 인시던트 리뷰 장소 근처 등 눈에 잘 띄는 중앙 위치에 둡니다.
- 서랍이나 박스를 보기 좋게 꾸미고, 라벨을 명확히 붙입니다.
- 손글씨라면 또렷하게, 가능하면 출력된 라벨을 사용합니다.
- 카테고리별로 색상을 나눠 한눈에 구분되도록 합니다.
그리고 ‘둘러보는 행위’를 루틴에 녹여 넣으세요.
- 주간 “Failure Flip‑Through”: 스탠드업 끝에 10분 정도, 누군가 무작위로 카드를 뽑아 사건을 이야기합니다.
- 배포 전 리뷰: 위험한 변경 전에, 해당 시스템·카테고리 관련 카드를 훑어봅니다.
- 온보딩: 신규 입사자가 한 시간 정도 카드를 둘러보고, 흥미로운 인시던트 3개를 골라 멘토와 이야기하게 합니다.
목표는 카탈로그를 ‘박제된 기록보관소’가 아니라, 팀이 자랑스러워하는 스토리 라이브러리처럼 느끼게 만드는 것입니다.
인사이트를 실제 변화로 연결하기
겉보기엔 멋진 카탈로그라도, 실제 업무 방식에 반영되지 않으면 아무 쓸모가 없습니다.
서랍과 실제 의사결정을 연결하려면 다음을 해보세요.
- 정기적인 패턴 리뷰 (월간 또는 분기별):
- 각 카테고리에 몇 장의 카드가 쌓였는지 세어 봅니다.
- “3개월 사이 핸드오프 관련 인시던트가 7건이나 있었네” 같은 클러스터를 찾습니다.
- 2–3개의 시스템적 테마를 요약합니다.
- 업무 추적 도구와 연결:
- 테마마다 구체적인 개선 작업을 만듭니다. 예: 런북 업데이트, 교육 세션, 설계 리뷰, 프로세스 변경 등.
- 후속 조치가 실제로 완료되면 카드에 작은 표시를 남깁니다.
- 교육과 런북에 피드백 주기:
- 실제 인시던트를 기반으로 시나리오형 교육을 만듭니다.
- “카드 X에서 배운 교훈”을 런북과 설계 기준에 직접 녹여 넣습니다.
시간이 지나면 다음과 같은 전·후 비교가 가능해집니다.
- 특정 서브카테고리의 카드가, 새로운 툴이나 교육 이후 눈에 띄게 줄어든다.
- 온콜 관행이 개선되며 영향 지속 시간이 짧아진다.
이 시점이 되면 카탈로그는 ‘재미있는 실험’ 수준을 넘어, 핵심 학습 자산이 됩니다.
맺음말
대시보드, AI, 실시간 분석이 넘쳐나는 시대에 아날로그 인시던트 스토리 카드 카탈로그는 거의 우스울 정도로 단순해 보입니다. 그러나 그 힘은 디지털 도구가 자주 놓치는 세 가지—물성, 서사, 공동의 주의—에서 나옵니다.
각 인시던트를 짧고 사람 냄새 나는 이야기로 압축해, 구조화된 ‘둘러보기 좋은’ 시스템에 꽂아두면:
- 실패가 묻히지 않고 계속 눈앞에 남아 있고
- 비난보다 근본 원인과 시스템 요인에 초점을 맞출 수 있으며
- 반복되는 패턴을 쉽게 발견할 수 있고
- 교육, 설계, 프로세스 변경을 실제 역사에 근거해 할 수 있습니다.
시작하기 위해 거창한 승인이 필요하지도 않습니다. 인덱스 카드를 몇 장 준비하고, 가벼운 택소노미를 정의하고, 서랍이나 박스를 하나 정한 뒤, 인시던트 3건을 골라 첫 카드를 써보세요. 사람들이 지나가다 무심코라도 볼 수밖에 없는 자리에 두면 됩니다.
그러면 한 장 한 장 카드를 쌓아가며, 흩어져 있던 실패들을 “우리 시스템이 실제로 어떻게 작동하는지, 그리고 어떻게 더 나아질 수 있는지”를 보여주는 살아 있는 라이브러리로 바꿀 수 있을 것입니다.