Rain Lag

아날로그 인시던트 노트보드: 작은 장애와 거대한 시스템 변화 사이를 잇는 종이 실

종이와 코르크보드로 만드는 옛날식 ‘인시던트 노트보드’가 어떻게 미세한 장애와 히야리 사고를 신뢰성 공학, 프로젝트 생산 관리, 더 나은 시스템 설계를 위한 강력한 데이터로 바꿔 주는지 살펴본다.

아날로그 인시던트 노트보드: 작은 장애와 거대한 시스템 변화 사이를 잇는 종이 실

많은 관제실, 현장 사무실, 작업장 사무실에 들어가 보면 아직도 포스트잇, 인덱스 카드, 색실, 메모 화살표로 가득한 코르크보드를 쉽게 볼 수 있습니다. 겉보기에는 그냥 어수선한 잡동사니처럼 보입니다. 하지만 시스템 관점으로 생각하는 엔지니어에게 그 지저분한 보드는 전혀 다른 것입니다. 바로 로우테크이지만 레버리지가 큰 인시던트 분석 도구입니다.

이걸 우리는 **아날로그 인시던트 노트보드(incident knotboard)**라고 부를 수 있습니다. 작은 사건들을 종이와 실로 문자 그대로 서로 묶어 두는 물리적 공간이죠. 미세한 장애, 히야리 사고(near miss), “짜증 나는 작은 오류들”을 하나의 패턴으로 연결해 시스템 리스크의 가시적인 패턴으로 드러내는 공간입니다.

이 소박한 보드는 신뢰성 공학(reliability engineering), 안전 공학(safety science), **프로젝트 운영(project operations)**의 가장 엄격한 이론들과 곧바로 이어집니다. 여기서 사소한 인시던트들이 데이터가 되고, 그 데이터가 다시 Fault Tree Analysis(결함수 분석), **Project Production Management(프로젝트 생산 관리, PPM)**와 같은 정형 분석 기법으로 되먹임됩니다.


워룸에서 현장 사무실까지: 결함수의 짧은 역사

작은 고장이 어떻게 합쳐져 큰 실패를 만드는지 구조적으로 그려 보는 아이디어는 새롭지 않습니다. **Fault Tree Analysis(FTA, 결함수 분석)**는 1960~70년대 항공우주, 방위산업처럼 **초고신뢰성(high‑reliability)**이 요구되는 분야에서 등장했습니다. 1970년대 중반이 되면 FTA는 미 육군의 설계‑신뢰성(Design‑for‑Reliability) 핸드북에 공식적으로 포함되며 체계적인 리스크 분석의 핵심 자리를 차지하게 됩니다.

FTA의 핵심 질문은 단순합니다.

  • 우리가 가장 두려워하는 최상위 사건(top event)은 무엇인가? (예: “임무 상실”, “크레인 붕괴”, “서비스 중단”)
  • 그 사건을 유발할 수 있는 하위 수준 고장들의 조합은 무엇인가?

엔지니어는 AND/OR 게이트를 사용해 작은 고장이 어떻게 조합되는지 표현하는 **논리 트리(logic tree)**를 만듭니다. 매우 분석적이고 구조적이며 정량적이죠. 하지만 여기에 반드시 필요한 재료가 하나 있습니다.

좋고 세밀한 인시던트 데이터.

실제 인시던트와 히야리 사고가 어떻게 전개되는지에 대한 풍부한 데이터가 없다면, FTA는 현실과 동떨어진 이론 연습에 그치기 쉽습니다. 바로 이 지점에서 아날로그 노트보드가 빛을 발합니다.


왜 안전 필수 산업에서 ‘사소한 인시던트’가 그렇게 중요한가

군사 작전, 항공, 원자력, 중공업·건설과 같은 안전 필수(safety‑critical) 분야에서의 안전 문화는 하나의 핵심 신념 위에 세워져 있습니다.

큰 사고는 대부분 갑자기 하늘에서 떨어지지 않는다. 무시된 작은 실패와 히야리 사고가 반복적으로 쌓여 자란다.

예를 들어 건설에서는 지금 히야리 사고(near miss) 보고 도구가 대형 프로젝트의 표준이 되었습니다. 작업자들은 다음과 같은 사례를 적극적으로, 때로는 보상까지 받으며 보고하도록 권장됩니다.

  • 떨어진 공구가 누군가를 칠 뻔한 상황
  • 비계 발판이 무너질 뻔한 상황
  • 크레인 작업 사고로 이어질 뻔한 의사소통 오류

이런 일들은 “다친 사람 없으니 괜찮다”로 넘어가는 사소한 해프닝이 아닙니다. 오히려 매우 중요한 신호로 취급됩니다.

  • **시스템 리스크의 약한 신호(weak signal)**를, 대형 사고가 터지기 훨씬 전에 드러내 줍니다.
  • 절차, 교육, 설계가 어디서 어긋나 있는지를 보여 줍니다.
  • 팀, 현장, 장비를 가로지르는 패턴을 드러냅니다.

이 작은 사건들을 체계적으로 수집·추적·분석하면, 중대 사고가 실제로 줄어든다는 것이 건설 산업에서 수치로 확인되고 있습니다. 이 논리는 디지털 서비스, 복잡한 인프라, 다양한 사회기술(socio‑technical) 시스템에도 그대로 적용됩니다.

인시던트 노트보드는 이 논리를 촉감 있고 눈에 보이게 만드는 도구입니다.


아날로그 인시던트 노트보드: 느리게 움직이는 물리적 결함수

다음과 같은 큰 보드를 떠올려 봅시다. 보드는 여러 구역으로 나뉘어 있습니다.

  • 왼쪽: 시간 순으로 쌓이는 작은 인시던트와 히야리 사고 (티켓, 포스트잇, 인덱스 카드)
  • 오른쪽: 시스템 컴포넌트, 팀, 프로세스 단계
  • 색실 또는 선: 인시던트를 관련 컴포넌트, 의사결정, 하류 영향에 물리적으로 연결하는 실

시간이 쌓이면, 특정 지점에 덩어리와 매듭이 생기기 시작합니다.

  • 서로 다른 “사소한” 인시던트 10건이 모두 같은 두 서브시스템 간 인터페이스에 얽혀 있습니다.
  • 여러 번의 **미세 장애(micro‑outage)**가 모두 공급망의 특정 의존성 하나로 귀결됩니다.
  • 반복적인 재작업과 일정 지연이 딱 한 줄의 애매한 사양서로 이어집니다.

이것은 디지털 도구에서 하는 Fault Tree Analysis의 아날로그 버전과 비슷합니다.

  • FTA는 논리적 의존성을 그립니다. (A와 B가 동시에 실패하면 C가 발생할 수 있다…)
  • 노트보드는 실제로 관찰된 인과 사슬을 그립니다. (현실에서 A가 계속 발생했고, 그게 B를 불러왔고, 그게 C를 일으킬 뻔했다…)

노트보드는 지저분하고 정량적이지 않지만, 바로 그 점이 강점입니다. 팀이 이런 일을 할 수 있게 해 줍니다.

  • 아직 정형 모델로 넣기엔 애매한, 불완전한 이야기들을 그대로 포착
  • 데이터베이스만으로는 보기 어려운 부서·전문 영역을 가로지르는 패턴을 한눈에 파악
  • 비기술 이해관계자도 함께 볼 수 있는 시각적 리스크 대화의 장 제공

실제로는, 보드 위의 종이 “실” 하나하나가 살아 있는 결함수의 데이터 포인트가 되어, 패턴이 무시할 수 없을 만큼 두꺼워질 때까지 누적됩니다.


포스트잇에서 통계까지: Project Production Management의 등장

FTA가 신뢰성 공학의 세계에서 나왔다면, **Project Production Management(PPM, 프로젝트 생산 관리)**는 **운영관리(operations management)**와 **Factory Physics(팩토리 피직스)**에서 온 사고방식을 프로젝트에 가져옵니다.

PPM은 대형·복잡 프로젝트 — 예를 들어 건설 프로그램, 대규모 IT 전환, 인프라 구축 — 을 하나의 **생산 시스템(production system)**으로 간주합니다. 이 시스템에는 다음이 존재합니다.

  • 플로우 유닛(flow unit): 자재, 업무, 작업 패키지
  • 대기열과 버퍼(queue & buffer): 기다리는 작업, 재고, 정보 지연
  • 변동성과 병목(variability & bottleneck): 예측 불가능한 작업 시간, 제약된 자원

PPM은 운영연구(operations research)에서 차용한 분석 기법으로 다음을 돕습니다.

  • 변동성이 일정·비용 리스크에 어떤 영향을 주는지 정량화
  • 사람들이 ‘그럴 것 같다’고 짐작하던 것이 아니라, 진짜 병목이 어디인지 찾아냄
  • 더 나은 버퍼 설계, 작업 순서, 자원 배분 전략을 설계

그렇다면 아날로그 인시던트 노트보드는 여기에 어떻게 연결될까요?

우리가 기록하는 많은 “사소한 인시던트”는 사실 전사적 플로우 문제의 국지적 표현입니다.

  • 한 팀에서 반복적으로 발생하는 “소규모 서비스 중단”은, 상류 공정의 용량(capacity) 불일치를 반영할 수 있습니다.
  • 잦은 재작업 요청은 입력의 **숨은 변동성(hidden variability)**을 보여 줍니다.
  • 특정 벤더에서 반복적으로 발생하는 납기 지연은 공급망 상의 병목을 드러냅니다.

노트보드에 인시던트를 연결해 가는 행위는, 단순히 기술적 고장만을 그리는 것이 아니라 복잡한 생산 시스템 안에서 일어나는 **플로우 교란(flow disruption)**을 지도로 그리는 것입니다. 이 거친 시각적 맵이 PPM 모델에 들어갈 원천 데이터가 되어, 리스크를 수치로 만들고 구조적 개선책을 설계하는 데 쓰입니다.


종이 실 하나도 데이터로 취급하기

진짜 힘은, 노트보드 위의 인시던트 카드 하나하나를 “짜증 나는 한 번의 사건”이 아니라, 더 큰 신뢰성 모델을 위한 데이터로 취급할 때 생깁니다.

아주 단순한 워크플로를 예로 들어 보겠습니다.

  1. 수집(Capture)

    • 모든 장애, 이상 징후, 히야리 사고를 물리 카드에 적어 남깁니다.
    • 포함할 항목: 시간, 상황·맥락, 관련된 시스템 요소, 추정 원인, 즉각적 영향.
  2. 매핑(Map)

    • 카드를 노트보드에 꽂고, 다음 요소들과 실·선으로 연결합니다.
      • 컴포넌트·서브시스템
      • 팀·역할
      • 상류·하류 프로세스
  3. 클러스터링과 패턴 인식(Cluster & Pattern‑Match)

    • 정기적으로 크로스펑셔널(여러 부서가 섞인) 그룹이 보드를 함께 검토합니다.
    • 클러스터를 찾습니다. 예: “서로 다른 인시던트 12건이 모두 이 인터페이스 하나에 연결된다.”
  4. 모델로 정형화(Formalize in Models)

    • 되풀이되는 패턴을 **결함수(Fault Tree)**로 옮깁니다. (이 반복되는 히야리 사고는 어떤 조합으로 발생하는가?)
    • 발생 빈도와 변동성 데이터를 PPM/플로우 모델에 집어넣습니다.
  5. 조치와 재설계(Act & Re‑Design)

    • 이렇게 만들어진 모델을 기반으로 설계 변경, 프로세스 개선, 버퍼 전략을 결정합니다.
    • 이후 인시던트가 이전에 위험했던 노드 주변에서 덜 모이는지 추적합니다.

이 시점에서 노트보드는 더 이상 “문제 벽”이 아닙니다. 그것은 현장 실무와 엄밀한 엔지니어링 도구 사이를 잇는 브리지가 됩니다. 핀 하나, 실 하나가 조직을 다음 단계로 움직입니다.

  • 직관(Intuition) → 가설(Hypothesis) → 모델(Model) → 설계 변경(Design Change) → 개선 효과 측정(Measured Improvement)

디지털 시대에 굳이 아날로그가 필요한 이유

요즘은 정교한 인시던트 트래킹 소프트웨어가 많은데, 왜 굳이 종이와 실을 써야 할까요?

그 이유는 물리성이 사람 행동을 바꾸기 때문입니다.

  • 꽉 찬 노트보드는 무시하기 어렵습니다. 눈에 계속 들어와 주의를 요구합니다.
  • 팀이 그 앞에 함께 서서, 손가락으로 가리키고, 토론하고, 배울 수 있습니다.
  • 비기술 구성원도 진입 장벽 없이 관찰을 보태기 쉽습니다.

디지털 도구는 저장, 검색, 확장성 측면에서 강력합니다. 반대로 아날로그 도구는 **의미 만들기(sense‑making)**와 공유 인지(shared cognition), 즉 약한 신호가 “이건 시스템 문제다”라는 인식으로 전환되는 초기에 강력합니다.

이상적인 구성을 굳이 말하자면 **하이브리드(hybrid)**입니다.

  • 노트보드는 일상적인 가시성, 패턴 발견, 대화를 위한 도구로 사용합니다.
  • **소프트웨어·분석 기법(FTA, PPM, 통계 분석)**은 정량화, 시뮬레이션, 우선순위 결정에 사용합니다.

결론: 일상적인 작은 오류를 설계 인텔리전스로 바꾸기

아날로그 인시던트 노트보드는 단순한 향수 어린 도구가 아닙니다. 이것은 다음을 연결해 주는 실질적인 인터페이스입니다.

  • 현장 경험: 매일 실제로 어떤 문제가 일어나는지
  • 신뢰성 공학: Fault Tree Analysis와 같은 정형 리스크 모델
  • 운영 과학: Project Production Management와 플로우 분석

종이 실 하나를 살아 있는 신뢰성 모델의 데이터 포인트로 취급하면, 조직은 다음과 같은 일을 할 수 있습니다.

  • 위기가 되기 전에 약한 신호를 포착
  • 사소한 고장이 어떻게 거대한 붕괴로 전파되는지 이해
  • 일상적인 작은 오류를 시스템을 더 안전하고, 더 신뢰할 만하고, 더 회복탄력 있게 만드는 설계 인텔리전스로 전환

벽에 붙은 그 보드는 겉으로 보기에는 단순해 보일 수 있습니다. 하지만 그것이 엄밀한 분석 기법과 직접적으로, 또 은유적으로 연결되는 순간, 현대 사회기술 시스템의 복잡성을 헤쳐 나가는 강력한 도구로 변합니다.

때로는, 작은 장애와 거대한 시스템 변화 사이를 잇는 가장 짧은 실이 바로 우리가 그 보드에 꽂아 두는 그 한 가닥일지도 모릅니다.

아날로그 인시던트 노트보드: 작은 장애와 거대한 시스템 변화 사이를 잇는 종이 실 | Rain Lag