종종 공강 시간에 낮잠을 잘 때 켜 두는 내셔널지오그래픽채널의
《항공사고수사대》를 보다가, 뭔가 느낌이 오는 부분을 발견해서 기록으로
옮겨 봅니다. 흐흐. 요새는 TV에 재미있는게 참 많아요~ -O-
그 에피소드는 1990년의 British Airways 5390편 사고를 다루고 있는 시즌 2 에피소드 2 였습니다. 이 사고는 기장 앞의 창문이 뜯겨나가서 기장이 밖으로 튕겨나가고 부기장이 극적으로 비상착륙을 시켜서 결국엔 사망자 없이 무난히 마무리한 사건입니다. 그런데, 창문이 갑자기 뜯겨나간 이유가 조사가 진행되면서, 정비기사가 창을 고정하는 볼트 크기를 설계상의 크기가 아니라 다른 것을 끼운 것이 발단이 되어서, 상공에서 풀려서 사고가 생기게 되었다는 것이 밝혀졌습니다.
정비기사는 원래 끼워져 있던 볼트와 같은 크기의 볼트로 갈았을 뿐이라고 주장하며 전혀 문제가 없을 것이라고 했는데, 결국 그 비행기에는 원래부터 잘못된 볼트가 끼워져 있었고, 잘못된 볼트 크기에 맞게 정비기사가 역시나 또 작은 볼트를 끼운 것이었습니다.
다른 일반적인 사고에서는 정비기사 위로 직계 상사 몇명이 짤리면 그만이겠지만, 역시 우리의 항공사고수사대! 돈이 많이 드는 사업이니 만큼 철저한 조사를 합니다.
Accident investigation certain aircraft comprises two parts. First part is what’s happened and that’s usually well to the easy bit. And second part is why did it happen. — Stuart Culling (Accident Investigator, AAIB)
항공기 사고 조사는 두 단계로 이루어집니다. 첫 번째는 어떻게 일이 일어났는가를 조사하는 것인데, 보통은 쉬운 부분입니다. 두 번째 부분은 바로 왜 그런 일이 일어났는가를 조사하는 것입니다. – 스튜어트 컬링 (사고조사자, AAIB)
음.. 그러니까, 사고의 원인을 “정비기사가 볼트를 잘못 끼운 것”이나 “4년 전에 조립한 곳에서 잘못 끼운 것”이 아니라, 더 깊숙한 심리적인 원인을 분석했습니다. 조사자는 정비기사의 숙련도를 고려하여 자기의 책임으로 몰아가는 것처럼 느끼지 않게 최대한 배려하면서 어떤 경위로 정비기사가 그런 선택을 하게 되었는지 조사를 해서 결국은 더 깊은 원초적인 원인을 분석했습니다.
원래 항공기를 제작한 회사에서는 정비 매뉴얼에 모든 부품의 규격을 적어 두고
그에 따라 항상 확인하여 쓰도록 되어 있었지만, 실제로 정비창에서는 매뉴얼을
일일이 확인하여 작업하면 시간이 3배가 넘게 걸려서, 항공기의 스케줄에는
절대로 맞출 수가 없다는 것이었습니다. 또한, 인력 부족과 과도하게 빡빡한
항공 스케줄을 이유로 여러 사람이 반복적으로 안전을 확인해야 할 정비 공정
중에서 많은 부분을 정비기사 개인의 육감적인 판단에 맡기고 있었다고 합니다.
정비기사도 그런 부분에 대해서 상부에 얘기하고 싶었지만, 따로 따로 바쁘게
다른 시간에 떨어져서 일하다 보니 그런 기회가 적었다고 합니다.
결국 조사팀에서는 항공사에 품질관리 시스템을 점검하고, 기사들이 피드백을
주는 것을 장려하도록 했으며, 항공 당국에는 안전에 결정적인 영향을 주는
요소에 대해서 재직 중에도 계속 테스트를 하도록 권고했다고 합니다.
소프트웨어 프로젝트에서도, 많은 팀에서 프로젝트 일정에 쫓기다 보면, 우선
버그를 해결하고 나서는 그 버그가 뭔지 버그 트래커에 기록이 남으면 무척
다행이지만, 사실 상 많은 곳에서 그냥 “아차!”하고 남들 보기 전에 얼른
고치거나, 다른 사람이 만든 버그를 고친 경우에는 괜히 원망 한 번하고 끝납니다.
단순히 “잘못해서” “실수로” 라던지, “포인터를 잘못 접근해서” 같은 직접적인
이유 말고도, 근본적이고 기초적인 “모니터가 작아서 앞뒷 부분이 잘 안 보여서”
라던지 “의자가 불편해서 결국 치질에 걸리고, 자세를 자주 바꾸다보니 결국에
코드 집중도가 떨어진다” 같은 좀 더 사람에 초점을 맞춘 원인을
가끔씩은 분석하면 앞으로 발생할 여러 문제를 한꺼번에 잡아버릴 수도
있지 않을까 생각을 해 봤습니다.
원래 잘 돌아가던 코드를 그냥 다른 데 썼을 뿐인데,
그게 나중에 대형사고를 일으킨 경험을 해 본 적이 있는
게.. 엉뚱한데에 참 와닿네요 ^.^;;
앗.. 그러면 튕겨나간 기장도 살아남은건가요? @.@
타이치 오노의 도요타 생산 방식(Toyota Production System)에는 Five Whys라는 것이 있다. 왜를 다섯번 묻는 것이다. 예를 들어, 결함이 하나라도 발견되면 전 라인을 가동 중단 시킨다. 그리고 그 결함의 원인을 “왜”로 묻는다. 그다음 거기에 대한 답을 다시 결과로 보고 왜를 한번 더 묻는다. 이걸 다섯번 반복한다.
소프트웨어 개발에 적용해 본 적이 있는데 효과가 크더라.
하늘섬: 옙. 모두가 다 죽은 줄 알고 있었는데, 극적으로 살아나서 몇달 뒤에는 다시 조종에 복귀 했다고 하네요. -O- 튕겨나가다가 발이 조종간에 걸려서 다리는 안쪽에 걸려 있었는데, 승무원들이 와서 꼭 잡고 있었다는군요.. 기장이 튕겨나가면 날개에 손상을 줄 수 있다고;;;;
김창준: 흐흐.. 글쿤요! 저도 앞으로 버그를 찾으면 원인 분석을 한번.. ^.^
원인분석을 잘 해야되는데…
전 매번 감정적으로 풀어나가게 되요. ( ..)
http://blog.insightbook.co.kr/60 에서 똑같은 얘기를 하네요. 🙂 새삼 생각이 나서 와봤습니다.