시스템 장애는 왜 두 번 일어났을까? - 미즈호은행, 동일본 쓰나미 그 후 시스템 장애에서 얻은 교훈
[닛케이 컴퓨터] 편집부 지음, 이영희 옮김 / 한빛미디어 / 2012년 7월
평점 :
절판


 시스템 장애는 많은 IT 전문가 뿐 아니라 CEO, CIO 등이 민감하게 여겨야 할 이슈이다. 흔히 잘 설계된 시스템이 영구적으로 존속가능하다고 생각할지도 모르겠지만 다양한 상황의 변수를 모두 미리 대비할 수는 없기 때문에 고정된 해결책이 아니라 상황에 적절하게 개선 및 재설계가 요구된다. 문제는 이러한 간단명료한 상식을 민감하게 받아들이지 않는 의사결정권자의 판단이 걷잡을 수 없는 혼란을 낳는다는 점이다,

 

 2011년 동일본에 닥친 쓰나미로 인한 엄청난 피해로 인해 물리적인 문제는 충분히 예상된 것이다. 하지만 물리적 피해를 직접적으로 입은 것이 아닌 미즈호은행의 시스템이 무려 10일간 장애를 해결하지 못한 것이다. 일본 기업에 대해서는 꼼꼼한 대처나 보수를 떠올리기가 쉽지만 시스템 관련 대책에 관해서는 이 역시 무방비였다. 초반에 과감한 결정을 내리지 못한 것부터가 마치 도미노 효과를 떠올리듯 문제를 눈덩이처럼 커지게 한다.

 

 무려 23년간이나 시스템을 내버려두고 적절한 개선에 관심과 비용을 들이지 않은 점부터 시스템의 중요성을 간과한 CEO, CIO 등의 의사결정권자부터 시스템 기본 설정을 차마 인식하지 못한 관련부서까지 총체적 난관에 빠진다. 이 책은 이를 더 자세한 사례 분석을 일자별로 정리했으며 이전에 이미 나타난 장애와 연관시켜서 문제를 차분하게 분석하도록 돕는다.

 

 책에 나타난 시스템의 문제를 단순히 IT 부서의 문제로 생각할 것은 아니다. 이러한 시스템은 재난 시스템으로 확대시켜 생각할 수도 있으며 우리가 일반적으로 다루는 매뉴얼적인 대처의 문제점을 다시 생각해보게 만드는 기회가 될 것이다. 서울 및 각 지역에 고질적으로 나타나는 수해 등의 자연재해 문제에 대한 반복되는 문제점을 미즈호 은행의 시스템 장애를 교훈으로 삼았으면 좋겠다. 이러한 기업 관련 전문가 뿐만 아니라 일반인들도 세심한 분석과 대비 방안을 읽고 우리 주위를 둘러싼 시스템의 장애를 미리 개선할 수 있는 기회를 가졌으면 한다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo