정부, 장애 사태 조사 결과 발표
“데이터센터 배터리 방화 조치 부족
카카오, 센터 간 서버 이중화 미비”
한 달 내 원인 개선 조치 보고 요구
지난 15일 오후 화재가 발생한 경기도 성남시 분당구 SK 판교 캠퍼스 A동에서 소방관들이 분주하게 움직이고 있다. 카카오 데이터 서버가 있는 곳이다.
연합뉴스
연합뉴스
이종호 과학기술정보통신부 장관은 6일 정부서울청사에서 이런 내용의 카카오 등 장애 사태 조사 결과를 발표했다.
조사 결과에 따르면, 지난 10월 15일 오후 3시 19분쯤 경기 성남 SK C&C 판교 데이터센터 지하 3층 배터리실에 배터리모니터링시스템(BMS)이 구축돼 있었으나 화재 발생 직전까지 이상 징후는 나타나지 않았다.
화재가 발생한 리튬이온 배터리는 가스 소화가 어려운 특성을 갖고 있었다. 그렇지만 SK C&C는 2016년 설치 이후 특화된 방화 조치를 취하지 않았고 이 때문에 초기 진압이 제약됐다. 서버에 이중화된 형태로 전원을 공급하던 무정전 전원 장치(UPS)는 리튬이온 배터리와 물리적으로 완벽히 분리되지 않아 작동이 중지됐다.
또 배터리 상단에 있던 전력선이 화재로 인해 손상됐고 화재 진압을 위한 살수 시 누전 등 2차 피해 우려로 전체 전력을 차단했다.
카카오는 판교 데이터센터와 다른 센터 간 이중화 조치를 취했으나, 다른 센터의 서버를 동작하기 위한 도구는 판교 데이터센터 내에만 구축해 장애 복구가 늦어졌다. 애플리케이션, 서비스 플랫폼 등 일부 서비스 구성 요소도 데이터센터 간 이중화돼 있지 않았다.
아울러 카카오톡, 다음 등 카카오 서비스 대부분의 핵심 기능이 판교 데이터센터에 집중돼 있어 사고 시 카카오의 대부분 서비스가 즉각 영향을 받았다.
네이버는 데이터센터 간 이중화 조치를 해 서비스 중단은 피했으나, 데이터센터로 서비스를 전환하는 과정에서 일부 기능에 오류가 발생했다. 카카오의 주요 서비스가 완벽하게 제공되지는 못했던 시간은 127시간 33분이었던 반면, 네이버의 주요 서비스·기능은 약 20분∼12시간 만에 정상화됐다.
정부는 화재 발생 원인은 이날 발표하지 않았다. 이 장관은 “화재 원인은 소방청과 관계기관이 정밀 조사하고 있고, 결과가 나오는 대로 알려 드리겠다”고 말했다. 또 BMS의 정상 작동 여부에 대해서도 정부는 명확한 결론을 내리지 않았다.
이 장관은 SK C&C와 카카오, 네이버 등 3사에 대해 한 달 내에 주요 사고 원인에 대한 개선 조치와 향후 계획을 수립해 보고하도록 할 계획이라고 밝혔다.
세종 박기석 기자
2022-12-07 10면