뷰페이지

서버 망치는 원숭이, 고치는 원숭이… 넷플릭스에는 ‘사이버 교관’ 있다

서버 망치는 원숭이, 고치는 원숭이… 넷플릭스에는 ‘사이버 교관’ 있다

김민석 기자
김민석 기자
입력 2022-10-18 20:14
업데이트 2022-10-19 01:13
  • 글씨 크기 조절
  • 프린트
  • 공유하기
  • 댓글
    14

해외 빅테크 재난대응 어떻게

‘원숭이 부대’ 훈련 프로그램
불시에 고의로 서버 등 공격
구글 ‘DiRT’도 극단상황 설정
임직원 대응·해결 능력 강화
이미지 확대
‘카카오 사태’로 구글, 넷플릭스 등 글로벌 플랫폼 기업들의 재난 및 위기 대응 방식이 더욱 주목받고 있다. 화재 등 재난 발생 시 백업 서버 가동과 데이터 이중화를 기본으로 갖춘 것은 물론 비상 상황을 일부러 연출해 장애를 복구하는 훈련체계도 있는 것으로 알려졌다.

넷플릭스엔 업무 시간뿐 아니라 일요일 새벽 3시에도 불시에 서버 불능 상태 등 돌발 상황을 일으킬 수 있는 훈련 프로그램이 가동되고 있다. 넷플릭스는 이런 프로그램을 ‘원숭이 부대’라고 이름 지었다. 구글과 메타 등 대부분의 글로벌 빅테크 기업들은 넷플릭스처럼 자체 훈련 프로그램을 도입해 운영하고 있다. 최근 ‘카카오 먹통 사태’와 같은 일이 발생하지 않게 하기 위한 ‘사이버 교관’인 셈이다.

아마존 클라우드 컴퓨팅인 아마존웹서비스(AWS)를 기반으로 운영되는 넷플릭스는 2015년 AWS 서버 문제로 잠시 장애를 경험한 뒤 원숭이 부대를 고안했다.

이 ‘부대’엔 여러 마리의 ‘원숭이’가 소속돼 있다. ‘혼돈 원숭이’(카오스 몽키)는 ‘야생 원숭이가 서버실에 난입해 공격하고 케이블을 물어뜯는 동안에도 서비스가 중단돼선 안 된다’는 넷플릭스의 철학을 반영해 탄생했다. 이 프로그램은 업무 시간 중간은 물론 일요일 오전 3시에도 실행돼 작업을 비활성화한다. 넷플릭스는 혼돈 원숭이에 이어 서버 통신을 인위적으로 지연시키는 ‘지연 원숭이’, 규칙에 어긋나는 소프트웨어상 실체를 종료시키는 ‘적합성 원숭이’, 취약한 실체를 탐지해 서비스에서 제외시키고 종료시키는 ‘의사 원숭이’ 등을 탄생시켰다. 이에 더해 전체 클라우드 서버를 종료하는 ‘혼돈 고릴라’를 개발해 극단적인 장애 상황에 대응하는 능력을 시험하고 있다.

구글 역시 클라우드 백서를 통해 재해 발생 시에도 서비스와 사업 운영이 계속될 수 있도록 매년 전사 차원의 ‘재해 복구 테스트’(DiRT·Disaster Recovery Testing)를 시행한다고 소개했다. DiRT는 강제로 서비스가 불능 상태가 되거나 핵심 인력이 없는 상황, 지원 시스템 차단 상황 등을 의도적으로 부여하고 해결하는 훈련 방식이다.

메타 역시 전 직원이 참여하는 특별한 재해 복구 훈련 프로그램을 운영하고 있다고 밝혔다. 다만 훈련 프로그램의 이름과 구체적인 내용은 대외비에 해당된다며 공개하지 않았다.

이번 사고 대응에 실패하긴 했지만 카카오도 자체 재난 훈련 프로그램을 운영하고 있다고 설명했다. 네이버 관계자 역시 “평소 재난에 대비한 정기 훈련을 해 왔고 이번에도 훈련된 절차대로 빠르게 대처해 피해를 최소화할 수 있었다”고 말했다.
김민석 기자
2022-10-19 2면

많이 본 뉴스

국민연금 개혁 당신의 선택은?
국민연금 개혁 논의가 이어지고 있습니다. 국회 연금개혁특별위원회 산하 공론화위원회는 현재의 보험료율(9%), 소득대체율(40%)을 개선하는 2가지 안을 냈는데요. 당신의 생각은?
보험료율 13%, 소득대체율 50%로 각각 인상(소득보장안)
보험료율 12%로 인상, 소득대체율 40%로 유지(재정안정안)
광고삭제
위로