■ 클라우드컴퓨팅 서비스 중단이나 피해발생 시 법적 통지 및 신고 의무를 준수할 수 있도록 관련 사항을 포함하여 장애대응절차를 수립하여야 한다
장애대응지침이나 매뉴얼에 장애대응 절차가 명시되어야 합니다.
| 나. OOO서비스 관련 장애발생시 대응 절차 ㉠OOO서비스 장애 상황 크게 Software 장애와 Data 장애로 구분되며, Software 장애는 칵테일 장애, 클러스터(k8s) 장애, OS 장애로 세분화되며, Data 장애는 Database 장애, Data 장애, 백업 장애로 세분화 할 수 있다. 각 장애 유형에 따라 Prometheus 알람 또는 운영 중 장애를 인지하게 되며, 인지 직후에 해당 장애를 조치할 팀은 즉시 복구 및 안정화 하도록 조치한다. ㉡ 이벤트 탐지 OOO서비스와 관련된 이벤트 발생시 Prometheus 알람을 서비스기술팀 전원이 수신하며, 다음 아래와 같다.(예시)
㉢ 장애 탐지 및 상황 전파 Prometheus 알람 중 OOO서비스와 관련된 장애 이벤트를 확인한 인원은 장애발생에 대해 정보보호 최고책임자에게 보고 및 전 팀원에게 상황을 전파한다. ㉣ 초동 조치 장애의 위험도를 판단하여 심각할 경우 초동조치 단계로 정보보호 최고책임자에게 보고하고 OOO서비스 서비스의 영향도를 파악하여 피해완화를 위한 조치를 진행한다. ㉤ 이벤트 분석 장애와 관련된 정보를 수집하여 장애발생 원인 및 피해범위 등을 파악하고 별도의 대응조치 필요여부 등 대응방안을 수립한다. 이때 장애와 연관된 팀은 별도로 장애에 따른 추가 피해상황이 있는지 확인한다. ㉥ 복구 및 정상화 장애 복구 후 OOO서비스의 정상화를 확인한다. |
또한 법적 통지신고 및 신고 의무를 준수하기 위해 통지 절차가 명시되어야 합니다.
| 클라우드발전법 시행령 제16조(통지가 필요한 클라우드컴퓨팅서비스의 중단 기간) 1. 클라우드컴퓨팅서비스의 중단 기간이 연속해서 10분 이상인 경우 2. 클라우드컴퓨팅서비스의 중단 사고가 발생한 때부터 24시간 이내에 클라우드컴퓨팅서비스가 2회 이상 중단된 경우로서 그 중단된 기간을 합하여 15분 이상인 경우 |
통지 양식(셈플)
| 6.1. 공지 수단 및 형식 장애 공지는 이메일 통한 공지를 기본으로 한다. 경우에 따라서는 이메일 공지와 함께 유선, SNS를 통한 안내를 진행한다.
가. 장애 발생 공지 형식
나. 장애 복구 공지 형식
|
등록된 검토 의견이 없습니다.