[6.1.2 장애 보고] 📖 1) 장애 대응절차에 클라우드서비스 중단이나 피해가 발생 시 법적 통지 및 신고 의무에 따른 장애 보고절차가 마련되어 있는가?

6. 서비스 연속성 관리 > 6.1 장애대응
🔍 점검 취지 및 해설
■ 클라우드컴퓨팅 서비스 중단이나 피해발생 시 법적 통지 및 신고 의무를 준수할 수 있도록 관련 사항을 포함하여 장애대응절차를 수립하여야 한다.

※ 장애대응 절차에서 장애 발생 시 이용자에게 통지해야 하는 사항에 대한 참고 ㅇ 클라우드컴퓨팅법 시행령 제16조(통지가 필요한 클라우드컴퓨팅서비스의 중단 기간) 1. 클라우드컴퓨팅서비스의 중단 기간이 연속해서 10분 이상인 경우 2. 클라우드컴퓨팅서비스의 중단 사고가 발생한 때부터 24시간 이내에 클라우드컴퓨팅서비스가 2회 이상 중단된 경우로서 그 중단된 기간을 합하여 15분 이상인 경우 ㅇ 클라우드컴퓨팅법 시행령 제17조(통지의 내용 및 방법) 1. 발생내용 2. 발생원인 3. 클라우드컴퓨팅서비스 제공자의 피해 확산 방지 조치 현황 4. 클라우드컴퓨팅서비스 이용자의 피해 예방 또는 확산 방지 방법 5. 담당부서 및 연락처
✍️ 운영 현황 및 증적 기록
작성 완료됨

■ 클라우드컴퓨팅 서비스 중단이나 피해발생 시 법적 통지 및 신고 의무를 준수할 수 있도록 관련 사항을 포함하여 장애대응절차를 수립하여야 한다

장애대응지침이나 매뉴얼에 장애대응 절차가 명시되어야 합니다.

. OOO서비스 관련 장애발생시 대응 절차

OOO서비스 장애 상황

크게 Software 장애와 Data 장애로 구분되며, Software 장애는 칵테일 장애, 클러스터(k8s) 장애, OS 장애로 세분화되며, Data 장애는 Database 장애, Data 장애, 백업 장애로 세분화 할 수 있다. 각 장애 유형에 따라 Prometheus 알람 또는 운영 중 장애를 인지하게 되며, 인지 직후에 해당 장애를 조치할 팀은 즉시 복구 및 안정화 하도록 조치한다.

이벤트 탐지

OOO서비스와 관련된 이벤트 발생시 Prometheus 알람을 서비스기술팀 전원이 수신하며, 다음 아래와 같다.(예시)

장애 탐지 및 상황 전파

Prometheus 알람 중 OOO서비스와 관련된 장애 이벤트를 확인한 인원은 장애발생에 대해 정보보호 최고책임자에게 보고 및 전 팀원에게 상황을 전파한다.

초동 조치

장애의 위험도를 판단하여 심각할 경우 초동조치 단계로 정보보호 최고책임자에게 보고하고 OOO서비스 서비스의 영향도를 파악하여 피해완화를 위한 조치를 진행한다.

이벤트 분석

장애와 관련된 정보를 수집하여 장애발생 원인 및 피해범위 등을 파악하고 별도의 대응조치 필요여부 등 대응방안을 수립한다. 이때 장애와 연관된 팀은 별도로 장애에 따른 추가 피해상황이 있는지 확인한다.

복구 및 정상화

장애 복구 후 OOO서비스의 정상화를 확인한다.

또한 법적 통지신고 및 신고 의무를 준수하기 위해 통지 절차가 명시되어야 합니다.

클라우드발전법 시행령 제16(통지가 필요한 클라우드컴퓨팅서비스의 중단 기간)

1. 클라우드컴퓨팅서비스의 중단 기간이 연속해서 10분 이상인 경우

2. 클라우드컴퓨팅서비스의 중단 사고가 발생한 때부터 24시간 이내에 클라우드컴퓨팅서비스가 2회 이상 중단된 경우로서 그 중단된 기간을 합하여 15분 이상인 경우

통지 양식(셈플)

6.1. 공지 수단 및 형식

장애 공지는 이메일 통한 공지를 기본으로 한다. 경우에 따라서는 이메일 공지와 함께 유선, SNS를 통한 안내를 진행한다.

. 장애 발생 공지 형식

발신자: tech

[장애공지] OO 서비스 장애 건

OO 서비스 장애가 발생하여 아래와 같이 공지합니다.

- 아래 -

1. 장애발생 일시 : 20241110:00

2. 예상복구 일시 : 20241111:00 (예측이 불가능할 경우 +2시간)

3. 장애 내용 : 레지스트리 서버 다운에 의한 접속 불가

4. 장애 원인 : 레지스트리 서버 다운에 의한 접속 불가

5. 영향받는 시스템

1) OOO 시스템

6. 클라우드컴퓨팅서비스 제공자의 피해 확산 방지 조치 현황

7. 클라우드컴퓨팅서비스 이용자의 피해 예방 또는 확산 방지 방법

8. 담당부서 및 연락처

장애로 인하여 업무에 불편을 드린 점에 대해 사과말씀 드리며, 빠른 시간 내에 정상화 될 수 있도록 최선을 다하겠습니다.

. 장애 복구 공지 형식

[장애공지] OO 서비스 장애 건

OO 서비스 장애가 복구되어 아래와 같이 공지합니다.

- 아래 -

1. 복구완료 일시 : 20241111:00

2. 장애발생 일시 : 20241110:00

3. 장애 내용 : 레지스트리 서버 다운에 의한 접속 불가

4. 조치 내용 : 서버 재기동 후 정상화

5. 담당부서 및 연락처

장애로 인하여 업무에 불편을 드린 점에 대해 사과말씀 드리며, 안정적인 서비스를 위해 최선을 다하겠습니다.

내용을 수정하거나 파일을 업로드하려면 로그인이 필요합니다.
검토 및 피드백 0

등록된 검토 의견이 없습니다.