이번에는 면접에서 자주 질문을 받았던 재해복구에 대한 소개와 AWS 블로그의 재해복구 아키텍처를 정리해 보도록 하겠습니다. 재해복구란? 재해복구란 자연재해나 인간의 행동으로 인한 재해가 발생한 후 서비스에 대한 기능을 복원하는 것을 의미한다. 우리FIS 아카데미를 통해 금융권인프라에 대해 생각해보며 재해복구에 관심을 가지게되어 1차 기술세미나 주제로 재해복구 아키텍처를 소개했다. 재해복구에 가장 대표적인 사례는 바로 카카오의 사례인데 2022년 if(kakao) dev2022의 1015 장애 원인 분석 영상을 찾아보며 카카오의 서비스 장애에 대해 알아보았다. 카카오의 장애원인으로는 크게 3가지가 있는데 간략히 정리해보자면 아래와 같다. 데이터센터간 이중화 미흡 모든 시스템이 이중화 되어있었다면 빠르게 복..