클라우드/AWS

[AWS, 재해복구(DR)] AWS재해복구(DR) 아키텍처 - 2편

인프라베어 2023. 12. 21. 01:10

[AWS, 재해복구(DR)] AWS재해복구(DR) 아키텍처 - 1편

저번시간 알아본 AWS의 재해복구 아키텍처에는 크게 Backup & Restore, Pilot, Warm standby, Multi-site active/active로 구성이 되어있는데 비교적 전통적인 DR환경은 Mirror Site, How Site, Warm Site, Cold Site로 구성이 되어있습니다.

 

오늘은 AWS재해복구 아키텍처의 근본이 되는 DR시간과 구성은 보통 어떻게 말하나에대해 알아보겠습니다.

미러사이트

가장 먼저 미러사이트는 데이터 센터와 동일한 수준의 DR센터를 구성하여 실시간으로 동기화하여 구성하는 방식인데 DB를 실시간으로 동기화하고 재해발생시 Active-Active구성을 통해 이론적으로 RTO와 RPO를 0으로 유지하게 됩니다.

핫사이트

핫사이트는 데이터센터와 동일한 수준의 DR센터를 구축하는 것은 미러사이트와 동일하지만 Active가 아닌 Standby구성을 한다는 것이 가장 큰 차이 입니다. 이를 통해 재해 발생시 Active로 전환하여 서비스를 제공하는 방식으로 재해발생시 목표복구 시간은 약 4시간 이내입니다.

웜사이트

웜사이트는 데이터센터와 동일한 수준의 DR센터를 구축하되 중요도가 높은 데이터만 DR센터에 부분적으로 저장하는 방식으로 그외의 일반 데이터는 수시간 ~ 1일 단위로 백업이 진행됩니다. 미러사이트와 핫사이트에 비해 초기투자 및 유지비용이 적게 들지만 복구수준이 완벽하지 않을 수 있습니다.

콜드사이트

콜드사이트는 최소한의 수준으로 DR센터를 구축하여 데이터만 보관하는 방식이다. 백업은 수일~수주(RPO=수일 ~ 수주)로 진행되며 복구또한 비슷한 기간이 소요된다. 초기 투자비용 및 유지비용은 가장 저렵하지만 복구시간이 매우 길고 복구신뢰성이 낮다. 주로 핫사이트를 보완하기위해 함께 적용된다.

 

이를 통해 AWS의 재해복구 아키텍처와 비교해본다면 미러사이트는 멀티사이트 Active-Active 구성, 핫사이트는 웜 스탠바이, 웜사이트는 파일럿 라이트, 콜드사이트는 백업 & 리스토어 전략과 유사함을 알 수 있었습니다.

해당 내용을 정리하게된 계기는 AWS재해복구 아키텍처를 기술세미나 주제로 삼았지만 기존의 DR환경에 대해 잘 알지 못해서 이를 비교하여 알아보고 싶어 내용을 정리하게 되었습니다.

 

위의 재해복구를 알아보는 과정에서 데이터를 실시간으로 동기화 하는 방법(Oracle RAC)과 Active - Active구성시 GSLB(Global Server Loac Balancing)를 이용한 로드밸런싱, 재해복구를 위한 DNS서버구성, 백엔드단에서의 Failover처리 등등 의 중요한 내용들을 알아야함을 알 수 있었는데 이러한 내용으로 지식을 차근차근 쌓아가볼 생각입니다.

 

긴글 봐주셔서 감사합니다!