T
TechInsights
목록으로
Infra•2026. 01. 20.

레거시 인프라 작살내고 하이브리드 클라우드 만든 썰

토스
토스 Engineering Team
레거시 인프라 작살내고 하이브리드 클라우드 만든 썰

핵심요약

원문 보기

토스페이먼츠는 상상을 초월하는 레거시 인프라 문제를 해결하기 위해 OpenStack 기반 프라이빗 클라우드를 구축하고 AWS와 Active-Active 하이브리드 클라우드를 완성했습니다. 이를 통해 개발자가 인프라를 인지할 필요 없는 환경을 만들고 고가용성을 확보했습니다.

레거시 인프라를 넘어 하이브리드 클라우드를 구축한 토스페이먼츠

1. 레거시 인프라의 문제점

  • 1997개의 라우팅 정보를 서버에 직접 관리하는 비효율적인 구조.
  • DNS 부재로 인한 도메인 주소 사용의 어려움 및 호스트네임 컨벤션 부재.
  • 부정확한 장비 현황 및 이중화된 장비 간 구성 불일치 문제.

2. 퍼블릭 클라우드 도입 및 한계

  • 신규 서비스 현대화 및 빠른 인프라 준비를 위해 AWS 클라우드 도입.
  • 서비스 확장으로 인한 비용 증가, 환율 변동 영향, DR 구성의 어려움 발생.
  • 전용 회선 등 퍼블릭 클라우드에서 제공하지 않는 인프라 구성 요소의 필요성.

3. 프라이빗 클라우드 구축 및 하이브리드 클라우드 전략

  • IDC 내 레거시 인프라를 버리고 OpenStack 기반 프라이빗 클라우드 구축.
  • 최종 목표: 퍼블릭 클라우드의 장점과 프라이빗 클라우드의 통제권을 결합한 Active-Active 하이브리드 클라우드 환경 구축.
  • 프라이빗 클라우드 요구사항: 애자일한 인프라, 유연성, 오픈소스 기반.

4. 프라이빗 클라우드 운영 및 K8S 구성

  • 2명의 엔지니어로 OpenStack 운영을 위한 경험 축적, 튜닝, 자동화(Ansible, Terraform), 모니터링(Zabbix, Prometheus) 강화.
  • 고가용성 확보를 위한 3개의 독립된 OpenStack 클러스터(2개 프로덕션, 1개 관리용) 구성.
  • Cluster API를 활용하여 K8S 클러스터를 선언적으로 관리하고 운영 효율성 증대.
  • NetDevOps 방법론 적용 및 Configuration 모듈화, 템플릿화를 통한 네트워크 민첩성 확보.

5. 하이브리드 클라우드 완성 및 성과

  • 4개의 Active Live 영역(AWS 2개, OpenStack 2개)을 통한 높은 수준의 가용성 확보.
  • DNS 기반 부하 분산 및 Global Accelerator 활용 트래픽 플로우 최적화.
  • ALB/NLB 등 퍼블릭 클라우드 구성 요소에 대한 프라이빗 클라우드 내 동일 계위 대응 구성.
  • 개발자가 어느 클라우드인지 알 필요 없는 환경 구축으로 배포 시스템 확장 및 자동화 테스트 강화.
#Infra#Architecture
토스
토스

토스 Engineering Team

기술 인사이트를 전달하는 공식 채널

You might also like

View all
Amazon Bedrock AgentCore Runtime을 쉽고 빠르게 시작하기

Amazon Bedrock AgentCore Runtime을 쉽고 빠르게 시작하기

Enterprise Agentic AI를 위한 Amazon Bedrock AgentCore Built-in Tools: Code Interpreter and Browser Tool

Enterprise Agentic AI를 위한 Amazon Bedrock AgentCore Built-in Tools: Code Interpreter and Browser Tool