
핵심요약
데브시스터즈 엔지니어링 데이에서는 대규모 게임 서비스의 Infra/SRE 분야에서 발생하는 기술적 문제 해결 경험을 공유합니다. 장애 대응 원칙, 쿠버네티스 인프라 표준화, 그리고 게임팀을 위한 배포 시스템 개발 사례가 주요 내용입니다.
데브시스터즈 엔지니어링 데이: Infra/SRE 기술 문제 해결 사례 공유
데브시스터즈의 장애 대응 원칙과 효과적인 방법론
- 서비스 장애 정의 및 전 개발팀에 통용되는 장애 대응 원칙 수립.
- 알람 티어링 권장 체계를 통한 장애 심각도 및 우선순위 관리.
- 실제 발생했던 장애 사례를 기반으로 한 효과적인 장애 대응 방법 제시.
- 기술 블로그 포스팅을 통해 Incident Management Principles 상세 공유.
쿠버네티스 인프라 표준화 여정: Dalgona 프로젝트
- 문제점: 다수의 쿠버네티스 클러스터 증가로 인한 권한 관리 및 유지보수 비용 상승.
- 기술 전파 부재: ELB에서 Global Accelerator (GA), **Network Load Balancer (NLB)**로의 전환 노하우 미공유.
- 해결 방안: 중앙 인프라 조직 주도의 Dalgona 프로젝트를 통한 인프라 형상 표준화.
- 목표: 전사 쿠버네티스 클러스터의 효율적 관리 및 플랫폼 엔지니어링 발전.
게임팀을 위한 궁극의 배포 시스템 '플랑' 개발
- 기존 시스템 한계: Docker 이미지 태그 고정, 환경 변수 직접 수정 불가, 제한적인 Helm Hook 분리.
- 개발 목표: 기획자 및 서버 개발자가 중앙 인프라 조직 개입 없이 사용 가능한 배포 시스템 구축.
- 핵심 기술: Argo Workflow를 활용하여 유연하고 확장 가능한 배포 파이프라인 구현.
- 성과: 독립적인 배포 프로세스를 제공하여 개발팀의 운영 효율성 및 자율성 증대.
데브시스터즈