
핵심요약
뱅크샐러드 대출비교 서비스에서 100여 개 금융 기관 API 연동 중 발생한 문제들을 해결하기 위해 관찰 가능성(Observability) 및 모니터링 시스템을 구축하여 API 성공률을 90%에서 99%까지 향상시킨 경험을 공유합니다.
뱅크샐러드 대출비교 서비스 API 연동 안정화
문제 정의 및 초기 대응의 한계
- 뱅크샐러드 대출비교 서비스는 100여 개 금융사 API 연동을 통해 사용자에게 최적의 대출 상품을 제공합니다.
- 초기에는 금융사 API 호출 성공 여부를 실시간으로 파악하기 어려웠으며, 네트워크 변경 등의 외부 요인에 대한 즉각적인 확인이 불가능했습니다.
- 개발자의 수동적인 API 성공률 대시보드 모니터링은 한계가 있었고, 실시간 문제 감지 및 대응에 어려움이 존재했습니다.
관찰 가능성(Observability) 및 모니터링 시스템 구축
- 서비스 내부 상태를 이해하기 위해 **관찰 가능성(Observability)**을 확보하고, 이를 위해 메트릭(metric) 데이터를 활용했습니다.
- 각 금융사 API 호출 시
count메트릭을 통해 성공 및 실패 횟수를 집계하도록 구현했습니다. - 수집된 메트릭 데이터는 Datadog 대시보드에 시각화하여 API 성공률을 한눈에 파악할 수 있도록 했습니다.
- 더 나아가 모니터링 시스템을 구축하여 API 성공률이 특정 임계치 이하로 떨어질 경우 Slack 알림을 자동으로 발송하도록 설정했습니다.
- 알림에는 문제 분석을 위한 관련 로그 링크와 대시보드 링크를 포함하여 신속한 문제 해결을 지원했습니다.
- 금융사 서버 점검 등 API 요청이 없는 상황은 정상으로 처리하여 불필요한 알림 발생을 방지했습니다.
결과 및 서비스 안정화 효과
- 모니터링 시스템 도입 후, 선제적이고 능동적인 오류 대응이 가능해졌습니다.
- 금융사에 오류 발생을 먼저 알리고 협력하여 오류 대응 로직을 빠르게 반영할 수 있었습니다.
- 5개월 만에 대출비교 서비스의 API 성공률이 90%에서 99%로 크게 향상되었습니다.
- 이러한 시스템을 통해 사용자 경험에 영향을 미치기 전에 문제를 감지하고 해결하여 서비스 안정성을 확보했습니다.