
핵심요약
하이퍼커넥트 아자르는 복잡한 휴리스틱 알고리즘을 AI 추천 시스템 'CUPID'로 전환하여 매출 성장을 달성했습니다. 이 시스템은 짧은 레이턴시 제약을 극복하고 신규 및 기존 유저 경험을 동시에 향상시키기 위해 투 타워 아키텍처와 비동기 세션 임베딩을 활용한 것이 특징입니다.
아자르 AI 추천 시스템 CUPID: 설계 및 구현 상세 분석
AI 추천 시스템 도입의 전략적 중요성
- 휴리스틱 알고리즘의 지연 문제와 높은 유지보수 비용을 AI 모델의 연속 학습 파이프라인으로 해결합니다.
- AI 기반 추천은 유저 경험 및 리텐션을 향상시키며, 데이터 학습 기반의 선순환으로 비즈니스 성장을 견인합니다.
레이턴시 제약 하의 모델 아키텍처
- CatBoost의 O(N^2) 연산량 한계로 1:1 비디오 채팅의 짧은 레이턴시 요구사항 충족이 어려웠습니다.
- 투 타워 아키텍처를 도입, 유저/피어 임베딩을 O(N)으로 생성 후 내적 연산을 O(N^2)로 고속화하여 응답 속도를 최적화했습니다.
- BLAS 라이브러리, NPU/GPU 활용 및 배칭 처리로 속도와 비용 효율성을 극대화합니다.
CUPID 모델: 신규 유저 및 성능 최적화
- Wide&Deep 모델의 신규 유저(cold-start) 예측 취약점을 해결하기 위해 세션 기반 추천 및 인과 트랜스포머를 검토했습니다.
- 인과 트랜스포머의 M^2 복잡도로 인한 확장성 문제를 극복하고자 CUPID 모델을 개발했습니다.
- CUPID는 피쳐 임베딩과 세션 임베딩을 분리, 비동기 처리하여 레이턴시를 크게 감소시키고 모든 유저에게 높은 예측 성능을 제공합니다.
배포, 학습 및 실제 적용 시 고려사항
- 배포 시 매치 요청마다 피쳐 임베딩 계산 및 세션 임베딩의 비동기적 조회를 통해 실시간성과 효율성을 확보합니다.
- 2단계 학습 방법으로 학습 효율을 213배 개선했으며, 실제 서비스에서는 여러 1차 지표 동시 최적화 및 지수 변환으로 예측 정확도를 높입니다.