LG유플러스, Bedrock AgentCore를 활용한 손쉬운 클라우드 Agent 구현 사례
LG유플러스, Bedrock AgentCore Runtime을 활용한 클라우드 Agent 구현
1. 배경 및 목표
- LG유플러스는 멀티 클라우드 환경 통합 관리를 위한 UCMP(Uplus Cloud Management Platform) 구축.
- UCMP에 AI Agent 도입하여 사용자 의사결정 지원 및 운영 효율화 목표.
- 대규모 동시 세션 처리를 위한 안정적이고 확장 가능한 Agent 인프라 필요.
2. AgentCore Runtime 선택 이유
- 기존 배포 옵션의 한계: Lambda의 15분 실행 시간 제한, EKS의 높은 운영 부담.
- AgentCore Runtime의 차별점:
- 세션별 microVM 격리: 독립된 환경 제공으로 대규모 동시 세션 안정적 처리.
- 소비 기반 과금: 실제 CPU 활성 시간만 과금하여 비용 효율성 증대.
- 프레임워크 및 모델 독립성: Strands-Agents SDK, LangGraph, CrewAI 등 다양한 프레임워크 및 LLM(Bedrock, Anthropic, OpenAI) 사용 가능.
3. UCMP Agent 아키텍처 및 핵심 컴포넌트
- Runtime: AgentCore Agent의 서버리스 실행 환경. 인프라 관리 부담 감소.
- Agent Framework: Strands-Agents SDK 사용. AWS 서비스와 네이티브 통합, Model-driven Agent 개발 지원.
- Tools (AWS MCP Servers): Cost Explorer, CloudTrail, Security Hub 등 AWS 공식 MCP Server 활용. Agent 코드와 함께 Runtime에 배포되어 확장성 용이.
- Observability: CloudWatch + Generative AI Observability Agent. Agent 동작 모니터링, Trace 시각화, 세션 추적, 에러 분석 기능 제공.
4. 구현 상세 및 운영 경험
- Agent 배포: @app.entrypoint 데코레이터 및
.bedrock_agentcore.yaml 설정 파일로 간편한 배포.
- Agent 개발: Strands SDK의
AgentTool 인터페이스를 통해 MCP Server를 도구로 등록. ReAct 패턴 기반 Agent 로직 구현.
- MCP Server 통합: Agent 프로젝트에 MCP Server 코드 직접 포함하여 버전 관리 및 배포 단순화. 동적 도구 발견 기능으로 확장성 확보.
- 운영 경험:
- 대규모 세션 처리 안정성 및 확장성 검증.
- 소비 기반 과금 모델을 통한 비용 효율성 확인.
- MCP Server 추가만으로 쉬운 기능 확장성.
- 완전 관리형 서비스로 인한 운영 편의성 및 Generative AI Observability를 통한 빠른 문제 해결.
5. 실제 활용 사례
- 변경 이력 추적: CloudTrail MCP Server로 주요 계정 변경 이벤트 모니터링.
- FinOps 리포트 자동화: Cost Explorer MCP Server로 비용 데이터 분석 및 맞춤 리포트 생성.
- 자연어 기반 트러블슈팅: CloudWatch Logs, X-Ray 등 연동하여 복잡한 문제 해결 지원.