T
TechInsights
목록으로
AI•2026. 03. 30.

클라우드 환경에서의 비디오 인텔리전스 구현: TwelveLabs로 시작하는 AI 영상 분석 3부 – Strands Agent를 활용한 Agentic video engine구현

AWS
AWS Engineering Team
AWS

핵심요약

원문 보기

AWS Strands Agents SDK를 활용하여 TwelveLabs 비디오 AI 모델과 AWS 서비스를 통합한 에이전틱 비디오 엔진 구축 방법을 소개합니다. AI 에이전트가 사용자의 자연어 요청을 이해하고 최적의 도구를 활용하여 영상을 분석하는 과정을 설명합니다.

Agentic Video Engine 구축: Strands Agents SDK 활용

본 글은 AWS Strands Agents SDK를 사용하여 TwelveLabs 비디오 AI 모델과 다양한 AWS 서비스를 통합한 에이전틱(Agentic) 비디오 엔진을 구축하는 과정을 단계별로 설명합니다. AI 에이전트가 사용자의 자연어 요청을 이해하고, 자체적으로 판단하여 최적의 도구와 서비스를 활용해 영상을 분석하는 고도화된 시스템 구축 방법을 소개합니다.

Strands Agents SDK 소개

  • 개념: AI 에이전트 개발 프레임워크로, 모델, 도구, 시스템 프롬프트 세 가지 핵심 요소로 구성됩니다.
  • 모델: LLM(Large Language Model)을 담당하며, Amazon Bedrock의 Claude, Nova 등을 지원합니다.
  • 도구(Tool): 에이전트가 실제 작업을 수행하는 함수로, API 호출, 데이터 처리 등 Python 함수로 구현 가능합니다.
  • 시스템 프롬프트(System Prompt): 에이전트의 역할과 행동 규칙을 정의합니다.
  • 에이전트 루프(Agent Loop): 사용자 요청 → LLM 추론 → 도구 선택/실행 → 결과 피드백 → 최종 응답으로 이어지는 반복적 추론-실행 과정을 통해 복잡한 작업을 처리합니다.
  • 에이전트 훅(Agent Hook): 에이전트 루프의 특정 단계에서 콜백 함수를 등록하여 로깅, 호출 제한 등 프로덕션 요구사항을 유연하게 적용합니다.

에이전틱 비디오 엔진 구축 단계

  1. 환경 설정 및 초기화: 필요한 라이브러리 설치 및 AWS 서비스 클라이언트 초기화.
  2. 도구(Tool) 만들기: @tool 데코레이터를 사용하여 비디오 임베딩 생성, 클립 검색, 영상 요약, 자막 생성 및 키워드 추출 기능을 Python 함수로 구현합니다.
    • 비디오 임베딩 생성: TwelveLabs Marengo 3.0 모델 활용, 영상 클립 분할 및 시각/음성 특징 벡터 변환.
    • 비디오 클립 검색: 텍스트 쿼리를 벡터로 변환 후 S3 Vectors에서 유사 클립 검색.
    • 영상 요약: TwelveLabs Pegasus 1.0 모델 활용, 프롬프트 기반 맞춤형 요약.
    • 자막 생성 및 키워드 추출: Amazon Transcribe로 음성 인식 후 Claude Haiku로 키워드 추출.
  3. 단일 에이전트 구성: 정의된 도구들을 하나의 에이전트에 연결하고, 시스템 프롬프트에 명확한 가이드라인 제공.
  4. 멀티 에이전트 아키텍처 (Agents as Tool): 복잡한 문제를 해결하기 위해 전문 에이전트들을 구성하고, 오케스트레이터 에이전트가 이를 조정하는 패턴을 적용합니다.
    • 각 도메인별 전문 에이전트 생성 및 도구 할당.
    • 전문 에이전트를 @tool로 래핑하여 오케스트레이터가 사용.
    • 최상위 오케스트레이터가 요청에 따라 적절한 전문 에이전트 호출.
  5. 실행 및 결과: 복합적인 영상 분석 요청을 오케스트레이터에 보내고 결과 확인.

결론

Strands Agents SDK는 TwelveLabs 비디오 AI 모델과 AWS 서비스를 통합하여 강력한 에이전틱 비디오 엔진을 구축하는 데 효과적인 프레임워크입니다. 이를 통해 사용자의 자연어 요청에 따라 지능적으로 영상을 분석하고 인사이트를 추출할 수 있습니다.

#AI#BigData
AWS
AWS

AWS Engineering Team

기술 인사이트를 전달하는 공식 채널

You might also like

View all
아이지에이웍스 AI 에이전트 클레어: Amazon Bedrock 기반 Text-to-SQL/Chart 에이전트로 이룬 데이터 분석 혁신

아이지에이웍스 AI 에이전트 클레어: Amazon Bedrock 기반 Text-to-SQL/Chart 에이전트로 이룬 데이터 분석 혁신

100년 가는 프론트엔드 코드, SDK

100년 가는 프론트엔드 코드, SDK