Amazon SageMaker HyperPod로 슈퍼브에이아이의 비전 파운데이션 모델 ‘ZERO’ 효율적으로 대규모 분산 학습하기
슈퍼브에이아이가 Amazon SageMaker HyperPod를 사용하여 비전 파운데이션 모델 'ZERO'의 대규모 분산 학습을 효율적으로 진행한 경험을 공유합니다. 이 글은 SageMaker HyperPod의 유연성, FSx for Lustre 연동, Training Plan 활용, 그리고 트레이닝 리허설을 통한 문제 해결 및 비용 최적화 과정을 상세히 다룹니다.