메인 콘텐츠로 건너뛰기
블로그컴퓨팅미디어 워크로드를 위한 VPU 및 GPU 벤치마킹

미디어 워크로드를 위한 VPU 및 GPU 벤치마킹

MP-56512_블로그 헤더 및 소셜 이미지 미디어 워크로드를 위한 VPU 및 GPU 벤치마킹_텍스트 포함 헤더 (1)

아카마이 클라우드는 최근 클라우드 가상 머신을 배포할 때 이 강력한 카드를 시간당 요금으로 사용할 수 있도록 NETINT의 T1U 쿼드라 비디오 처리 장치(VPU)를 지원한다고 발표했습니다. 이는 이미 Akamai 클라우드 포트폴리오에서 제공 중인 NVIDIA RTX™ 4000 Ada 세대 GPU에 추가되었습니다. 

실제 성능과 에너지 효율성을 평가하기 위해 2008년부터 스트리밍 업계의 선구적인 기업인 Cires21과 파트너십을 맺었습니다. NETINT와 NVIDIA 아키텍처 모두에 최적화된 C21 라이브 인코더를 사용하여 가장 처리하기 까다로운 동영상을 테스트 대상으로 삼아 까다로운 미디어 워크로드 전반에 걸쳐 VPU와 GPU를 벤치마킹했습니다. 

가장 까다로운 시나리오에서 VPU는 GPU보다 에너지 효율이 4.7배 더 높았으며 일부 시나리오에서는 심지어 NVIDIA 카드보다 성능이 더 뛰어난 것으로 나타났습니다. 일부 테스트에서는 GPU가 더 뛰어난 성능을 보였지만 항상 VPU보다 더 많은 전력을 사용했습니다. 

내년에 Scope 3 배출량을 계획하고 있거나 오늘날의 AI 환경에서 에너지 요구 사항으로 어려움을 겪고 있는 회사라면 VPU를 최우선적으로 테스트해야 합니다. 여기에서 VPU 활용에 대해 자세히 알아보세요. 

벤치마킹 설정

다음 구성을 사용하여 동일한 Akamai 클라우드 리전(프랑크푸르트)에서 각 테스트를 실행했습니다: 

  • 단일 GPU 인스턴스( NVIDIA RTX4000 Ada x1 Small 요금제 포함)
  • NETINT Quadra T1U x1 Small 요금제를 사용하는 단일 VPU
  • 두 인스턴스 모두 C21 라이브 인코더에 최적화된 도커 컨테이너를 실행했습니다. 하나는 CUDAGPU로, 다른 하나는 Libxcoder(VPU)로 실행했습니다.

H.264/AVC 코덱을 사용하는 일반적인 미디어 워크플로우의 인코딩 및 디코딩 부분을 측정하기 위해 카드에서 테스트를 수행했습니다. 

아래 표에서 적응형 비트레이트(ABR) 래더가 입력에서 1:N 방식으로 초당 60프레임으로 1080p, 720p, 576p, 432p, 360p로 동시 출력되는 것을 볼 수 있습니다. 표의 '최대 작업 수' 레이블은 각 인코더 구현이 실시간으로 실행할 수 있는 최대 동시 트랜스코딩 작업을 나타냅니다. 테스트에는 1080p 해상도의 6분짜리 원본 동영상이 사용되었습니다. 그런 다음 인코딩 워크로드는 이 비디오를 처리하고 대상 출력과 동일한 형식인 H.264/AVC로 다시 인코딩했습니다.

요약 표: 해상도별 트랜스코딩 작업 용량

해상도NETINT 최대 채용NVIDIA 최대 채용NETINT 와트NVIDIA 와트
1080p19161259
720p22241169
576p2025861
432p2128855
360p2030751
ABR681382

위의 데이터에서 볼 수 있듯이, GPU 더 낮은 해상도에서 더 높은 작업 용량을 제공하더라도 훨씬 더 많은 에너지를 사용했습니다. VPU는 거의 모든 해상도에서 더 나은 에너지 성능을 제공했으며, 특히 높은 처리량과 고해상도 워크로드에서 더욱 그러했습니다. 

아래 표에서는 1,000개의 동시 스트림이 1년 동안 지속적으로 실행될 때의 에너지 소비량을 추정했습니다(연간 8,760시간 사용).

표: 1년간 1,000개 스트림의 에너지 사용량 표

NETINT @ 1080p5,532,631.58KW 시간
GPU @ 1080p32,302,500.00KW 시간
NETINT @ ABR18,980,000.00KW 시간
GPU @ ABR89,790,000.00KW 시간

공급망 배출량을 줄이거나 특정 워크로드 시나리오에서 처리량을 늘리고자 하는 모든 조직에게 NETINT VPU는 훌륭한 솔루션이며 필요에 따라 Akamai에서 시간 단위로 사용할 수 있습니다. 

비디오 다방법 평가 융합(VMAF) 점수

물론 품질이 저하된다면 낮은 전력과 더 많은 처리량은 아무 소용이 없습니다. 아래에 포함된 VMAF 점수는 VPU가 여기서도 뛰어난 성능을 발휘한다는 것을 보여줍니다.

출력 정확도를 검증하기 위해 모든 출력에 대해 VMAP 테스트를 실행했습니다. 

위 그래프에서 테스트 결과는 NETINT Libxcoder와 NVIDIA 인코더가 생성한 고효율 비디오 코딩(HEVC)에 대한 VMAF 점수를 보여줍니다. 각 점수는 특정 출력 해상도에서 보고되며 괄호 안에 해당 비트레이트가 나열되어 있습니다. 이 점수는 비디오 품질에 대한 객관적인 척도를 제공하며, 각 인코더가 다양한 인코딩 설정에서 시각적 충실도를 얼마나 잘 보존하는지 비교할 수 있습니다.

다음 그래프(위)는 각 출력 해상도에서 NETINT Libxcoder와 NVIDIA 인코더의 AV1 VMAF 점수를 괄호 안에 해당 비트레이트와 함께 표시한 테스트 결과입니다. 이 점수는 AV1 코덱을 사용하여 비디오를 압축할 때 각 인코더가 얼마나 효과적으로 화질을 유지하는지를 나타내며, 해상도에 따른 효율성 및 화질 절충점의 차이를 강조합니다.

지금 Akamai 클라우드에서 사용 가능

NETINT의 처리 파이프라인을 최적화함으로써 VPU는 적은 전력으로 더 많은 작업을 수행할 수 있습니다. 측정된 최대 전력 사용량이 13와트인 NETINT Quadra T1U VPU는 성능과 품질 저하 없이 미디어 워크로드를 효율적으로 확장할 수 있음을 보여줍니다. 

1,000년 길이의 1080p 스트림에 대해 GPU VPU 기반 비디오 인코딩으로 마이그레이션하면 연간 에너지 소비량을 32MWh에서 5.5MWh로 줄여 26.5MWh를 절감할 수 있습니다. 이는 전 세계 평균 배출 계수를 가정할 때 연간 약 80%의 에너지 절감과 함께 연간 약 12.6톤의 CO₂ 배출량 감소를 의미합니다. 

NETINT VPU 카드를 사용해보고 싶으시다면 지금 바로 Akamai Cloud에서 시간당 요금으로 이용할 수 있습니다. 

가속화된 컴퓨팅 요금제를 통해 필요에 따라 NETINT VPU 또는 NVIDIA GPU를 배포하거나 Cires21의 C21 라이브 인코더를 사용하여 설정을 간소화하고 GPU 및 VPU 인프라의 효율성을 극대화할 수 있습니다.

추천 사항

내용

댓글 남기기

이메일 주소는 게시되지 않습니다. 필수 필드가 표시됩니다 *