A Akamai Cloud introduziu recentemente o suporte às unidades de processamento de vídeo (VPUs) T1U Quadra da NETINT, tornando essas poderosas placas disponíveis a uma taxa horária ao implantar máquinas virtuais em nuvem. Elas se juntam às GPUsNVIDIA RTX™ 4000 Ada Generation já oferecidas no portfólio do Akamai Cloud.
Para avaliar o desempenho no mundo real e a eficiência energética, fizemos uma parceria com a Cires21, uma empresa pioneira no setor de streaming desde 2008. Usando o C21 Live Encoder, otimizado para as arquiteturas NETINT e NVIDIA , comparamos VPUs e GPUs em cargas de trabalho de mídia exigentes, usando alguns dos vídeos mais desafiadores para processar como objeto de teste.
Descobrimos que, nos cenários mais exigentes, as VPUs tinham uma eficiência energética 4,7 vezes maior do que as GPUs e, em alguns cenários, até mesmo superavam as placas NVIDIA . As GPUs brilharam em alguns testes, mas sempre usaram mais energia do que as VPUs.
Se você estiver em uma empresa planejando suas emissões de Escopo 3 para o próximo ano, ou apenas lutando com os requisitos de energia no cenário atual de IA, as VPUs devem estar no topo da sua lista de testes. Você pode saber mais sobre como aproveitar as VPUs aqui.
Configuração de benchmarking
Executamos cada teste na mesma região da Akamai Cloud (Frankfurt) usando as seguintes configurações:
- Uma única GPU instância com o plano NVIDIA RTX4000 Ada x1 Small
- Uma única VPU com o plano NETINT Quadra T1U x1 Small
- As duas instâncias executaram contêineres do Docker otimizados para o C21 Live Encoder: uma com CUDAGPU) e a outra com Libxcoder (VPU)
Os testes foram realizados nas placas para medir as partes de codificação e decodificação de um fluxo de trabalho de mídia típico usando o codec H.264/AVC.
Na tabela abaixo, você pode ver que uma escada de taxa de bits adaptável (ABR) foi gerada com saída simultânea em 1080p, 720p, 576p, 432p e 360p, todos a 60 quadros por segundo, de forma 1:N a partir da entrada. O rótulo "Max Jobs" na tabela indica o máximo de trabalhos de transcodificação simultâneos que cada implementação de codificador pode executar em tempo real. O teste usou um vídeo bruto de 6 minutos com resolução de 1080p. Em seguida, a carga de trabalho de codificação processou esse vídeo e o recodificou no mesmo formato, H.264/AVC, como saída de destino.
Tabela de resumo: Capacidade de trabalho de transcodificação por resolução
| Resolução | Empregos no NETINT Max | Empregos NVIDIA Max | Watts NETINT | Watts NVIDIA |
| 1080p | 19 | 16 | 12 | 59 |
| 720p | 22 | 24 | 11 | 69 |
| 576p | 20 | 25 | 8 | 61 |
| 432p | 21 | 28 | 8 | 55 |
| 360p | 20 | 30 | 7 | 51 |
| ABR | 6 | 8 | 13 | 82 |
Como você pode ver em nossos dados acima, mesmo quando a GPU forneceu maior capacidade de trabalho em resoluções mais baixas, ela o fez com uma energia significativamente maior. As VPUs ofereceram melhor desempenho energético em quase todas as resoluções, especialmente em cargas de trabalho de alto rendimento e alta resolução.
Na tabela abaixo, estimamos o consumo de energia para 1.000 fluxos simultâneos em execução contínua durante um ano (usando 8.760 horas em um ano).
Tabela: Uso de energia para 1.000 fluxos durante 1 ano
| NETINT @ 1080p | 5,532,631.58 | Horas KW |
| GPU @ 1080p | 32,302,500.00 | Horas KW |
| NETINT @ ABR | 18,980,000.00 | Horas KW |
| GPU @ ABR | 89,790,000.00 | Horas KW |
Para qualquer organização que esteja buscando reduzir as emissões da cadeia de suprimentos ou até mesmo aumentar a taxa de transferência em determinados cenários de carga de trabalho, as VPUs NETINT são uma ótima solução e estão disponíveis a cada hora na Akamai, conforme necessário.
Pontuações do Video Multimethod Assessment Fusion (VMAF)
Obviamente, menos energia e mais produtividade não são nada se você sacrificar a qualidade. As pontuações do VMAF incluídas abaixo mostram que as VPUs também fazem um ótimo trabalho aqui.
Para validar a precisão dos resultados, executamos testes VMAP em todos os resultados.

No gráfico acima, os resultados de nossos testes mostram as pontuações VMAF para codificação de vídeo de alta eficiência (HEVC) produzida pelo NETINT Libxcoder e pelo NVIDIA Encoder. Cada pontuação é relatada em uma resolução de saída específica, com a taxa de bits correspondente listada entre parênteses. Essas pontuações fornecem uma medida objetiva da qualidade do vídeo, o que nos permite comparar o quanto cada codificador preserva a fidelidade visual em diferentes configurações de codificação.

No próximo gráfico (acima), os resultados de nossos testes mostram as pontuações AV1 VMAF para o NETINT Libxcoder e o NVIDIA Encoder em cada resolução de saída, com as taxas de bits correspondentes mostradas entre parênteses. Essas pontuações indicam a eficácia com que cada codificador mantém a qualidade visual ao compactar vídeo usando o codec AV1, destacando as diferenças de eficiência e as trocas de qualidade entre as resoluções.
Disponível agora na Akamai Cloud
Ao otimizar o pipeline de processamento no NETINT, as VPUs são muito capazes de fazer mais com menos. Com pico de uso de energia medido de 13 watts, as VPUs NETINT Quadra T1U mostram que é possível dimensionar cargas de trabalho de mídia de forma eficiente sem comprometer o desempenho e a qualidade.
A migração da codificação de vídeo baseada em GPU para a codificação baseada em VPU para 1.000 fluxos de 1080p com duração de um ano poderia reduzir o consumo anual de energia de 32 MWh para apenas 5,5 MWh - uma economia de 26,5 MWh. Isso se traduz em aproximadamente 80% de economia anual de energia, juntamente com uma redução de cerca de 12,6 toneladas de emissões de CO₂ por ano, supondo um fator de emissões médio global.
Se você quiser experimentar essas placas NETINT VPU, elas estão disponíveis hoje na Akamai Cloud a uma taxa por hora.
Implante VPUs NETINT ou GPUs NVIDIA sob demanda com o nosso plano Accelerated Compute ou use o C21 Live Encoder da Cires21 para simplificar a configuração e maximizar a eficiência com a infraestrutura de GPU e VPU.

Comentários