Akamai Cloud hat vor kurzem die Unterstützung von NETINTs T1U Quadra Video Processing Units (VPUs) eingeführt, wodurch diese leistungsstarken Karten bei der Bereitstellung von virtuellen Maschinen in der Cloud zu einem Stundensatz verfügbar sind. Sie ergänzen die NVIDIA RTX™ 4000 Ada Generation GPUs, die bereits im Akamai Cloud Portfolio angeboten werden.
Um die Leistung und Energieeffizienz in der Praxis zu bewerten, haben wir uns mit Cires21 zusammengetan, einem Pionierunternehmen in der Streaming-Branche seit 2008. Mit dem C21 Live Encoder, der sowohl für NETINT- als auch für NVIDIA optimiert ist, haben wir VPUs und GPUs in anspruchsvollen Medien-Workloads getestet und dabei einige der anspruchsvollsten Videos als Testobjekte verwendet.
Wir fanden heraus, dass die VPUs in den anspruchsvollsten Szenarien eine 4,7-fach höhere Energieeffizienz als die GPUs hatten und in einigen Szenarien sogar die NVIDIA übertrafen. Die GPUs konnten zwar in einigen Tests glänzen, aber sie verbrauchten immer mehr Strom als die VPUs.
Wenn Sie in einem Unternehmen sind, das seine Scope-3-Emissionen für das kommende Jahr plant, oder einfach mit den Energieanforderungen in der heutigen KI-Landschaft zu kämpfen haben, sollten VPUs ganz oben auf Ihrer Testliste stehen. Mehr über die Nutzung von VPUs erfahren Sie hier.
Benchmarking-Einrichtung
Wir haben jeden Test in derselben Akamai Cloud-Region (Frankfurt) mit den folgenden Konfigurationen durchgeführt:
- Eine einzelne GPU Instanz mit der NVIDIA RTX4000 Ada x1 Small Plan
- Eine einzelne VPU mit dem NETINT Quadra T1U x1 Small Plan
- Beide Instanzen führten optimierte Docker-Container für C21 Live Encoder aus: eine mit CUDAGPU) und die andere mit Libxcoder (VPU)
Es wurden Tests mit den Karten durchgeführt, um die Kodierungs- und Dekodierungsteile eines typischen Medienworkflows mit dem H.264/AVC-Codec zu messen.
In der nachstehenden Tabelle sehen Sie, dass eine Leiter mit adaptiver Bitrate (ABR) mit gleichzeitiger Ausgabe in 1080p, 720p, 576p, 432p und 360p, alle mit 60 Bildern pro Sekunde, imVerhältnis 1:N von der Eingabe erzeugt wurde. Die Bezeichnung "Max Jobs" in der Tabelle gibt die maximale Anzahl an gleichzeitigen Transcodierungsaufträgen an, die jede Encoder-Implementierung in Echtzeit ausführen konnte. Für den Test wurde ein 6-minütiges Rohvideo mit einer Auflösung von 1080p verwendet. Der Kodierungs-Workload verarbeitete dann dieses Video und kodierte es erneut in dasselbe Format, H.264/AVC, wie die Zielausgabe.
Zusammenfassende Tabelle: Transkodierauftragskapazität nach Auflösung
| Auflösung | NETINT Max Arbeitsplätze | NVIDIA Max Jobs | NETINT Watts | NVIDIA Watts |
| 1080p | 19 | 16 | 12 | 59 |
| 720p | 22 | 24 | 11 | 69 |
| 576p | 20 | 25 | 8 | 61 |
| 432p | 21 | 28 | 8 | 55 |
| 360p | 20 | 30 | 7 | 51 |
| ABR | 6 | 8 | 13 | 82 |
Wie Sie aus unseren obigen Daten ersehen können, hat die GPU zwar eine höhere Auftragskapazität bei niedrigeren Auflösungen, dafür aber auch einen deutlich höheren Energieverbrauch. VPUs boten bei fast jeder Auflösung eine bessere Energieleistung, insbesondere bei Arbeitslasten mit hohem Durchsatz und hohen Auflösungen.
In der nachstehenden Tabelle haben wir den Energieverbrauch für 1.000 gleichzeitige Streams geschätzt, die ein Jahr lang ununterbrochen laufen (bei 8.760 Stunden im Jahr).
Tabelle: Energieverbrauch für 1.000 Ströme für 1 Jahr
| NETINT @ 1080p | 5,532,631.58 | KW Stunden |
| GPU @ 1080p | 32,302,500.00 | KW Stunden |
| NETINT @ ABR | 18,980,000.00 | KW Stunden |
| GPU @ ABR | 89,790,000.00 | KW Stunden |
Für Unternehmen, die ihre Emissionen in der Lieferkette reduzieren oder sogar ihren Durchsatz in bestimmten Workload-Szenarien erhöhen möchten, sind die NETINT VPUs eine großartige Lösung und je nach Bedarf stundenweise bei Akamai erhältlich.
Video Multimethod Assessment Fusion (VMAF) Ergebnisse
Natürlich sind ein geringerer Stromverbrauch und ein höherer Durchsatz nichts wert, wenn man dafür die Qualität opfert. Die unten aufgeführten VMAF-Bewertungen zeigen, dass die VPUs auch hier gute Arbeit leisten.
Um die Genauigkeit der Ausgabe zu überprüfen, haben wir VMAP-Tests für alle Ausgaben durchgeführt.

In der obigen Grafik sind die VMAF-Ergebnisse für die hocheffiziente Videokodierung (HEVC) mit dem NETINT Libxcoder und dem NVIDIA Encoder dargestellt. Jeder Wert wird für eine bestimmte Ausgangsauflösung angegeben, wobei die entsprechende Bitrate in Klammern aufgeführt ist. Diese Werte stellen ein objektives Maß für die Videoqualität dar und ermöglichen es uns zu vergleichen, wie gut jeder Encoder die visuelle Wiedergabetreue bei verschiedenen Codierungseinstellungen bewahrt.

Im nächsten Diagramm (oben) zeigen unsere Testergebnisse die AV1 VMAF-Werte für den NETINT Libxcoder und den NVIDIA Encoder bei jeder Ausgangsauflösung, wobei die entsprechenden Bitraten in Klammern angegeben sind. Diese Werte zeigen an, wie effektiv jeder Encoder die visuelle Qualität bei der Komprimierung von Videos mit dem AV1-Codec beibehält, und heben die Unterschiede bei der Effizienz und den Qualitätskompromissen zwischen den Auflösungen hervor.
Jetzt in der Akamai Cloud verfügbar
Durch die Optimierung der Verarbeitungspipeline von NETINT sind die VPUs in der Lage, mit weniger mehr zu leisten. Mit einem gemessenen Spitzenverbrauch von 13 Watt zeigen die NETINT Quadra T1U VPUs, dass Sie Medien-Workloads effizient skalieren können, ohne Kompromisse bei Leistung und Qualität einzugehen.
Die Umstellung von GPU auf VPU-basierte Videokodierung für 1.000 1080p-Streams pro Jahr könnte den jährlichen Energieverbrauch von 32 MWh auf nur 5,5 MWh senken - eine Einsparung von 26,5 MWh. Dies entspricht einer jährlichen Energieeinsparung von etwa 80 % und einer Verringerung der CO₂-Emissionen um etwa 12,6 Tonnen pro Jahr, wenn man von einem globalen durchschnittlichen Emissionsfaktor ausgeht.
Wenn Sie diese NETINT VPU-Karten ausprobieren möchten, sind sie ab sofort in der Akamai Cloud zu einem Stundensatz verfügbar.
Setzen Sie NETINT VPUs oder NVIDIA GPUs nach Bedarf mit unserem Accelerated Compute Plan ein oder verwenden Sie den C21 Live Encoder von Cires21, um die Einrichtung zu optimieren und die Effizienz der GPU und VPU-Infrastruktur zu maximieren.

Kommentare