Akamai Cloud は最近、NETINT の T1U Quadra ビデオ・プロセッシング・ユニット(VPU)のサポートを導入し、クラウド仮想マシンのデプロイ時にこれらの強力なカードを時間単位の料金で利用できるようになりました。これらは、アカマイのクラウドポートフォリオですでに提供されているNVIDIA RTX™ 4000 Ada Generation GPUに加わるものです。
実際のパフォーマンスとエネルギー効率を評価するために、2008年以来ストリーミング業界のパイオニア企業であるCires21社と提携しました。NETINTとNVIDIA 両アーキテクチャに最適化された同社のC21 Live Encoderを使用し、最も処理困難なビデオをテスト対象として、要求の厳しいメディアワークロードにわたってVPUとGPUのベンチマークを行いました。
最も負荷の高いシナリオでは、VPUはGPUよりもエネルギー効率が4.7倍高く、いくつかのシナリオではNVIDIA カードをも上回ることがわかった。GPUはいくつかのテストでは輝いたが、常にVPUよりも多くの電力を消費していた。
来年度のスコープ3排出量を計画している企業や、今日の人工知能 状況におけるエネルギー要件に頭を悩ませている企業は、VPUをテストすべきリストのトップに挙げるべきである。VPUの活用については、こちらをご覧ください。
ベンチマーク設定
同じ Akamai Cloud リージョン(フランクフルト)で、以下の設定を使用して各テストを実施しました:
- シングル GPUNVIDIA RTX4000 Ada x1スモールプランのインスタンス
- NETINT Quadra T1U x1スモールプランのシングルVPU
- 両方のインスタンスで、C21 Live Encoder用に最適化されたDockerコンテナが実行された:1つはCUDAGPU、もう1つはLibxcoder(VPU)。
H.264/AVCコーデックを使用した典型的なメディアワークフローのエンコードおよびデコード部分を測定するために、このカードでテストが行われた。
下の表では、アダプティブ・ビットレート(ABR)ラダーが、1080p、720p、576p、432p、360pで同時に出力され、すべて60フレーム/秒で入力から1:N方式で生成されたことがわかります。表中の「Max Jobs」ラベルは、各エンコーダーの実装がリアルタイムで実行できる最大同時トランスコードジョブを示している。このテストでは、解像度1080pの6分間の生動画を使用した。エンコーディングワークロードはこのビデオを処理し、ターゲット出力と同じフォーマットであるH.264/AVCに再エンコードした。
要約表:解像度別トランスコードジョブ容量
| 決議 | NETINT Maxの仕事 | NVIDIA 求人 | NETINTワット | NVIDIA |
| 1080p | 19 | 16 | 12 | 59 |
| 720p | 22 | 24 | 11 | 69 |
| 576p | 20 | 25 | 8 | 61 |
| 432p | 21 | 28 | 8 | 55 |
| 360p | 20 | 30 | 7 | 51 |
| 利用可能ビットレート | 6 | 8 | 13 | 82 |
上記のデータからわかるように、GPU 低解像度でより高いジョブ容量を提供する場合でも、GPUはより大きなエネルギーでそれを行いました。VPUは、特に高スループットと高解像度のワークロードにおいて、ほぼすべての解像度でより優れたエネルギー性能を提供しました。
下表では、1,000本の同時ストリームを1年間連続運転した場合のエネルギー消費量を試算した(1年間で8,760時間を使用)。
表1,000ストリームの1年間のエネルギー使用量
| NETINT @ 1080p | 5,532,631.58 | KW時間 |
| GPU @ 1080p | 32,302,500.00 | KW時間 |
| NETINT @ ABR | 18,980,000.00 | KW時間 |
| GPU @ ABR | 89,790,000.00 | KW時間 |
サプライチェーンの排出量を削減したい、あるいは特定のワークロードシナリオにおけるスループットを向上させたいとお考えの企業にとって、NETINT VPU は素晴らしいソリューションであり、必要に応じてアカマイから時間単位で提供されます。
ビデオ・マルチメソッド・アセスメント・フュージョン(VMAF)スコア
もちろん、低電力と高スループットは、品質を犠牲にすれば何の意味もない。以下に掲載したVMAFのスコアは、VPUがここでも素晴らしい仕事をしていることを示している。
出力の精度を検証するため、すべての出力に対してVMAPテストを実施した。

上のグラフでは、NETINT LibxcoderとNVIDIA Encoderによる高効率ビデオコーディング(HEVC)のVMAFスコアを示しています。各スコアは、特定の出力解像度で報告されており、対応するビットレートが括弧内に記載されています。これらのスコアは、ビデオ品質の客観的な尺度を提供し、異なるエンコーディング設定において各エンコーダーがどの程度視覚的忠実度を保持するかを比較することを可能にします。

次のグラフ(上)では、NETINT LibxcoderとNVIDIA Encoderの各出力解像度におけるAV1 VMAFスコアを示しています。これらのスコアは、AV1コーデックを使用してビデオを圧縮する際に、各エンコーダーがどの程度効率的にビジュアル品質を維持できるかを示しており、解像度による効率と品質のトレードオフの違いを強調しています。
アカマイのクラウドで利用可能に
NETINTの処理パイプラインを最適化することで、VPUはより少ない電力でより多くの処理を行うことができます。測定されたピーク消費電力は13ワットで、NETINT Quadra T1U VPUは、パフォーマンスと品質に妥協することなく、メディアワークロードを効率的に拡張できることを示しています。
1,000年分の1080pストリームをGPUVPUベースのビデオエンコーディングに移行することで、年間エネルギー消費量を32MWhからわずか5.5MWhに削減できる。これは、世界平均の排出係数を仮定した場合、年間約12.6トンのCO₂排出量の削減とともに、年間エネルギーの約80%の節約につながります。
これらの NETINT VPU カードを試したい場合は、本日より Akamai Cloud で時間単位の料金でご利用いただけます。
また、Cires21のC21 Live Encoderを使用すれば、セットアップを合理化し、GPU VPUのインフラ効率を最大化することができます。

コメント