KI-Beschleuniger für Server mit XDNA-Technik des AMD Ryzen 7040U

Computex | 30.05.2023 17:37 Uhr Christof Windeck

Gigabyte packt 16 KI-Inferencing-Beschleuniger vom Typ AMD Alveo V70 mit XDNA-Technik in einen Rackserver. Die Karten sollen Video- und Sprachdaten analysieren.

Für die Echtzeitanalyse von Videos oder auch zur Sprachverarbeitung im Rechenzentrum brauchen Server schnelle und effiziente KI-Inferencing-Beschleuniger. AMD hatte schon zur CES den Alveo V70 angekündigt, den es als PCIe-Karte der 75-Watt-Klasse gibt. Auf der Computex zeigte Gigabyte einen Server mit zwei AMD Epyc 9004, der bis zu 16 dieser Alveo-V70-Beschleuniger aufnimmt. Jede Karte liefert laut AMD/Xilinx bis zu 202 BFloat16-Tera-OPS (202 TOps) und bei INT8 sogar 404 TOps.

Rackserver von Gigabyte für zwei AMD Epyc 9004, 24 DIMMs und bis zu 16 Alveo-V70-Karten (oben)

(Bild: c’t-Magazin)

Als Programmierschnittstelle stellt AMD/Xilinx via GitHub das Unified Inference Frontend (UIF) 1.1 [1] bereit, das Machine-Learning-Frameworks wie ONNX, PyTorch, TensorFlow und Windows ML optimal an die Hardware anbinden soll. Für die Zukunft ist der AMD Unified AI Stack 2.0 geplant.

XDNA-Technik auch im Mobilprozessor Ryzen 7040U

Während die meisten Smartphone-Chips bereits KI-Inferencing-Beschleuniger wie Apples Neural Engine (ANE) enthalten, kommen solche Einheiten bei x86-Prozessoren von AMD und Intel erst auf den Markt. Allerdings beherrschen die AVX-Einheiten moderner x86-CPUs KI-Befehle wie VNNI und die GPU-Shader integrierter Grafikprozessoren lassen sich ebenfalls fürs Inferencing einspannen.

Doch erst mit Intel Meteor Lake [2] und AMD Ryzen 7040U alias Phoenix [3] kommen x86-Mobilprozessoren mit dedizierten KI-Einheiten, die Intel VPU nennt und AMD "Ryzen AI" beziehungsweise XDNA. Das "X" bezieht sich auch auf die zugekaufte FPGA-Sparte Xilinx, die die "Versal AI Cores" seit einigen Jahren [4] entwickelt.

Microsoft arbeitet an der Integration von Machine-Learning-Beschleunigern ins Betriebssystem Windows und stellte dazu vor 5 Jahren die API Windows ML (WinML) [5] mit ONNX [6] vor. In Windows 11 sind beispielsweise die Windows Studio Effects zur Echtzeitverarbeitung von Webcam-Bildern enthalten, die WinML/DirectML nutzen.

(ciw [8])

URL dieses Artikels:
https://www.heise.de/-9069495

Links in diesem Artikel:
[1] https://github.com/amd/UIF
[2] https://www.heise.de/news/Meteor-Lake-Naechste-Generation-von-Intel-CPUs-bekommt-KI-Einheit-9068431.html
[3] https://www.heise.de/news/Ryzen-7040U-AMD-feuert-gegen-Apple-und-Intel-8987198.html
[4] https://www.heise.de/news/Xilinx-ACAP-Neue-Chipgeneration-fordert-Prozessoren-und-GPUs-heraus-3998011.html
[5] https://www.heise.de/news/Windows-ML-Machine-Learning-KI-fuer-den-PC-3988415.html
[6] https://www.heise.de/news/Machine-Learning-ONXX-Runtime-1-2-funktioniert-jetzt-mit-WinML-4684251.html
[7] https://www.heise.de/ct/
[8] mailto:ciw@ct.de