1. Hardware
  2. NVIDIA
  3. Bis zu 50-fache Beschleunigung von HPC-Anwendungen

Bis zu 50-fache Beschleunigung von HPC-Anwendungen

Nvidia hat mit dem Tesla P100 einen neuartigen GPU-Beschleuniger für PCIe-Server vorgestellt. Durch die höhere Performance im Vergleich zu CPU-basierten Systemen erreichen Anwender mit dem GPU-Beschleuniger eine erhebliche Leistungssteigerung für das Rechenzentrum.

Gerade Forschungseinrichtungen haben häufig keinen vollwertigen Zugriff auf Super-Computing-Systeme. Hinzu kommt der Trend, dass immer mehr High-Performance-Computing-Technologien benötigt werden, um rechenintensive Anwendungen wie Deep Learning, Simulationen oder Virtual Reality auszubauen und so die Forschung im Bereich künstlicher Intelligenz zu fördern.

Mit dem Tesla P100 will der Hersteller die gestiegenen Rechenanforderungen mit der hohen Performance der Nividia-Pascal-GPU-Architektur erfüllen. So ermöglicht die neue Technologie die Entwicklung von „Superknoten“, die laut Testangaben von Nvidia den Durchsatz von mehr als 32 herkömmlichen CPU-basierten Rechenknoten bei bis zu 70 Prozent geringeren Kosten erlauben.

Anwendungen für künstliche Intelligenz voranbringen

Der Tesla P100 wird im PCIe-Standardformat angeboten und ist mit aktuellen GPU-beschleunigten Servern kompatibel. Diese wurde optimiert, um die rechenintensivsten Anwendungen für künstliche Intelligenz und HPC-Rechenzentren weiterentwickeln zu können. Ein einziger mit dem Tesla P100 beschleunigter Server liefert eine höhere Leistung als 50 einzelne CPU-Serverknoten bei Ausführung des Molekular-Dynamik-Codes von Amber (gemäß Simulations on SDSU Comet Supercomputer) und ist laut Testangaben schneller als 32 CPU-Knoten bei Ausführung der VASP-Materialwissenschaftsanwendung.

Noch in diesem Jahr sollen die Tesla-P100-Beschleuniger für PCIe, die die Tesla Accelerated Computing Platform von Nvidia erweitern, im Rahmen eines Upgrades in Europas schnellstem Supercomputer, dem Piz-Daint-System im Swiss National Supercomputing Center in Lugano, zum Einsatz kommen.

Leistung des Systems mehr als verdoppelt

„Tesla-P100-Beschleuniger bieten neue Ebenen an Leistung und Effizienz, um einige der wichtigsten Rechenherausforderungen unserer Zeit meistern zu können“, erklärt Thomas Schulthess, Professor für Computational Physics an der ETH Zürich und Direktor des Swiss National Supercomputing Center. Er ist überzeugt, dass das Upgrade von 4.500 GPU-beschleunigten Rechenknoten in dem Piz-Daint-System zu den Tesla-P100-GPUs die Leistung des Systems mehr als verdoppeln werde und somit Durchbrüche in Anwendungsbereichen wie Kosmologie, Materialwissenschaften, Seismologie und Klimawissenschaften ermöglichen werde.

 

Der Tesla P100 für PCIe bietet folgende Features:

NVIDIA Tesla GPU-Beschleuniger

Hohe Anwendungs-Performance für gemischte HPC-Workloads: Sie bietet 4,7 Teraflops Double-Precision- beziehungsweise 9,3 Teraflops Single-Precision-Peak-Performance. Ein einziger Pascal-basierter Tesla-P100-Rechenknoten bietet die Leistung von mehr als 32 herkömmlichen CPU-Servern.

  • CoWoS mit HBM2 für hohe Effizienz: Der Tesla P100 vereint Prozessor und Daten in einem Produkt, um eine unerreichte Recheneffizienz zu bieten. Ein innovativer Ansatz im Memory-Design namens „Chip on Wafer on Substrate (CoWoS) mit HBM2“ bietet eine Verdreifachung der Memory-Bandbreite-Performance und eine Steigerung um 720 GB/s, verglichen mit der Maxwell-Architektur von Nvidia.
  • Page Migration Engine für vereinfachtes paralleles Programmieren: Sie ermöglicht Entwicklern, sich auf die Leistungsoptimierung zu konzentrieren und nicht mehr auf die Verwaltung von Datenbewegungen zu achten. Außerdem erlaubt es, Anwendungen mit der Unterstützung von virtuellem Memory-Paging über die physische Memory-Größe der GPU hinaus zu betreiben. Die vereinte Memory-Technologie verbessert die Produktivität, indem Entwickler nun in die Lage versetzt werden, den Memory-Speicher eines Knotens auf einen Blick zu sehen.
  • Leistungsfähige Anwendungsunterstützung: Mit 410 GPU-beschleunigten Anwendungen, einschließlich neun der Top-10-HPC-Anwendungen, zählt die Tesla-Plattform zu den weltweit führenden HPC-Rechenplattformen.

 

Die Spezifikationen der Tesla P100 für PCIe im Überblick:

  • 4,7 Teraflops Double-Precision-Performance, 9,3 Teraflops Single-Precision-Performance und 18,7 Teraflops Half-Precision-Performance mit der NVIDIA-GPU-BOOST-Technologie   
  • Unterstützung für PCIe Gen 3-Interconnect (32 GB/s bidirektionale Bandbreite)  Erweiterte Programmierbarkeit mit Page Migration Engine und vereintem Memory
  • ECC-Schutz für höhere Zuverlässigkeit
  • Server-optimiert für höchste Datendurchsätze in Rechenzentren

Die Tesla P100 für PCIe-basierte Systeme ist in zwei Konfigurationen erhältlich: mit 16 GB CoWoS HBM2 Stacked Memory für 720GB/Sek Memory-Bandbreite und mit 12GB CoWoS HBM2 Stacked Memory, für 540GB/Sek Memory-Bandbreite. Laut Nvidia wird der Tesla P100 voraussichtlich zu Beginn des vierten Quartals 2016 verfügbar sein.