Websites

Nvidia präsentiert Fermi-Architektur der nächsten Generation

GTX 1180 - CONFIRMED?! Going 7nm?!

GTX 1180 - CONFIRMED?! Going 7nm?!
Anonim

Nvidia hat möglicherweise seine NVISION-Werbung umbenannt Konferenz zur "GPU Technology Conference", aber es ist immer noch eine Nvidia-Show durch und durch. CEO Jen-Hsun Huang hat sich während seiner Keynote einige Zeit genommen, um die nächste große GPU-Architektur des Unternehmens mit dem Codenamen "Fermi" zu enthüllen. Dies ist der Chip-Grafik-Fans haben GT300, der Generationsnachfolger des GT200-Chip, der Karten wie die GeForce GTX 285 antreibt.

Der Chip-Riese war sehr vorsichtig, den Chip als kein neuer Grafikchip, sondern ein neues zu positionieren " berechne und Grafiken" Chip, in dieser Reihenfolge (kursiv meins). In der Tat bezieht sich fast alles, was über den neuen Chip offenbart wird, eher auf seine Rechenfunktionen als auf herkömmlich grafikorientierte Daten wie Textureinheiten und Renderback-Enden. Was wir wissen ist, dass der Chip bei schätzungsweise 3,0 Milliarden Transistoren riesig ist und bei TSMC in einem 40-nm-Prozess hergestellt wird. Das sind etwa 40 Prozent mehr Transistoren als der RV870-Chip der neuen DirectX-11-Karten der Radeon-5800-Serie, die gerade vom Rivalen AMD veröffentlicht wurden. Der Chip hat 512 Verarbeitungseinheiten (Nvidia nennt sie CUDA-Kerne), die in 16 "Streaming-Multiprozessoren" mit jeweils 32 Kernen organisiert sind. Dies ist mehr als das Doppelte der 240 Kerne in GT200, und die Kerne haben außerdem bedeutende Verbesserungen. Der Chip wird eine 384-Bit-GDDR5-Speicherschnittstelle verwenden.

Hier sind einige der wichtigsten Aufzählungspunkte:

Streaming-Multiprozessor (SM)

  • 32 CUDA-Kerne pro SM, 4x über GT200
  • 8x die doppelte Gleitkomma-Gleitkomma-Performance über GT200
  • Dual Warp Scheduler, der zwei Warps mit 32 Threads terminiert und löst
  • pro Takt
  • 64 KB RAM mit einer konfigurierbaren Partitionierung von Shared Memory und L1-Cache

Second Generierung parallele Threadausführung ISA

  • Einheitlicher Adressraum mit vollständiger C ++ - Unterstützung
  • Optimiert für OpenCL und DirectCompute
  • Vollständig IEEE 754-2008 32-Bit- und 64-Bit-Genauigkeit
  • Vollständiger 32-Bit-Integerpfad mit 64 -Bit-Erweiterungen
  • Speicherzugriffsanweisungen zur Unterstützung des Übergangs zur 64-Bit-Adressierung
  • Verbesserte Leistung durch Predication

Verbessertes Speichersubsystem

  • NVIDIA Parallele DataCache-Hierarchie mit konfigurierbarem L1 und Unified L2
  • Caches
  • Erste GPU mit ECC-Speicherunterstützung
  • Stark verbesserte atomare Speicheroperation Leistung

NVIDIA GigaThread Engine

  • 10x schnellerer Wechsel des Anwendungskontextes
  • Concurrent Kernelausführung
  • Out of Order Threadblockausführung
  • Dual Overlapped Memory Transfer Engines

Es gibt viele zusätzliche Funktionen, die verbessert werden sollten die Leistung dieses Chips in Stream-Computing-Aufgaben, wie viel schneller Doppelpunkt-Gleitkommaberechnungsrate. Aktuelle Nvidia-GPUs berechnen die doppelte Genauigkeit mit einem Bruchteil der Geschwindigkeit von Operationen mit einfacher Genauigkeit. Gleitkommaoperationen mit doppelter Genauigkeit sollten jetzt die halbe Leistung von einfacher Genauigkeit erreichen, was eine enorme Verbesserung darstellt. Große Verbesserungen bei der Zwischenspeicherung und Planung sind ebenfalls offensichtlich. Sie können mehr über die Architektur auf Nvidias neuer Fermi-Seite lesen, die ein PDF-Whitepaper enthält.

Wann können Sie also eine Grafikkarte kaufen, die diesen Chip verwendet? Nvidia sagt das nicht. Unternehmensvertreter haben gesagt, dass sie derzeit den Chip auf den Markt bringen, was bedeutet, dass Arbeitsproben erst kürzlich aus der Fabrikationsanlage zurückkommen. Wenn wir aus der Vergangenheit eine fundierte Vermutung ableiten, würden wir sagen, der Dezember ist ein optimistisches Veröffentlichungsdatum, und das erste Quartal 2010 für eine breite Verfügbarkeit ist wahrscheinlicher. Erwarten Sie, dass Boards teuer sind. Nvidia wird die Chipgröße nicht preisgeben, aber nach der Anzahl der Transistoren schätzen wir zwischen 450 und 500 mm 2 . In Verbindung mit den zusätzlichen Kosten einer 384-Bit-Speicherschnittstelle und den Herausforderungen, die sich aus dem relativ neuen 40-nm-Herstellungsprozess ergeben, erhalten Sie Karten, die sowohl leistungsfähiger als auch leistungsfähiger sind teurer als AMDs gerade veröffentlichte Radeon 5800-Serie Karten.

Folge Jason Cross auf Twitter oder besuche seinen Blog.