Car-tech

Oracle Engineer enthüllt Latenz-Mysterien mit Heat Maps

Während Data-Center-Manager seit langem Heatmaps verwenden, um zu bestimmen, wo Racks mit Servern und Kühleinheiten am besten zu positionieren sind, kann diese Art der Visualisierung auch hilfreich sein, um die Systemlatenz besser zu verstehen, argumentiert ein Oracle-Ingenieur in der Juli-Ausgabe von Communications of the ACM.

"Latenz als Heatmap darzustellen, ist eine effektive Methode, um subtile Merkmale zu erkennen, die sonst übersehen werden könnten", schreibt Brendan Gregg, Principal Software Engineer bei Oracle, im Artikel "Visualisierung der Systemlatenz".

Gregg warnte auch, dass eine solche Visualisierung zwar einen besseren Überblick über das Geschehen geben kann, aber nicht immer Antworten auf das beobachtete Verhalten liefert. Dennoch können Heatmaps einen Einblick in die Latenzprobleme bei Rechenzentren der nächsten Generation geben.

[Weiterführende Literatur: Beste NAS-Boxen für Media-Streaming und Backup]

Die Ursachen der Systemträgheit aufzuzeigen war lange Zeit frustrierend Rechenzentrumsmanager und Systemadministratoren. Netzwerkanalysewerkzeuge sind verfügbar, um die Netzwerkleistung zu visualisieren, obwohl andere Aspekte eines Systems, wie die Reaktionsfähigkeit von Platten in einem Speicherarray, schwerer zu quantifizieren waren.

Sun Microsystems bietet seit langem ein Tool für sein Solaris-Betriebssystem an. DTrace genannt, das die Latenzzeit in verschiedenen Teilen eines Systems auf einer Sekunde-für-Sekunde-Basis charakterisieren kann. Die überwältigenden Daten, die es produzieren kann, müssen jedoch noch in eine leicht verständliche Form gebracht werden.

Geben Sie Greggs Heatmaps ein. Heatmaps sind eine einfache Visualisierungstechnik, bei der in einem zweidimensionalen Diagramm verschiedene Werte durch unterschiedliche Farben dargestellt werden.

Wärmendiagramme können mehr als die Liniendiagramme in den meisten Netzwerkanalysewerkzeugen aufzeigen, weil Graphen "einen Durchschnitt erlauben würden Latenz, die im Laufe der Zeit überprüft werden muss, die tatsächliche Zusammensetzung oder Verteilung dieser Latenz kann nicht über ein Maximum hinaus bestimmt werden, falls vorhanden ", schreibt er.

Heatmaps eignen sich auch zur schnellen Identifizierung von Ausreißern, die dann genauer untersucht werden können , argumentierte er.

Für den Artikel zeichnete Gregg eine Reihe von ungewöhnlichen Workload-Bedingungen auf und verwendete die Visualisierungssoftware von Oracle Analytics, um die von DTrace gesammelten Daten visuell darzustellen. Er stellte die X-Achse zur Darstellung der Zeit und die Y-Achse zur Darstellung der Latenzzeit ein. Die dunkelsten Farben stellten die meiste Eingabe-Ausgabe dar.

In vielen Fällen stellte er fest, dass einfache Workloads eine Vielzahl komplexer - und manchmal unerklärlicher - Muster erzeugen können.

In einem Fall war eine kleine Datenmenge sequenziell in einen Pool von Festplatten geschrieben. Gregg erwartet, nur "weißes Rauschen" zu sehen, das eine zufällige Latenz darstellt. Stattdessen zeigte die Heatmap, dass die Latenzpegel in bestimmten Mustern aus unbekannten Gründen ansteigen und abfallen. "Die Visualisierung von Latenzzeiten stellt auf diese Weise eindeutig mehr Fragen als Antworten dar", sagte er.

Ein anderes Muster erwies sich als ebenso mysteriös. Der Test umfasste das Senden eines Datenstroms an 44 Festplatten. Zuerst wurden Daten an nur eine Festplatte, dann an zwei Festplatten usw. gesendet, bis alle 44 Festplatten Daten empfangen hatten.

Gregg erwartete, dass die Plattenwartezeit linear anstieg, wenn die Systembusse mit Daten gesättigt wurden.

Stattdessen würde die Latenz ansteigen, dann etwas abklingen, bevor sie noch etwas anwachsen würde.

Er nannte dieses Muster den Regenbogenpterodaktylus, in dem die Hitzediagramm dem Profil eines bunten fliegenden Dinosauriers ähnelte.

Regenbogen Pterodaktylus: wenig ist bekannt mit Genauigkeit, und viel mehr Untersuchung ist erforderlich. Was dies zeigt, ist, wie tief eine einfache Visualisierung werden kann ", schreibt er.

Gregg auch eine Heat Map verwendet, um die Schock-Effekte, dass laute Geräusche zu offenbaren hat auf Servern Phänomene, die Gregg vor ein paar Jahren auf YouTube demonstriert hat.

Obwohl diese Heatmaps auf einem System ausgeführt wurden, das auf dem Zettabyte File System (ZFS) lief, das über das Network File Storage (NFS) -Protokoll lief, könnte dieser Ansatz zur Charakterisierung der Operationen anderer Dateisysteme und sogar anderer Komponenten wie CPUs verwendet werden. Gregg schreibt.

Joab Jackson deckt Enterprise-Software und allgemeine Technologie-Breaking-News für Der IDG News Service ab. Folge Joab auf Twitter unter @Joab_Jackson. Joabs E-Mail-Adresse ist [email protected]