WhatsApp

SLURM-Ein Workload-Manager, der für Linux-Cluster jeder Größe entwickelt wurde

Anonim

Slurm steht für (Simple Linux Utility For Resource Management)ist ein großartiger, leistungsstarker, modularer Open-Source-Workload-Manager und Job-Scheduler, der für Linux-Cluster jeder Größe entwickelt wurde. Slurm ist ein fehlertolerantes und hochgradig austauschbares Cluster-Management- und Job-Scheduling-System mit vielen optionalen Plugins, die Sie verwenden können. Es bietet Workload-Management auf mehreren leistungsstarken Computern und Rechenzentren auf der ganzen Welt.

Die Hauptfunktionen von Slurm

Slurm hat drei Hauptfunktionen, erstens weist es exklusiven und/oder nicht-exklusiven Zugang zu Ressourcen Benutzern zu, die für einen bestimmten Zeitraum arbeiten möchten. Als nächstes nutzt Slurm ein Framework, das hilft, Arbeit auf einer Reihe von zugewiesenen Hosts in einem Cluster zu starten, auszuführen und zu überwachen, und seine letzte Funktion besteht darin, die Ressourcennutzung zu steuern, indem es eine Warteschlange mit ausstehenden Arbeiten verw altet.

Slurm-spezifische Funktionen

Es gibt viele Workload-Manager, aber Slurm hat viele einzigartige Funktionen, die es von anderen Workload-Managern unterscheiden, und diese Funktionen beinh alten:

Slurm-Architektur

Das Slurm-System basiert auf einem zentralisierten Manager, slurmctld, der verschiedene Ressourcen und Arbeiten überwacht, und es kann einen verantwortlichen Backup-Manager enth alten zum Schutz des Systemzustands im Falle eines Fehlers. Jeder Host im Cluster hat einen slurmd Daemon, der mit einer Remote-Shell verglichen wird und Arbeit empfängt, ausführt, den Status zurückgibt und dann auf die Ausführung weiterer Arbeit wartet. Der Daemon ermöglicht auch eine fehlertolerante Kommunikation in der System-Setup-Hierarchie. Es gibt auch einen optionalen slurmdbd(Slurm-Datenbank-Daemon), der verwendet wird, um Abrechnungsinformationen von mehreren Slurm-verw alteten Clustern in einer einzigen Datenbank aufzuzeichnen. Die vollständige Architektur können Sie hier nachlesen.

Unten ist ein Bild, das die verschiedenen Komponenten des Slurm-Systems zeigt

Slurm-Systemkomponenten

Ein Bild, das verschiedene Einheiten des Slurm-Systems zeigt

Slurm-Systemeinheiten

Kunde Erfahrungsberichte über Slurm lesen. Sie können das Slurm-Clusterverw altungs- und Jobplanungssystem überprüfen und ausprobieren, wenn Sie mit Linux-Clustern jeder Größe arbeiten. Für weitere Informationen können Sie hier Ihre Meinung zu Slurm hinterlassen, indem Sie einen Kommentar in den Kommentarbereich unten schreiben.