Slurm steht für (Simple Linux Utility For Resource Management)ist ein großartiger, leistungsstarker, modularer Open-Source-Workload-Manager und Job-Scheduler, der für Linux-Cluster jeder Größe entwickelt wurde. Slurm ist ein fehlertolerantes und hochgradig austauschbares Cluster-Management- und Job-Scheduling-System mit vielen optionalen Plugins, die Sie verwenden können. Es bietet Workload-Management auf mehreren leistungsstarken Computern und Rechenzentren auf der ganzen Welt.
Die Hauptfunktionen von Slurm
Slurm hat drei Hauptfunktionen, erstens weist es exklusiven und/oder nicht-exklusiven Zugang zu Ressourcen Benutzern zu, die für einen bestimmten Zeitraum arbeiten möchten. Als nächstes nutzt Slurm ein Framework, das hilft, Arbeit auf einer Reihe von zugewiesenen Hosts in einem Cluster zu starten, auszuführen und zu überwachen, und seine letzte Funktion besteht darin, die Ressourcennutzung zu steuern, indem es eine Warteschlange mit ausstehenden Arbeiten verw altet.
Slurm-spezifische Funktionen
Es gibt viele Workload-Manager, aber Slurm hat viele einzigartige Funktionen, die es von anderen Workload-Managern unterscheiden, und diese Funktionen beinh alten:
Slurm-Architektur
Das Slurm-System basiert auf einem zentralisierten Manager, slurmctld, der verschiedene Ressourcen und Arbeiten überwacht, und es kann einen verantwortlichen Backup-Manager enth alten zum Schutz des Systemzustands im Falle eines Fehlers. Jeder Host im Cluster hat einen slurmd Daemon, der mit einer Remote-Shell verglichen wird und Arbeit empfängt, ausführt, den Status zurückgibt und dann auf die Ausführung weiterer Arbeit wartet. Der Daemon ermöglicht auch eine fehlertolerante Kommunikation in der System-Setup-Hierarchie. Es gibt auch einen optionalen slurmdbd(Slurm-Datenbank-Daemon), der verwendet wird, um Abrechnungsinformationen von mehreren Slurm-verw alteten Clustern in einer einzigen Datenbank aufzuzeichnen. Die vollständige Architektur können Sie hier nachlesen.
Unten ist ein Bild, das die verschiedenen Komponenten des Slurm-Systems zeigt
Slurm-Systemkomponenten
Ein Bild, das verschiedene Einheiten des Slurm-Systems zeigt
Slurm-Systemeinheiten
Kunde Erfahrungsberichte über Slurm lesen. Sie können das Slurm-Clusterverw altungs- und Jobplanungssystem überprüfen und ausprobieren, wenn Sie mit Linux-Clustern jeder Größe arbeiten. Für weitere Informationen können Sie hier Ihre Meinung zu Slurm hinterlassen, indem Sie einen Kommentar in den Kommentarbereich unten schreiben.