Top-level heading

Lagrange server multi GPU

banner-hpc-1310x355

PAGINA IN COSTRUZIONE VERS. 20250530.1318

Il Dipartimento di Matematica "G.C." dispone di un server multi GPU.

Sul server lagrangectl è installato SLURM, Simple Linux Utility for Resource Management.
Tramite SLURM gli utenti possono accedere al server lagrange dedicato al calcolo intensivo.

Configurazione server lagrange

dispone di 4 GPU H100 NVIDIA, 48 core ( 2 cpu AMD EPYC 9224 da 24 Core), 768 GB RAM,  14TB di storage.

Chi può utilizzare lagrange

  • Professori e ricercatori afferenti al Dipartimento;
  • Assegnisti e Dottorandi in Matematica presso il Dipartimento;
  • Laureandi del Dipartimento;
  • Studenti e personale esterni al dipartimento. 

Richiesta account

L'apertura di un nuovo account può essere richiesta compilando il modulo. Per gli assegnisti, dottorandi, studenti e personale esterno, la richiesta dell’account deve essere effettuata da un docente del Dipartimento di Matematica. In quest’ultimo caso, nella form si deve indicare nome, cognome e qualifica dell'utente per il quale si richiede il nuovo account. Per gli account temporanei è necessario specificare anche la data di scadenza.

Prime informazioni per utilizzare lagrange

Per mandare in esecuzione programmi sul server:

  1. collegarsi al server lagrangectl.mat.uniroma1.it

  2. mandare in esecuzione il programma utilizzando i comandi messi a disposizione da SLURM.

    Per avere l'elenco completo dei comandi, consultare l'help in linea alla voce slurm (digitare man slurm).
    Alcuni dei comandi disponibili sono:

       srun          per inviare jobs sul cluster per il calcolo
       sbatch      per sottomettere un batch script sul cluster per il calcolo
       squeue     per visualizzare la coda dei jobs sul cluster per il calcolo
                        (ogni utente può visualizzare solo i propri job)
       scancel    per interrompere un jobs sul cluster per il calcolo
       sinfo         per visualizzare informazioni relative al cluster per il calcolo

Per ulteriori informazioni si consiglia di consultare la documentazione disponibile sul sito Slurm.

 

Qualche esempio

 

  • Per inviare un programma sulle code di calcolo

     1. Scrivere uno shell script, ad esempio job.sh, contenente le seguenti righe:

#!/bin/bash
#SBATCH --job-name=my_job		# Job name
#SBATCH --output=output_%j.txt	# Standard output and error log
#SBATCH --cpus-per-task=2		# Number of CPU cores per task (MAX 12)
#SBATCH --mem=10G				# Total RAM requested (MAX 150GB ) 
#SBATCH --gpus=0				# Numeber of GPUs (MAX 1) 				
commands						# Executions Command goes here (e.g your executable)

 2. lanciare l'esecuzione, inviando il comando:

sbatch job.sh

Contatti

Contatti