Lenteur sur CAIUS
Informations générales
Décrivez l'environnement affecté par le problème
- Système/Cluster : CAIUS
- Système d'exploitation et version : Red Hat Enterprise Linux release 8.7
Détails du problème
Ponctuellement, le temps de réponse du cluster aux différentes commandes utilisateurs devient très important sur les frontales de connexion, voire rend le cluster inutilisable.
Il me semble que des vérifications du système (et en particulier du système de fichier) sont effectuées régulièrement, donc un soucis système semble à écarter (il faudrait peut-être revérifier quand même).
Les problèmes semblent plutôt liés à l'activité d'une ou plusieurs personnes qui monopolisent les ressources en lançant des tâches trop gourmandes.
Les utilisateurs sont prévenus que ce genre de comportement ne sont pas acceptés, mais la simple prévention fonctionnait quand il n'y avait pas trop d'utilisateurs, mais cela ne suffit plus.
Il faudrait dans un premier temps rendre visible la charte d'utilisation (sur le site hpc.unistra.fr par exemple) à donner à chaque création de nouveau compte.
Ensuite, il faudrait automatiser le système pour soit empêcher de lancer des calculs trop gourmands sur les frontales, soit tuer automatiquement les processus tournant depuis trop longtemps. Il y a sans doute d'autres alternatives auxquelles je n'ai pas pensé, le sujet est ouvert.