[Dunder-users]Jobblängder på dunder

Tomas Wilhelmsson tomas.wilhelmsson at smhi.se
Wed Jan 17 14:23:17 CET 2007


Per Unden wrote:
> 3. Kösystemet måste vara lite mera restriktivt. T.ex. att en användare 
> bara kan köra två jobb i en klass eller bara ett jobb om det är 
> jättelångt eller jättestort.  På ECMWF kunde det här aldrig ha hänt.

Eftersom dunder bara är till för SMHIs forskare, som ju nästan alla 
sitter i samma hus (med till och med samma fikarum) så har kösystemet 
till dunder satts upp utan särskilt många regler. För mycket 
restriktioner kan ju också leda till att maskinen underutnyttjas.
Det går ju alltid att prata med varandra!  Kari var snabb att stoppa ett 
av sina jobb, vilket löste det akuta problemet.

> Om det fanns en checkpointing och operatörer kunde man rulla in och ut 
> sådana här jobb, men i brist på det tror jag att man får ta risken att 
> maskinen inte utnyttjas fullt ut. Jobb som tar flera dygn var och är 
> mycket mycket ovanliga och resulterar alltid i telefonsamtal från 
> Computer operations om vad som är meningen eftersom sådana jobb har rätt 
> stor påverkan på driften av maskinerna och andra användare.

Om jag läser utskriften från llclass på HPCE rätt så ser det ut som 
ECMWF tillåter jobblängder på upp till 101 timmar, dvs drygt fyra dygn. 
I dokumentationen till gamla Monolith så står maxlängden 144 timmar.
Problem blir det väl bara om dessa långa jobb får ta en för stor del av 
den totala resursen. Kanske en sådan restriktion kan behöva införas på 
dunder.

Hälsningar,
Tomas


More information about the dunder-users mailing list