[Dunder-users]Jobblängder på dunder
Tomas Wilhelmsson
tomas.wilhelmsson at smhi.se
Wed Jan 17 14:23:17 CET 2007
Per Unden wrote:
> 3. Kösystemet måste vara lite mera restriktivt. T.ex. att en användare
> bara kan köra två jobb i en klass eller bara ett jobb om det är
> jättelångt eller jättestort. På ECMWF kunde det här aldrig ha hänt.
Eftersom dunder bara är till för SMHIs forskare, som ju nästan alla
sitter i samma hus (med till och med samma fikarum) så har kösystemet
till dunder satts upp utan särskilt många regler. För mycket
restriktioner kan ju också leda till att maskinen underutnyttjas.
Det går ju alltid att prata med varandra! Kari var snabb att stoppa ett
av sina jobb, vilket löste det akuta problemet.
> Om det fanns en checkpointing och operatörer kunde man rulla in och ut
> sådana här jobb, men i brist på det tror jag att man får ta risken att
> maskinen inte utnyttjas fullt ut. Jobb som tar flera dygn var och är
> mycket mycket ovanliga och resulterar alltid i telefonsamtal från
> Computer operations om vad som är meningen eftersom sådana jobb har rätt
> stor påverkan på driften av maskinerna och andra användare.
Om jag läser utskriften från llclass på HPCE rätt så ser det ut som
ECMWF tillåter jobblängder på upp till 101 timmar, dvs drygt fyra dygn.
I dokumentationen till gamla Monolith så står maxlängden 144 timmar.
Problem blir det väl bara om dessa långa jobb får ta en för stor del av
den totala resursen. Kanske en sådan restriktion kan behöva införas på
dunder.
Hälsningar,
Tomas
More information about the dunder-users
mailing list