SV: [Dunder-users] Jobblängder på dunder

Meier Markus Markus.Meier at smhi.se
Thu Jan 18 22:04:08 CET 2007


Hej alla!
 
Jag är väldig mycket emot en restriktiv kösystem eftersom faran är att vi inte
utnyttja dunder helt.T.ex. har jag själv kört många jobb parallell under julledighet eftersom
dunder var helt tom. FoUo kommer att använder dunder mycket mer som tidigare
(enligt den nya uppdelningen av resurser) och andra enheter har säkert också större
behov under 2007. Tomas förslag att prata mer med varandra är mycket bra!
Alla bör hjälpa varandra och alla bör ha lite tålamod. Under 2007 har vi tyvärr
en brist av resurser.
Mitt förslag är att införa en riskkö som på tornado. Det fungera bra tycker jag. Då bli det
möjligt för en användare att köra flera jobb parallel när det finns ingen annan jobb i en vanlig kö.
 
Hälsningar,
Markus
 

________________________________

Från: dunder-users-bounces at lists.nsc.liu.se genom Tomas Wilhelmsson
Skickat: on 2007-01-17 14:23
Till: Undén Per
Kopia: dunder-users at nsc.liu.se
Ämne: Re: [Dunder-users] Jobblängder på dunder



Per Unden wrote:
> 3. Kösystemet måste vara lite mera restriktivt. T.ex. att en användare
> bara kan köra två jobb i en klass eller bara ett jobb om det är
> jättelångt eller jättestort.  På ECMWF kunde det här aldrig ha hänt.

Eftersom dunder bara är till för SMHIs forskare, som ju nästan alla
sitter i samma hus (med till och med samma fikarum) så har kösystemet
till dunder satts upp utan särskilt många regler. För mycket
restriktioner kan ju också leda till att maskinen underutnyttjas.
Det går ju alltid att prata med varandra!  Kari var snabb att stoppa ett
av sina jobb, vilket löste det akuta problemet.

> Om det fanns en checkpointing och operatörer kunde man rulla in och ut
> sådana här jobb, men i brist på det tror jag att man får ta risken att
> maskinen inte utnyttjas fullt ut. Jobb som tar flera dygn var och är
> mycket mycket ovanliga och resulterar alltid i telefonsamtal från
> Computer operations om vad som är meningen eftersom sådana jobb har rätt
> stor påverkan på driften av maskinerna och andra användare.

Om jag läser utskriften från llclass på HPCE rätt så ser det ut som
ECMWF tillåter jobblängder på upp till 101 timmar, dvs drygt fyra dygn.
I dokumentationen till gamla Monolith så står maxlängden 144 timmar.
Problem blir det väl bara om dessa långa jobb får ta en för stor del av
den totala resursen. Kanske en sådan restriktion kan behöva införas på
dunder.

Hälsningar,
Tomas
_______________________________________________
dunder-users mailing list
dunder-users at lists.nsc.liu.se
http://www.nsc.liu.se/mailman/listinfo/dunder-users <https://vpnserver-pub.smhi.se/http/0/www.nsc.liu.se/mailman/listinfo/dunder-users> 



-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://www.nsc.liu.se/pipermail/dunder-users/attachments/20070118/ab02c01d/attachment.htm


More information about the dunder-users mailing list