[Bi-users] Parallell make ++

Ole Vignes olev at met.no
Mon Feb 16 08:56:51 CET 2015


Hei,

her er en "coredump" fra kjøring av MASTERODB i konfigurasjon "Canari" (surface assimilation).
Programmet hopper ut veldig tidlig med segmentation fault, egen kode har ikke begynt å
eksekvere så vidt jeg kan skjønne.
Det hjalp ikke å doble antall noder, jeg tror ikke vi reelt sett er tomme for minne.

Ole


----- Original Message -----
> From: "Torgny" <faxen at nsc.liu.se>
> To: bi-users at lists.nsc.liu.se
> Sent: Thursday, 12 February, 2015 1:40:33 PM
> Subject: Re: [Bi-users] Parallell make ++
> 
> Dag,
> borde fungera med "-g -traceback". Är det ett MPI_program eller
> sekventiellt? Du kanske skall prova och få en core-dump och sedan köra
> gdb på den:
> ulimit -c unlimited
> kör program.x -> seg fault, core dumped
> gdb program.x
> i gdb skriv "where" så borde du få ut en stackdump och om du kompilerat
> med "-g" vilken rad
> 
> För ditt andra fel, skicka in det till smhi-support at nsc.liu.se , ser ut
> som att du slår i taket på någon systemparameter. Har du provat med
> NPES=1 elelr NPES=8 ?
> 
> Mvh / Torgny
> 
> 
> On 2015-02-12 08:18, Dag Bjørge wrote:
> > Hei
> >
> > Under testing av hele AROME-MetCoOp-systemet har vi problemer med
> > klimafilgenerering og "screening"; begge hopper ut med segmentation fault
> > 11... Det kommer ingen spor av traceback i logger, selvom koden skal være
> > kompilert og linket med "-g -traceback". Flott om noen har et tips for å
> > få traceback!
> >
> >
> > Nå prøver jeg å rekompilere med litt andre opsjoner, og prøver å kompilere
> > med 16 tråder på 1 node. Har flyttet Makeup til "par_list" i Env_submit,
> > og satt NPES=16 i config. Det går bra en stund, men så kommer det:
> > ...
> > INFO: Compiling with MPI
> > INFO: Compiling with MPI
> > ifort: error #10103: can't fork process
> > /software/apps/intel/impi/5.0.2.044/intel64/bin/mpif90: fork: retry:
> > Resource temporarily unavailable
> > /software/apps/intel/impi/5.0.2.044/intel64/bin/mpif90: fork: retry:
> > Resource temporarily unavailable
> > ...
> >
> > Blir det for lite minne med 16 prosesser ? Noe annet jeg burde sette?
> > Noen som har erfaringer å dele?
> >
> > Mvh.,
> > Dag
> >
> > ----- Original Message -----
> > If you have not already noticed there is updated information on the Bi
> > early access guide on NSC's homepage:
> > https://www.nsc.liu.se/support/systems/bi-early-access/.
> >
> > Since a couple of days ago it is updated with some specific tips for
> > Arome and also Nemo from vendor's own testing and NSC's early testing.
> >
> > /Torgny
> >
> 
> 
> --
> ---------------------------------------------------------
>     Torgny Faxén
>     National Supercomputer Center
>     Linköping University
>     S-581 83 Linköping
>     Sweden
> 
>     Email:faxen at nsc.liu.se
>     Telephone: +46 13 285798 (office) +46 13 282535  (fax)
>     http://www.nsc.liu.se
> ---------------------------------------------------------
> 
> _______________________________________________
> Bi-users mailing list
> Bi-users at lists.nsc.liu.se
> https://lists.nsc.liu.se/mailman/listinfo/bi-users
> 



More information about the Bi-users mailing list