N-body Simulation

Programmazione Concorrente, Parallela e su Cloud

Università degli Studi di Salerno

Anno Accademico 2017/2018

Professore: Vittorio Scarano, Dottor: Carmine Spagnuolo, Studente: Francesco Vicidomini

Problem Statement

Nel n-body problem, abbiamo bisogno di trovare le posizioni e le velocità di una collezione di particelle che interagistrono fra loro per un determinato periodo di tempo. Per esempio, un astrofisico è interessato a conoscere la posizione e la velocità di una collezione di stelle. Un n-body solver è un programma che cerca la soluzione a un n-body problem simulando il movimento delle particelle.

Soluzione proposta

All'n-body solver vengono dati in input il numero di particelle, in maniera casuale verranno assegnate le posizioni nelle spazio e le relative velocità e il numero di iteazioni che deve simulare. L'output sarà la posizione e la velocità di ogni particella alla fine di un determinato numero di iterazioni specificato dall'utente. La soluzione proposta considera solo l'approccio n^2 rispetto al numero di particelle e al numero di iterazioni dato dall'utente. La comunicazione è avvenuta usando sia la comunicazione collettiva con la funzione MPI_Scatter sia utilizzandola comunicazione Point to Point con le funzioni MPI_Send e MPI_Recv I test sono stati effettuati sulle istanze di AWS m4.large.

Implementazione

L'obiettivo del lavoro svolto è stato quello di parallelizzare l'algoritmo dell' n-body simulation, partizionando equamente il lavoro tra i processi coinvolti all'interno del cluster. L'approccio utilizzato al fine di ottenere una distribuzione quanto più equa possibile è quello riportato di seguito.

Descrizione variabili

Body: struttura utilizzata per rappresentare una singola particella

  typedef struct{
      float x;
      float y;
      float z;
      float vx;
      float vy;
      float vz;
  }Body;

Variabili MPI:

int my_rank; //rank del processore
int p; //numero totale di processori
MPI_Datatype BodyMPI; //dichiariamo il tipo di dato BodyMPI

Variabili passate da riga di comando

int particelle; //numero di particelle da creare
int numIter //numero di iterazioni da eseguire

checkArgs

Controlla se gli argomenti passati da riga di comando sono corretti.

  void checkArgs(int argc, char *argv[]){
    if(argc != 3){
      printf("Inserisci parametri\n");
      printf("Numero di particelle da genereare\n");
      printf("Numero di iterazioni da fare\n");
    }else{
          particelle = atoi(argv[1]);
          numIter = atoi(argv[2]);
          if(particelle<=0 || numIter<=0){
            MPI_Finalize();
            exit(0);
          }
    }
  }

initBodies

Tutti i processori inizializzano il loro bodies

  void initBodies(){
    for(int i=0; i< particelle; i++){
      bodies[i].x=2.0f * (rand() / (float) RAND_MAX)  - 1.0f;
      bodies[i].y=2.0f * (rand() / (float) RAND_MAX)  - 1.0f;
      bodies[i].z=2.0f * (rand() / (float) RAND_MAX)  - 1.0f;
      bodies[i].vx=2.0f * (rand() / (float) RAND_MAX)  - 1.0f;
      bodies[i].vy=2.0f * (rand() / (float) RAND_MAX)  - 1.0f;
      bodies[i].vz=2.0f * (rand() / (float) RAND_MAX)  - 1.0f;
    }
  }

bodyForce:

calcola gli spostamenti sulla porzione di bodies inviata da un processore.

bodyPart: rappresenta la porzione di bodies che un singolo processore deve computare;
lenght: quanto è grande bodyPart;
start: da quale indice di bodies deve iniziare a computare.

Per ogni particella della porzione di bodies, rappresentata da bodyPart, inviata per numIter volte viene calcolato il suo spostamento e viene aggiornata la sua posizione.

  void bodyForce(Body *bodyPart, int lenght, int start) {
    for (int i = start; i < start + lenght; i++) { 
      float Fx = 0.0f;
      float Fy = 0.0f;
      float Fz = 0.0f;
      for(int it= 0; it < numIter;it++){
      for (int j = 0; j < particelle; j++) {
        float dx = bodyPart[j].x - bodyPart[i].x;
        float dy = bodyPart[j].y - bodyPart[i].y;
        float dz = bodyPart[j].z - bodyPart[i].z;
        float distSqr = dx*dx + dy*dy + dz*dz + SOFTENING;
        float invDist = 1.0f / sqrtf(distSqr);
        float invDist3 = invDist * invDist * invDist;

        Fx += dx * invDist3;
        Fy += dy * invDist3;
        Fz += dz * invDist3;
      }
      bodyPart[i].vx += dt*Fx;
      bodyPart[i].vy += dt*Fy;
      bodyPart[i].vz += dt*Fz;
    } 
    for (int i = start ; i < start + lenght; i++) { 
        bodyPart[i].x += bodyPart[i].vx*dt;
        bodyPart[i].y += bodyPart[i].vy*dt;
        bodyPart[i].z += bodyPart[i].vz*dt;
      }
    }  
  }

printBodies:

Stampa tutte le componenti di un Body grande lenght

  void printBodies(Body *body, int lenght){
        for(int i=0;i<lenght;i++){
        printf("--------------------------------------------------%d--------------------------------------------------\n",i);
        printf("x= %f\ty= %f\tz= %f\tvx= %f\tvy= %f\tvz= %f\t\n",body[i].x,body[i].y,body[i].z,body[i].vx,body[i].vy,body[i].vz);
        printf("--------------------------------------------------%d--------------------------------------------------\n\n",i);
      }
  }

Il main:

La prima operazione effettuata nel main è quella di inizializzare l'ambiente MPI e di controllare se i parametri passati dell'utente sono corretti.

 /* start up MPI */
    MPI_Init(&argc, &argv);
    /* find out process rank */
    MPI_Comm_rank(MPI_COMM_WORLD, &my_rank);
    /* find out number of processes */
    MPI_Comm_size(MPI_COMM_WORLD, &p);
    
    checkArgs(argc,argv);

Fatto ciò viene allocata la memoria necessaria per contenere un insieme di particelle.

bodies = malloc(particelle * sizeof(Body));

e con la MPI_Type_contiguous rendiamo le variabili di tipo BodyMPI accessibili in maniera contigua

MPI_Type_contiguous(6, MPI_FLOAT, &BodyMPI);
MPI_Type_commit(&BodyMPI);

Inizializziamo bodies

initBodies()

Inizializziamo il tempo di esecuzione, il reminder, la partition e p1.

    double tstart = MPI_Wtime();
    int reminder = particelle % p;
    int partition = particelle / p;
    int p1= partition + 1;

Se il reminder è pari a 0 allora possiamo effettuare una chiamata collettiva perchè il master e gli slave devono ricevere tutti la stessa parzione di bodies che è partition.

MPI_Scatter(bodies,partition,BodyMPI,bodies,partition,BodyMPI,0,MPI_COMM_WORLD);
bodyForce(bodies,partition,partition*my_rank);

L'invio

Se il reminder è diverso da 0 dobbiamo utilizzare le chiamate Point 2 Point perchè la grandezza del bodies non è sempre fissa dato che dobbiamo inviare delle parti grandi p1. Il master inizializza k e start, fatto ciò controlla se k è minore di reminder inviara una porzione di bodies grande p1 al processore i, incrementa k e aggiorna start; altrimenti se k è maggiore o uguale a reminder vuol dire che non dobbiamo più inviare parti grandi p1 perchè il resto è esaurito quindi inviamo una parte di bodies grande partition e aggiorniamo start. In fine il master chiama il suo bodyForce partendo da 0

if(my_rank==0){//MASTER
  int k=1;
  int start=p1;
  for(int i=1;i<p;i++){
 if(k<reminder){
         MPI_Send(&bodies[start],p1,BodyMPI,i,0,MPI_COMM_WORLD);
         k++;
         start+=p1;
 }else{
MPI_Send(&bodies[start],partition,BodyMPI,i,0,MPI_COMM_WORLD);
start+=partition;
          }
        }
     bodyForce(bodies,p1,0);

La ricezione

Alcuni Slave dovranno ricevere un bodies grande p1 altri dovranno ricevere un bodies grande partition. Se my_rank è minore di reminder vuol dire che devo ricevere una porzione grande p1 e sulla porzione ricevuta chiamerò bodyForce. Altrimenti devo ricevere un bodies grande partition e chiamare bodyForce

else{//SLAVE
        if(my_rank<reminder){
         MPI_Recv(bodies,p1,BodyMPI,0,0,MPI_COMM_WORLD,&status);
         bodyForce(bodies,p1,p1*my_rank);   
        }
    else{
MPI_Recv(bodies,partition,BodyMPI,0,0,MPI_COMM_WORLD,&status);
bodyForce(bodies,partition,partition*my_rank);
      }//fine SLAVE

Conclusione

Usiamo una MPI_Barrier per assicurarci che tutti i processori abbiano completato la computazione, il MASTER stampa bodies eil tempo totale della computazione.

    MPI_Barrier(MPI_COMM_WORLD);
    if(my_rank==0){
     double tend = MPI_Wtime();
     printBodies(bodies,particelle);
     double totTime = tend-tstart;
     printf("totTime: %f\n",totTime);
    }
    MPI_Type_free(&BodyMPI);
    free(bodies);
    MPI_Finalize();
    return 0;

Testing

I test sono stati effettuati sulle istanze m4.large (2 core) di Amazon Web Services.
Durante la fase di testing si è tenuto conto sia di strong scaling che di weak scaling

Risorse massime utilizzate:

8 Istanze EC2 m4.large StarCluster-Ubuntu-12.04-x86_64-hvm - ami-52a0c53b
16 processori (2 core per Istanza).

I test sono stati effettuati con i seguenti parametri:

Numero di iterazioni pari a 20
Istante di tempo pari a 0.1

const double dt=0.1f;

I tempi presenti nelle immagini dello strong e del weak scaling sono riportati in secondi.

Strong Scaling

Nella fase di testing che ha tenuto in considerazione lo strong scaling sono state utilizzate 50.000 particelle e 20 iterazioni. Nello strong scaling infatti il numero di particelle resta invariato, quello che cambia è il numero di processori. Nella figura in basso è possibile osservare i risultati di questa fase di testing.

Weak Scaling

La fase di testing che ha tenuto in considerazione il weak scaling è stata svolta in due parti. Inizialmente sono state utilizzate 3000 particelle e 20 iterazione per processo. In seguito 10000 particelle e 20 iterazioni per processo. Nel weak scaling infatti il numero di particelle cresce in maniera proporzionale al numero di processori. Nella figura in basso è possibile osservare i risultati di questa fase di testing.

Come compilare il sorgente

Il sorgente va compilato con l'istruzione seguente

mpicc main.c -lm -o main

Nel caso in cui vengano mostrati i seguenti errori

main.c: In function ‘main’:
main.c:75:9: error: ‘for’ loop initial declarations are only allowed in C99 mode
main.c:75:9: note: use option -std=c99 or -std=gnu99 to compile your code
main.c: In function ‘initBodies’:
main.c:141:5: error: ‘for’ loop initial declarations are only allowed in C99 mode
main.c: In function ‘bodyForce’:
main.c:156:5: error: ‘for’ loop initial declarations are only allowed in C99 mode
main.c:160:1: error: ‘for’ loop initial declarations are only allowed in C99 mode
main.c:161:7: error: ‘for’ loop initial declarations are only allowed in C99 mode
main.c:179:5: error: ‘for’ loop initial declarations are only allowed in C99 mode
main.c: In function ‘printBodies’:
main.c:192:9: error: ‘for’ loop initial declarations are only allowed in C99 mode

Allora bisogna compilare con il comando

mpicc main.c -lm -std=c99  -o main

Come lanciare il main

mpirun -np <num_processori> main <num_particelle> <num_iterazioini>

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
img		img
src		src
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

N-body Simulation

Programmazione Concorrente, Parallela e su Cloud

Università degli Studi di Salerno

Anno Accademico 2017/2018

Problem Statement

Soluzione proposta

Implementazione

Descrizione variabili

checkArgs

initBodies

bodyForce:

printBodies:

Il main:

L'invio

La ricezione

Conclusione

Testing

Strong Scaling

Weak Scaling

Come compilare il sorgente

Come lanciare il main

About

Releases

Packages

Languages

License

CiccioTecchio/n-Body_MPI

Folders and files

Latest commit

History

Repository files navigation

N-body Simulation

Programmazione Concorrente, Parallela e su Cloud

Università degli Studi di Salerno

Anno Accademico 2017/2018

Problem Statement

Soluzione proposta

Implementazione

Descrizione variabili

checkArgs

initBodies

bodyForce:

printBodies:

Il main:

L'invio

La ricezione

Conclusione

Testing

Strong Scaling

Weak Scaling

Come compilare il sorgente

Come lanciare il main

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages