[高性能并行计算]用MPI编写矩阵乘法,C\C++交流,编程语言专区,鱼C论坛

DAY 发表于 2018-11-28 11:44:01

[高性能并行计算]用MPI编写矩阵乘法

前言
本人初涉高性能并行计算，知识水平有限，不喜勿喷{:10_277:}
具体实现思路:
实现的主要思路
第一点：创建A,B,C矩阵，其中A，B，C是以一维数组存储二维矩阵数据。
第二点:把A矩阵按照除去主进程(0)以外进程个数切割数据块(用floor取一共分得得块数下线整数)
第三点:把B矩阵分发到所有矩阵中，把A以块得形式分发到其他进程中
第四点:其他进程接受数据并且进行计算，然后把计算结果传回主进程(0)中。
第五点:主线程回收其它进程的计算结果把数据依次存储下来
第六点:处理A矩阵中还没由分发到其他进程得数据。
其中有几个难点:一，MPI数据分发与接受。二，一维数组下标转化为二维数组下标-极易出错。三是，矩阵得乘法代码与一维数组下标得结合以及运算。
代码实现：
#include<stdio.h>
#include<mpi.h>
#include<stdlib.h>
#include<math.h>
#include<time.h>

int main(int argc,char*argv[])
{
int rank,numProcs;//进程的有关变量
MPI_Status status;
int n = 100,l = 200,m = 100;//定义A,B矩阵的行和列
int lineSize = 0;//记录矩阵A分配到每个进程的行数（一个块）
double *B = (double *)malloc(sizeof(double) * l * m);//矩阵B
double *ABuffer = (double *)malloc(sizeof(double) * lineSize * l);//A的发送与接受块
double *CRecv = (double *)malloc(sizeof(double) * lineSize * m);//C的发送与接受块
MPI_Init(&argc,&argv);
MPI_Comm_rank(MPI_COMM_WORLD,&rank);
MPI_Comm_size(MPI_COMM_WORLD,&numProcs);
lineSize = floor((double)n / (numProcs-1));
if(0 == rank){
   double *A = (double *)malloc(sizeof(double) * n * l);//矩阵A
   double *C = (double *)malloc(sizeof(double) * n * m);//矩阵B

   //创建A，B数据
   srand(time(NULL));
   for(int i = 0 ; i < n ;i++)
         for(int j = 0;j < l;j++)
            A = rand() % 6;
   for(int i = 0 ; i < l ;i++)
         for(int j = 0;j < m;j++)
            B = rand() % 6;

   //以块分发A
   int ASendBegin = 0;
   for(int id = 1;id < numProcs;id++){
         for(int i = 0;i < lineSize * l;i++)
            ABuffer = A;
         MPI_Send(ABuffer,lineSize * l,MPI_DOUBLE,id,2,MPI_COMM_WORLD);
         ASendBegin += lineSize * l;
   }

   //整体分发B
   for(int id = 1; id < numProcs;id++)
         MPI_Send(B,6,MPI_DOUBLE,id,1,MPI_COMM_WORLD);

   //接受数据并且拼接数据
   int CBegin = 0;
   for(int id = 1;id < numProcs;id++){
         MPI_Recv(CRecv,lineSize*m,MPI_DOUBLE,id,3,MPI_COMM_WORLD,&status);
         //填数
         for(int i = 0 ; i < lineSize * m ;i++){
            C = CRecv;
         }
   }

   //对A剩余数据进行处理
   while(ASendBegin < n * l){
         double *t = (double *)malloc(sizeof(double) * l);
         for(int i = 0;i < l;i++){
            t = A;
         }
         //comput
         for(int j = 0 ; j < m;j++){
            for(int k = 0;k < l;k++){
               C += t* B;
            }
            CBegin++;
         }

         ASendBegin += l;
         free(t);
   }

   printf("rank is %d\n",rank);
   //打印A矩阵数据
   printf("A矩阵如下:\n");
   for(int i = 0 ; i < n ;i ++){
         for(int j = 0 ; j < l;j++)
            printf("%lf ",A);
         printf("\n");
   }
   //printf("\n");

   //打印B矩阵
   printf("B矩阵如下\n");
   for(int i = 0 ; i < l ;i ++){
         for(int j = 0 ; j < m;j++)
            printf("%lf ",B);
         printf("\n");
   }
   //printf("\n");

   //打印C矩阵
   printf("C矩阵如下\n");
   for(int i = 0 ; i < n ;i ++){
         for(int j = 0 ; j < m;j++)
            printf("%lf ",C);
         printf("\n");
   }
   printf("\n");

   //释放申请空间
   //free(A);free(C);

}else{
   //接受B矩阵数组
   MPI_Recv(B,l * m,MPI_DOUBLE,0,1,MPI_COMM_WORLD,&status);
   //接受A块数据
   MPI_Recv(ABuffer,lineSize * l,MPI_DOUBLE,0,2,MPI_COMM_WORLD,&status);
   //进行CRecv的初始化
   for(int i = 0;i < lineSize * m;i++)
         CRecv = 0;

   //计算矩阵乘法结果
   for(int i = 0;i < lineSize;i++){
         for(int j = 0 ; j < m ;j++){
            for(int k = 0 ; k < l ;k++){
               CRecv += ABuffer * B;
            }
         }
   }

   //结果发送给主进程
   MPI_Send(CRecv,lineSize * m,MPI_DOUBLE,0,3,MPI_COMM_WORLD);

}
MPI_Finalize();
return 0;
}

gaydvd 发表于 2018-11-28 15:57:02

QQ1273656880微信18613877980目录http://www.dvdtao.com http://www.hotziyuan.com(复制到浏览器打开）出售各地区高清DVD电影光盘，种类多品种齐全，有国产萝莉幼女酒店偷拍自拍，日本泰国韩国兽皇，死夜恶，电流拷问，强制子宫破坏女王调教M男，蛇缚，捆绑，鞭打，针刺，阉割，黑人对女优，熟女，学生制服，S级素人，丝袜制服，街头露出，筋肉美人，痴汉，摄盗，群体，犯罪;欧美无码无套，BDSM，重度调教。女优有仁科百華、北原多香子、苍井空、常盘樱子、村上里沙、大泽佑香、吉泽明步、立花里子、松岛枫、翔田千里、佐藤江梨花、紫彩乃、北条麻妃、吉崎直绪、明日花キララ、穂花等几百位名优专辑

页: [1]

鱼C论坛's Archiver

[高性能并行计算]用MPI编写矩阵乘法