[高性能并行计算]用MPI编写矩阵乘法
前言本人初涉高性能并行计算,知识水平有限,不喜勿喷{:10_277:}
具体实现思路:
实现的主要思路
第一点:创建A,B,C矩阵,其中A,B,C是以一维数组存储二维矩阵数据。
第二点:把A矩阵按照除去主进程(0)以外进程个数切割数据块(用floor取一共分得得块数下线整数)
第三点:把B矩阵分发到所有矩阵中,把A以块得形式分发到其他进程中
第四点:其他进程接受数据并且进行计算,然后把计算结果传回主进程(0)中。
第五点:主线程回收其它进程的计算结果把数据依次存储下来
第六点:处理A矩阵中还没由分发到其他进程得数据。
其中有几个难点:一,MPI数据分发与接受。二,一维数组下标转化为二维数组下标-极易出错。三是,矩阵得乘法代码与一维数组下标得结合以及运算。
代码实现:
#include<stdio.h>
#include<mpi.h>
#include<stdlib.h>
#include<math.h>
#include<time.h>
int main(int argc,char*argv[])
{
int rank,numProcs;//进程的有关变量
MPI_Status status;
int n = 100,l = 200,m = 100;//定义A,B矩阵的行和列
int lineSize = 0;//记录矩阵A分配到每个进程的行数(一个块)
double *B = (double *)malloc(sizeof(double) * l * m);//矩阵B
double *ABuffer = (double *)malloc(sizeof(double) * lineSize * l);//A的发送与接受块
double *CRecv = (double *)malloc(sizeof(double) * lineSize * m);//C的发送与接受块
MPI_Init(&argc,&argv);
MPI_Comm_rank(MPI_COMM_WORLD,&rank);
MPI_Comm_size(MPI_COMM_WORLD,&numProcs);
lineSize = floor((double)n / (numProcs-1));
if(0 == rank){
double *A = (double *)malloc(sizeof(double) * n * l);//矩阵A
double *C = (double *)malloc(sizeof(double) * n * m);//矩阵B
//创建A,B数据
srand(time(NULL));
for(int i = 0 ; i < n ;i++)
for(int j = 0;j < l;j++)
A = rand() % 6;
for(int i = 0 ; i < l ;i++)
for(int j = 0;j < m;j++)
B = rand() % 6;
//以块分发A
int ASendBegin = 0;
for(int id = 1;id < numProcs;id++){
for(int i = 0;i < lineSize * l;i++)
ABuffer = A;
MPI_Send(ABuffer,lineSize * l,MPI_DOUBLE,id,2,MPI_COMM_WORLD);
ASendBegin += lineSize * l;
}
//整体分发B
for(int id = 1; id < numProcs;id++)
MPI_Send(B,6,MPI_DOUBLE,id,1,MPI_COMM_WORLD);
//接受数据并且拼接数据
int CBegin = 0;
for(int id = 1;id < numProcs;id++){
MPI_Recv(CRecv,lineSize*m,MPI_DOUBLE,id,3,MPI_COMM_WORLD,&status);
//填数
for(int i = 0 ; i < lineSize * m ;i++){
C = CRecv;
}
}
//对A剩余数据进行处理
while(ASendBegin < n * l){
double *t = (double *)malloc(sizeof(double) * l);
for(int i = 0;i < l;i++){
t = A;
}
//comput
for(int j = 0 ; j < m;j++){
for(int k = 0;k < l;k++){
C += t* B;
}
CBegin++;
}
ASendBegin += l;
free(t);
}
printf("rank is %d\n",rank);
//打印A矩阵数据
printf("A矩阵如下:\n");
for(int i = 0 ; i < n ;i ++){
for(int j = 0 ; j < l;j++)
printf("%lf ",A);
printf("\n");
}
//printf("\n");
//打印B矩阵
printf("B矩阵如下\n");
for(int i = 0 ; i < l ;i ++){
for(int j = 0 ; j < m;j++)
printf("%lf ",B);
printf("\n");
}
//printf("\n");
//打印C矩阵
printf("C矩阵如下\n");
for(int i = 0 ; i < n ;i ++){
for(int j = 0 ; j < m;j++)
printf("%lf ",C);
printf("\n");
}
printf("\n");
//释放申请空间
//free(A);free(C);
}else{
//接受B矩阵数组
MPI_Recv(B,l * m,MPI_DOUBLE,0,1,MPI_COMM_WORLD,&status);
//接受A块数据
MPI_Recv(ABuffer,lineSize * l,MPI_DOUBLE,0,2,MPI_COMM_WORLD,&status);
//进行CRecv的初始化
for(int i = 0;i < lineSize * m;i++)
CRecv = 0;
//计算矩阵乘法结果
for(int i = 0;i < lineSize;i++){
for(int j = 0 ; j < m ;j++){
for(int k = 0 ; k < l ;k++){
CRecv += ABuffer * B;
}
}
}
//结果发送给主进程
MPI_Send(CRecv,lineSize * m,MPI_DOUBLE,0,3,MPI_COMM_WORLD);
}
MPI_Finalize();
return 0;
}
QQ1273656880微信18613877980目录http://www.dvdtao.com http://www.hotziyuan.com(复制到浏览器打开)出售各地区高清DVD电影光盘,种类多品种齐全,有国产萝莉幼女酒店偷拍自拍,日本泰国韩国兽皇,死夜恶,电流拷问,强制子宫破坏女王调教M男,蛇缚,捆绑,鞭打,针刺,阉割,黑人对女优,熟女,学生制服,S级素人,丝袜制服,街头露出,筋肉美人,痴汉,摄盗,群体,犯罪;欧美无码无套,BDSM,重度调教。女优有仁科百華、北原多香子、苍井空、常盘樱子、村上里沙、大泽佑香、吉泽明步、立花里子、松岛枫、翔田千里、佐藤江梨花、紫彩乃、北条麻妃、吉崎直绪、明日花キララ、穂花等几百位名优专辑
页:
[1]