鱼C论坛

 找回密码
 立即注册
查看: 2193|回复: 1

[技术交流] [高性能并行计算]用MPI编写矩阵乘法

[复制链接]
发表于 2018-11-28 11:44:01 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
前言
本人初涉高性能并行计算,知识水平有限,不喜勿喷
具体实现思路:
实现的主要思路
第一点:创建A,B,C矩阵,其中A,B,C是以一维数组存储二维矩阵数据。
第二点:把A矩阵按照除去主进程(0)以外进程个数切割数据块(用floor取一共分得得块数下线整数)
第三点:把B矩阵分发到所有矩阵中,把A以块得形式分发到其他进程中
第四点:其他进程接受数据并且进行计算,然后把计算结果传回主进程(0)中。
第五点:主线程回收其它进程的计算结果把数据依次存储下来
第六点:处理A矩阵中还没由分发到其他进程得数据。
其中有几个难点:一,MPI数据分发与接受。二,一维数组下标转化为二维数组下标-极易出错。三是,矩阵得乘法代码与一维数组下标得结合以及运算。
代码实现:
  1. #include<stdio.h>
  2. #include<mpi.h>
  3. #include<stdlib.h>
  4. #include<math.h>
  5. #include<time.h>

  6. int main(int argc,char*argv[])
  7. {
  8.     int rank,numProcs;//进程的有关变量
  9.     MPI_Status status;
  10.     int n = 100,l = 200,m = 100;//定义A,B矩阵的行和列
  11.     int lineSize = 0;//记录矩阵A分配到每个进程的行数(一个块)
  12.     double *B = (double *)malloc(sizeof(double) * l * m);//矩阵B
  13.     double *ABuffer = (double *)malloc(sizeof(double) * lineSize * l);//A的发送与接受块
  14.     double *CRecv = (double *)malloc(sizeof(double) * lineSize * m);//C的发送与接受块
  15.     MPI_Init(&argc,&argv);
  16.     MPI_Comm_rank(MPI_COMM_WORLD,&rank);
  17.     MPI_Comm_size(MPI_COMM_WORLD,&numProcs);
  18.     lineSize = floor((double)n / (numProcs-1));
  19.     if(0 == rank){
  20.         double *A = (double *)malloc(sizeof(double) * n * l);//矩阵A
  21.         double *C = (double *)malloc(sizeof(double) * n * m);//矩阵B

  22.         //创建A,B数据
  23.         srand(time(NULL));
  24.         for(int i = 0 ; i < n ;i++)
  25.             for(int j = 0;j < l;j++)
  26.                 A[i * l + j] = rand() % 6;
  27.         for(int i = 0 ; i < l ;i++)
  28.             for(int j = 0;j < m;j++)
  29.                 B[i * m + j] = rand() % 6;
  30.         
  31.         //以块分发A
  32.         int ASendBegin = 0;
  33.         for(int id = 1;id < numProcs;id++){
  34.             for(int i = 0;i < lineSize * l;i++)
  35.                 ABuffer[i] = A[ASendBegin + i];
  36.             MPI_Send(ABuffer,lineSize * l,MPI_DOUBLE,id,2,MPI_COMM_WORLD);
  37.             ASendBegin += lineSize * l;
  38.         }
  39.         
  40.         //整体分发B
  41.         for(int id = 1; id < numProcs;id++)
  42.             MPI_Send(B,6,MPI_DOUBLE,id,1,MPI_COMM_WORLD);

  43.         //接受数据并且拼接数据
  44.         int CBegin = 0;
  45.         for(int id = 1;id < numProcs;id++){
  46.             MPI_Recv(CRecv,lineSize*m,MPI_DOUBLE,id,3,MPI_COMM_WORLD,&status);
  47.             //填数
  48.             for(int i = 0 ; i < lineSize * m ;i++){
  49.                 C[CBegin++] = CRecv[i];
  50.             }
  51.         }
  52.         
  53.         //对A剩余数据进行处理
  54.         while(ASendBegin < n * l){
  55.             double *t = (double *)malloc(sizeof(double) * l);
  56.             for(int i = 0;i < l;i++){
  57.                 t[i] = A[ASendBegin + i];
  58.             }
  59.             //comput
  60.             for(int j = 0 ; j < m;j++){
  61.                 for(int k = 0;k < l;k++){
  62.                     C[CBegin] += t[k]* B[k*m + j];
  63.                 }
  64.                 CBegin++;
  65.             }
  66.             
  67.             ASendBegin += l;
  68.             free(t);
  69.         }
  70.         
  71.         printf("rank is %d\n",rank);
  72.         //打印A矩阵数据
  73.         printf("A矩阵如下:\n");
  74.         for(int i = 0 ; i < n ;i ++){
  75.             for(int j = 0 ; j < l;j++)
  76.                 printf("%lf ",A[i * l + j]);
  77.             printf("\n");
  78.         }
  79.         //printf("\n");

  80.         //打印B矩阵
  81.         printf("B矩阵如下\n");
  82.         for(int i = 0 ; i < l ;i ++){
  83.             for(int j = 0 ; j < m;j++)
  84.                 printf("%lf ",B[i * m + j]);
  85.             printf("\n");
  86.         }
  87.         //printf("\n");
  88.         
  89.         //打印C矩阵
  90.         printf("C矩阵如下\n");
  91.         for(int i = 0 ; i < n ;i ++){
  92.             for(int j = 0 ; j < m;j++)
  93.                 printf("%lf ",C[i * m + j]);
  94.             printf("\n");
  95.         }
  96.         printf("\n");
  97.         
  98.         //释放申请空间
  99.         //free(A);free(C);

  100.     }else{
  101.         //接受B矩阵数组
  102.         MPI_Recv(B,l * m,MPI_DOUBLE,0,1,MPI_COMM_WORLD,&status);
  103.         //接受A块数据
  104.         MPI_Recv(ABuffer,lineSize * l,MPI_DOUBLE,0,2,MPI_COMM_WORLD,&status);
  105.         //进行CRecv的初始化
  106.         for(int i = 0;i < lineSize * m;i++)
  107.             CRecv[i] = 0;

  108.         //计算矩阵乘法结果
  109.         for(int i = 0;i < lineSize;i++){
  110.             for(int j = 0 ; j < m ;j++){
  111.                 for(int k = 0 ; k < l ;k++){
  112.                     CRecv[i * m + j] += ABuffer[i * l + k] * B[k * m + j];
  113.                 }
  114.             }
  115.         }

  116.         //结果发送给主进程
  117.         MPI_Send(CRecv,lineSize * m,MPI_DOUBLE,0,3,MPI_COMM_WORLD);
  118.         
  119.     }
  120.     MPI_Finalize();
  121.     return 0;
  122. }
复制代码



mpimarix.png
result.PNG
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2018-11-28 15:57:02 | 显示全部楼层
QQ1273656880微信18613877980目录http://www.dvdtao.com http://www.hotziyuan.com(复制到浏览器打开)出售各地区高清DVD电影光盘,种类多品种齐全,有国产萝莉幼女酒店偷拍自拍,日本泰国韩国兽皇,死夜恶,电流拷问,强制子宫破坏女王调教M男,蛇缚,捆绑,鞭打,针刺,阉割,黑人对女优,熟女,学生制服,S级素人,丝袜制服,街头露出,筋肉美人,痴汉,摄盗,群体,犯罪;欧美无码无套,BDSM,重度调教。女优有仁科百華、北原多香子、苍井空、常盘樱子、村上里沙、大泽佑香、吉泽明步、立花里子、松岛枫、翔田千里、佐藤江梨花、紫彩乃、北条麻妃、吉崎直绪、明日花キララ、穂花等几百位名优专辑
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-4-26 12:49

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表