鱼C论坛

 找回密码
 立即注册
查看: 20319|回复: 77

[作品展示] 分享一个简单易用的python并行模块【PP模块】

[复制链接]
发表于 2016-4-25 18:25:56 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
目前个人计算机大都是多核的,但是在运行python程序的时候会发现实际上只有一个核心(CPU)在跑代码,另外几个核心都在偷懒呢,如下图

CPU.png

并行计算的目的是将所有的核心都运行起来以提高代码的执行速度,在python中由于存在全局解释器锁(GIL)如果使用默认的python多线程进行并行计算可能会发现代码的执行速度并不会加快,甚至会比使用但核心要慢!!!

一些并行模块通过修改pyhton的GIL机制突破了这个限制,使得Python在多核电脑中也能够有效的进行并行计算。PP(Parallel Python)模块就是其中一种。

pp模块是python的一个轻量级并行模块,能够有效提高程序运行效率,使用非常方便。

下面这段测试代码是计算从0到给定范围内所有质数的和,即计算0~100000,0~100100,... ,0~100700这8个范围内的所有质数的和:
import pp,time,math
def isprime(n):
    """Returns True if n is prime and False otherwise"""
    if not isinstance(n, int):
        raise TypeError("argument passed to is_prime is not of 'int' type")
    if n < 2:
        return False
    if n == 2:
        return True
    max = int(math.ceil(math.sqrt(n)))
    i = 2
    while i <= max:
        if n % i == 0:
            return False
        i += 1
    return True

def sum_pimes(n):
    """Calculates sum of all primes below given integer n"""
    return sum([x for x in range(2, n) if isprime(x)])

#串行代码
print("{beg}串行程序{beg}".format(beg='-'*16))
startTime = time.time()

inputs = (100000, 100100, 100200, 100300, 100400, 100500, 100600, 100700)
results = [ (input,sum_primes(input)) for input in inputs ]

for input, result in results:
    print("Sum of primes below %s is %s" % (input, result))

print("用时:%.3fs"%( time.time()-startTime ) )

#并行代码
print("{beg}并行程序{beg}".format(beg='-'*16))
startTime = time.time()

job_server = pp.Server()
inputs = (100000, 100100, 100200, 100300, 100400, 100500, 100600, 100700)
jobs = [(input, job_server.submit(sum_primes, (input, ), (isprime, ),
        ("math", )) ) for input in inputs]

for input, job in jobs:
    print("Sum of primes below %s is %s" % (input, job()))

print("用时:%.3fs"%( time.time()-startTime ) )
运行效果图:

sum_primeCP.png

由于楼主的电脑是伪4核(实际是2核,由于intel使用了超线程把它变成了4核的样子),因此效率只是提高了两倍,不过也还是不错了~
理论上你的电脑中实际有多少的个核心,通过并行计算就能提高多少被效率(实际的提高倍速会低一点)。

可以看到并行代码只是比串行代码多了几行,然而效率就翻倍了,看到这各位鱼油有木有动心呢

下面就开始正式介绍这个模块了

一:安装

1.从官网下载对应版本的PP模块:http://www.parallelpython.com/content/view/18/32/

我的系统是Windows,python版本是3.4.4因此选择了下面这个版本

installBag.png

2.在解压目录下打开命令行,输入python setup.py install就自动开始安装了(就是这么简单

install.gif

二:使用

1.导入模块
import pp 
2.开启服务
job_server = pp.Server() 
#ncpus = 4 #可以自己指定使用的核心数
#job_server = pp.Server(ncpus) #创建服务
#默认为使用全部核心
3.提交任务
f1 = job_server.submit(func1, args1, depfuncs1, modules1) 
#func1: 被并行执行的函数
#args1: func的参数,以元组的形式传入
#depfuncs1: 被func调用的函数,以元组的形式传入
#modules1: 函数执行需要调用的模块,以元组的形式传入
4.获取结果
r1 = f1()

下面根据之前的测试例子解释下pp模块的使用

子程序
math
def isprime(n):
    if not isinstance(n, int):
        raise TypeError("argument passed to is_prime is not of 'int' type")
    if n < 2:
        return False
    if n == 2:
        return True
    max = int(math.ceil(math.sqrt(n)))
    i = 2
    while i <= max:
        if n % i == 0:
            return False
        i += 1
    return True

def sum_pimes(n):
    return sum([x for x in range(2, n) if isprime(x)])
主程序
import pp
job_server = pp.Server()
inputs = (100000, 100100, 100200, 100300, 100400, 100500, 100600, 100700)
jobs = [(input, job_server.submit(sum_primes, (input, ), (isprime, ),
        ("math", )) ) for input in inputs]
for input, job in jobs:
    print("Sum of primes below %s is %s" % (input, job()))
第1行:导入pp模块
第2行:开启pp服务,没有填参数表示使用全部核心进行计算
第3行:设定任务,即程序需要计算0~100000,0~100100,... ,0~100700这8个范围内的所有质数的和
第4行:是一个列表推导式,它的作用是将inputs中的值传递给sum_primes,并且执行job_server.submit函数。
在job_server.submit的参数:
- sum_primes为被并行执行的函数,注意这里不能写成sum_primes()
- (input,)为sum_primes的参数即100000,100100,...,100700。注意这里要以元组形式传入,而","是元组的标志,因此括号中的逗号不能漏了
- (isprime,)是sum_primes执行过程中需要用到的函数,以元组形式传入
- ("math",)是sum_primes或isprime函数中需要用到的模块,以元组形式传入
最后两行:执行完第四行后得到的jobs列表中的每个元素都是一个二元组即(input,func)的形式。这两行的意思就是循环调用func,并打印结果。(通过函数调用的方式获取并行计算结果)
到这里一个使用pp模块进行并行计算的代码就实现了(并行计算就是如此简单 )。

随着任务的需求不同,代码量也会有所变化,不过基本过程就是以上四步。下面是我学习PP模块用到的一些资料(老规矩回复可见咯)

data.png

游客,如果您要查看本帖隐藏内容请回复



评分

参与人数 4荣誉 +23 鱼币 +22 贡献 +19 收起 理由
小火木 + 5 + 4 + 3 支持楼主!
零度非安全 + 5 + 5 + 3 感谢楼主无私奉献!
~风介~ + 5 + 5 + 5 好东西!
冬雪雪冬 + 8 + 8 + 8 热爱鱼C^_^

查看全部评分

本帖被以下淘专辑推荐:

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2016-4-25 21:21:15 | 显示全部楼层
刚学python,收藏起来备用
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-4-26 23:28:32 | 显示全部楼层
之前只知道thread模块,涨见识了!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-4-27 09:59:56 | 显示全部楼层
强烈支持楼主,哈哈
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-4-27 11:09:42 | 显示全部楼层
不错
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2016-4-27 17:35:24 | 显示全部楼层
厉害啊!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-4-27 21:01:05 | 显示全部楼层
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2016-4-28 08:46:26 | 显示全部楼层
感谢分享~~@
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-4-28 08:49:33 | 显示全部楼层
就想问怎么收藏额,好东西
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-4-28 19:53:00 | 显示全部楼层
谢谢您了楼主
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-4-29 12:57:21 | 显示全部楼层
又学到新知识了!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-4-29 19:56:55 | 显示全部楼层
支持楼主,学习了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-4-29 20:45:53 | 显示全部楼层
貌似很强大。小菜学习了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-5-2 12:12:44 | 显示全部楼层
楼主,厉害!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-5-2 14:16:27 | 显示全部楼层
下俩看看!!~
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-5-2 14:19:58 | 显示全部楼层
~风介~ 发表于 2016-4-26 23:28
之前只知道thread模块,涨见识了!

官方自己带的?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-5-4 15:19:08 | 显示全部楼层
支持楼主,学习了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-5-6 09:39:29 | 显示全部楼层
我靠,你也是真的很聪明啊
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-5-19 23:31:00 | 显示全部楼层
不服不行
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-5-20 10:43:22 | 显示全部楼层
学些
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-6 18:03

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表