鱼C论坛

 找回密码
 立即注册
查看: 1910|回复: 3

[已解决]if __name__ == '__main__'

[复制链接]
发表于 2020-11-10 20:55:12 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
小甲鱼课里讲if __name__ == '__main__'在模块里面,可以让模块的if部分作为模块使用时不执行。
但是我在很多主程序里也看到这个代码,这个在主程序里的作用是什么
最佳答案
2020-11-11 09:18:47
__name__ == '__main__'  在主程序里也是有作用的

在Windows操作系统中由于没有fork,在创建子进程的时候会自动以 import 启动,导致递归。所以必须把创建子进程的部分写在if __name__ =='__main__'中。
import urllib.request as request
from multiprocessing import Pool
import os, re

User_Agent = 'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:47.0) Gecko/20100101 Firefox/47.0'
headers = dict.fromkeys(('User-Agent',),User_Agent)

def get_page(url):
    req = request.Request(url=url, headers=headers)
    try:
        res = request.urlopen(req).read().decode('utf-8')
    except:
        print(f'{os.getpid():<6d}请求失败')
        return url
    else:
        print(f'{os.getpid():<6d}请求成功')
        return res
        
def get_title(res):
    if title:=re.search(r'(?<=\<title\>).*?(?=</title>)', res):
        print(f'{os.getpid():<6d}解析网页标题为 {title.group()}')
    else:
        print(f'{os.getpid():<6d}解析不到 {res} 的网页标题')

if __name__ == '__main__':

    p = Pool(3)
    
    urls=[
        'https://www.baidu.com',
        'https://www.bilibili.com',
        'https://twitter.com',
        'https://cn.bing.com/',
        'https://mail.163.com/',
        'https://dict.hjenglish.com/',
        'https://github.com/'
    ]

    for url in urls:
        res = p.apply_async(get_page, args=(url,), callback=get_title)
        
    p.close()
    p.join()
    print('完成')
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-11-10 20:57:46 | 显示全部楼层


在主程序中可以直接去掉,没多大意义

但是如果作为模块代码中有这串代码,那么当模块代表被当成模块导入时

if __name__ == '__main__' 下面的代码块将不被执行

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

发表于 2020-11-10 21:11:55 | 显示全部楼层
本帖最后由 昨非 于 2020-11-10 21:14 编辑

if name == 'main’的意思是:
当.py文件被直接运行时,if name == 'main’之下的代码块将被运行;
当.py文件以模块形式被导入时,if name == 'main’之下的代码块不被运行。


也就是说,你模块里有一个函数,如果这个.py文件(包含定义调用)本身运行,的if name == 'main’后面的调用部分是执行的,
如果这个函数在其他地方调用,那么这个.py文件本身的调用部分就不能执行,也就是上面说的跳过(加粗的调用)的意思
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-11-11 09:18:47 | 显示全部楼层    本楼为最佳答案   
__name__ == '__main__'  在主程序里也是有作用的

在Windows操作系统中由于没有fork,在创建子进程的时候会自动以 import 启动,导致递归。所以必须把创建子进程的部分写在if __name__ =='__main__'中。
import urllib.request as request
from multiprocessing import Pool
import os, re

User_Agent = 'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:47.0) Gecko/20100101 Firefox/47.0'
headers = dict.fromkeys(('User-Agent',),User_Agent)

def get_page(url):
    req = request.Request(url=url, headers=headers)
    try:
        res = request.urlopen(req).read().decode('utf-8')
    except:
        print(f'{os.getpid():<6d}请求失败')
        return url
    else:
        print(f'{os.getpid():<6d}请求成功')
        return res
        
def get_title(res):
    if title:=re.search(r'(?<=\<title\>).*?(?=</title>)', res):
        print(f'{os.getpid():<6d}解析网页标题为 {title.group()}')
    else:
        print(f'{os.getpid():<6d}解析不到 {res} 的网页标题')

if __name__ == '__main__':

    p = Pool(3)
    
    urls=[
        'https://www.baidu.com',
        'https://www.bilibili.com',
        'https://twitter.com',
        'https://cn.bing.com/',
        'https://mail.163.com/',
        'https://dict.hjenglish.com/',
        'https://github.com/'
    ]

    for url in urls:
        res = p.apply_async(get_page, args=(url,), callback=get_title)
        
    p.close()
    p.join()
    print('完成')
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-18 00:19

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表