|
|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
想问一下这个def load_page(self)中 ,self怎么写,headers 和 user_agent 算是属性吗,这么写的对不对。
- # _*_ coding:utf-8_*_
- import urllib.request
- class Spider:
- '''
- 网页的一个爬虫类
- '''
- def load_page(self):
- user_agent = 'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; 360SE)'
- headers = {'User-Agent':user_agent}
- self.html = input('请输入网址:')
- self.req = urllib.request.Request(self.html,headers = headers)
- self.response = urllib.request.urlopen(self.req)
- self.file = self.response.read()
- return self.file
- # main
- if __name__ == "__main__":
- #创建一个Sipder类
- spider = Spider()
- the_page = spider.load_page()
- print(the_page)
复制代码
|
|