枕思谦 发表于 2021-3-31 19:14:21

求大佬帮我看看,我的代码为啥没反应

import urllib.parse
import re
import urllib.request
from bs4 import BeautifulSoup
def main():
    baseurl='https://movie.douban.com/top250'

    get(baseurl)
def main():...


findlink = re.compile(r'<a href="(.*?)">')
findimg = re.compile(r'<img alt="肖申克的救赎" class="" src="(.*)"width="100"/>')

def get(baseurl):

    datalist = []

    for i in range(0,2):
      url=baseurl+str(i*25)
      html=geturl(url)#'保存获取到的页源码'
      soup = BeautifulSoup(html, 'html.parser')#'逐一解析数据'
      for item in soup.findAll('div',class_="item"):#'查找符合要求的字符串,并形成列表'
            data = []# '用来存放电影的所有信息'
            item=str(item)


            link=soup.re.findall(findlink,item)
            data.append(link)
            img=re.findall(findimg,item)
            data.append(img)
            datalist.append(data)
            print(datalist)
def geturl():
    url = 'https://movie.douban.com/top250'
    head = {
      'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.90 Safari/537.36 Edg/89.0.774.63'}
    req = urllib.request.Request(url, headers=head)
    response = urllib.request.urlopen(req)
    # print(response.read().decode('utf-8'))
    html = response.read()
if __name__=='__main__':
    main()

Daniel_Zhang 发表于 2021-4-1 02:45:41



你为什么会有两个 main()

Daniel_Zhang 发表于 2021-4-1 02:48:22

而且

为什么你的 geturl() 一会儿传入一个 值 一会儿不传入 值?

枕思谦 发表于 2021-4-1 09:07:47

Daniel_Zhang 发表于 2021-4-1 02:48
而且

为什么你的 geturl() 一会儿传入一个 值 一会儿不传入 值?

我也布吉岛啊
页: [1]
查看完整版本: 求大佬帮我看看,我的代码为啥没反应