求大佬帮我看看，我的代码为啥没反应

枕思谦 · 发表于 2021-3-31 19:14:21

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

import urllib.parse
import re
import urllib.request
from bs4 import BeautifulSoup
def main():
baseurl='https://movie.douban.com/top250'

get(baseurl)
def main():...

findlink = re.compile(r'<a href="(.*?)">')
findimg = re.compile(r'<img alt="肖申克的救赎" class="" src="(.*)"width="100"/>')

def get(baseurl):

datalist = []

for i in range(0,2):
      url=baseurl+str(i*25)
      html=geturl(url)#'保存获取到的页源码'
      soup = BeautifulSoup(html, 'html.parser')#'逐一解析数据'
      for item in soup.findAll('div',class_="item"):#'查找符合要求的字符串，并形成列表'
         data = []  # '用来存放电影的所有信息'
         item=str(item)

         link=soup.re.findall(findlink,item)[0]
         data.append(link)
         img=re.findall(findimg,item)
         data.append(img)
         datalist.append(data)
         print(datalist)
def geturl():
url = 'https://movie.douban.com/top250'
head = {
      'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.90 Safari/537.36 Edg/89.0.774.63'}
req = urllib.request.Request(url, headers=head)
response = urllib.request.urlopen(req)
# print(response.read().decode('utf-8'))
html = response.read()
if __name__=='__main__':
main()

Daniel_Zhang · 发表于 2021-4-1 02:45:41

你为什么会有两个 main()

Daniel_Zhang · 发表于 2021-4-1 02:48:22

而且

为什么你的 geturl() 一会儿传入一个值一会儿不传入值？

截屏2021-04-01 02.46.53.png

枕思谦 · 发表于 2021-4-1 09:07:47

Daniel_Zhang 发表于 2021-4-1 02:48
而且

为什么你的 geturl() 一会儿传入一个值一会儿不传入值？

我也布吉岛啊

账号		自动登录	找回密码
密码			立即注册

求大佬帮我看看，我的代码为啥没反应

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块