鱼C论坛

 找回密码
 立即注册
查看: 1097|回复: 2

爬取网站数据遇到的一些问题

[复制链接]
发表于 2022-5-1 14:44:59 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
import requests
from bs4 import BeautifulSoup



#使用requests获取网页数据
text = requests.get("https://www.maigoo.com/top/389455.html").text

#使用BeautifualSoup进行解析
main_page = BeautifulSoup(text,"html.parser") #后面这是html的解析器

table = main_page.find("table",attrs={"class":"mod_table table1 fcolor30"})

trs = table.find_all("tr")

f = open("电影票房555.csv",mode="a")

for tr in trs:
    lst = tr.find_all("td")
    if len(lst) != 0:
        for td in lst:
            # print(td.text)
            f.write(td.text)
            f.write(",")
        f.write("\n")
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2022-5-2 08:06:10 From FishC Mobile | 显示全部楼层
问题呢?!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-5-2 08:37:52 | 显示全部楼层
我这里运行没有问题,所以实在不清楚你遇到的问题是什么?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-11-18 12:34

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表