爬豆瓣top250代码messages项

songdata · 发表于 2019-11-14 20:32:20

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

# 资料
messages = []
targets = soup.find_all("div", class_="bd")
for each in targets:
try:
messages.append(each.p.text.split('\n')[1].strip() + each.p.text.split('\n')[2].strip())
except:
continue

复制代码

中的(each.p.text.split('\n')[1].strip() + each.p.text.split('\n')[2].strip())里 .split(\n)[1]取1位置怎么来的

这是网页中的节选
<p class="">
                        导演: 弗兰克·德拉邦特 Frank Darabont   主演: 蒂姆·罗宾斯 Tim Robbins /...<br>
                        1994 / 美国 / 犯罪剧情
                     </p>

split（'\n'）[0]是指的 <p class="">后的空行么？？

songdata · 发表于 2019-11-14 21:37:59

大神能不能顺便解释下这句话啥意思
depth = soup.find('span', class_='next').previous_sibling.previous_sibling.text

那两个.previous_sibling干啥的e~~~~~~~~~~~~~~~~~~~~~~~~~~~~··

账号		自动登录	找回密码
密码			立即注册