马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
我在爬小说时出现 AttributeError: 'list' 对象没有属性 'appeend 请问怎么解决??Traceback (most recent call last):
File "C:\Users\HSL\PycharmProjects\pythonProject1\1.py", line 17, in <module>
chapter_url_list.appeend(url)
AttributeError: 'list' object has no attribute 'appeend
import requests
import re
import time
book_url = 'https://www.imiaobige.com/read/222184/'
base_url = 'https://www.imiaobige.com'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.96 Safari/537.36 Edg/88.0.705.50',
}
response_1=requests.get(book_url,headers=headers)
response_1.encoding = 'utf-8'
chapter=response_1.text
regx = '<li><a href="(.*)">'
chapter_href_list=re.findall(regx, response_1.text)
chapter_url_list=[]
for i in chapter_href_list:
url = base_url + i
chapter_url_list.appeend(url)
content_regx = '><p>(.*?)</p>'
title_regx = '<em>(.*?)</em>'
save_path = '123.txt'
count=0
with open (save_path,'a+',encoding="utf-8") as f:
#从存放小说章节地址的列表中依次去除小说地址,让requests通过get方法去取货
for x in chapter_url_list:
#一直向小说章节所在地址发送请求并获得响应,直到响应里面没有 ”503 Service Temporarily Unavailable“
while 1:
response_2=requests.get(x,headers=headers)
if '503 Service Temporarily Unavailable' not in response_2.text:
break
# 暂停一会儿
else:
print('漏数据了,3 秒之后继续爬')
time.sleep(3)
#设定编码,解决乱码
response_2.encoding='utf-8'
#小说标题,匹配到的是列表
title=re.findall(title_regx, response_2.text)
#正文内容,匹配到的是列表
content=re.findall(content_regx, response_2.text)
#写入小说标题
f.write('--------'+title[0]+'--------'+'\n')
#将小说内容这个列表中的所有元素写入文件,每写入一个就换一次行
for e in content:
f.write(e+'\n')
#每成功写入一章 count 就加 1
count+=1
# format函数用于格式化输出
print('第{}章 标题 : {} 爬取完毕!'.format(count,title[0]))
17行chapter_url_list.appeend(url)改为chapter_url_list.append(url)
|