basketmn 发表于 2021-1-16 07:07
为什莫我复制进去的链接总是错误呢?
import requests
from bs4 import BeautifulSoup
url = 'https://wenku.baidu.com/view/6e47f32a846a561252d380eb6294dd88d1d23d72.html'
header = {'User-agent': 'Googlebot'}
res = requests.get(url , headers = header)
res.text
print(res.text)
plist = []
soup = BeautifulSoup(res.content, "html.parser")
plist.append(str(soup.title))
for div in soup.find_all('div', attrs={"class": "bd doc-reader"}):
plist.extend(div.get_text().split('\n'))
plist =
plist =
plist
file = open('test.txt', 'w',encoding='utf-8')
for str in plist:
file.write(str)
file.write('\n')
file.close()
6
学习一下
回复是一种美德
谢谢楼主
大佬,为什么保存文件时,无论选什么格式,最后都只能保存为txt,想要里面的图片
支持
basketmn 发表于 2021-1-18 14:28
大佬,为什么保存文件时,无论选什么格式,最后都只能保存为txt,想要里面的图片
这个按钮的唯一作用就是我当时为了提醒大家,只能爬取这几种类型的文档,而不是用来设置保存格式的,doc和txt的都会保存为txt若是爬取的为ppt,则会在于程序相同目录下生成一个新的文件夹里面放了想要的图片
goooood
这一回复就给我蹦出来几百条代码有把我吓到
{:10_333:}
Thank you !!
这个有点厉害了,必须学习
大佬够屌,希望有一天我也能自己写出来能用的工具。
支持支持
学习学习
谢谢分享,值得我们学习
支持!
我来告诉大家为什么背后会有'v.k.'因为这是'vk的python不安全'这个公众号里的内容