感谢感谢,向楼主学习
厉害了
楼主威武
有用,收藏
{:10_256:}
{:10_282:}
哇哦挺一个
看一下~
研究研究
{:7_112:}
前来支持一下楼主,顺便学习下代码
好东西
weiter 发表于 2020-12-27 22:07
还是代码的好玩(虽然我还到不了这个层次)
bug复制法:打开QQ对话框,选中百度文库文字,直接 ...
拖到桌面就行,自动生成 .txt
{:10_277:}
顶起
本帖最后由 basketmn 于 2021-1-15 20:17 编辑
看看!!!
没搞懂,怎么复制,粘贴呢?
{:5_95:}
为什莫我复制进去的链接总是错误呢?
本帖最后由 v.ki 于 2021-1-16 10:16 编辑
我刚才看了下,百度文库官方更改了策略
basketmn 发表于 2021-1-16 07:07
为什莫我复制进去的链接总是错误呢?
import requests
from bs4 import BeautifulSoup
url = 'https://wenku.baidu.com/view/6e47f32a846a561252d380eb6294dd88d1d23d72.html'
header = {'User-agent': 'Googlebot'}
res = requests.get(url , headers = header)
res.text
print(res.text)
plist = []
soup = BeautifulSoup(res.content, "html.parser")
plist.append(str(soup.title))
for div in soup.find_all('div', attrs={"class": "bd doc-reader"}):
plist.extend(div.get_text().split('\n'))
plist =
plist =
plist
file = open('test.txt', 'w',encoding='utf-8')
for str in plist:
file.write(str)
file.write('\n')
file.close()