lyk199702 发表于 2022-6-16 02:24:09

谢谢

w13323948825 发表于 2022-6-16 11:35:45

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36',
    'cookie': 'BIDUPSID=45588421F978DE2902A1A47464D72AB3; PSTM=1609986056; BAIDUID=45588421F978DE29E3D21BB7BB5A6873:FG=1; REALTIME_TRANS_SWITCH=1; FANYI_WORD_SWITCH=1; HISTORY_SWITCH=1; SOUND_SPD_SWITCH=1; SOUND_PREFER_SWITCH=1; __yjs_duid=1_e3607a56e43709e2ca3db4147c46396a1612784778582; BAIDUID_BFESS=45588421F978DE29E3D21BB7BB5A6873:FG=1; Hm_lvt_64ecd82404c51e03dc91cb9e8c025574=1614696427; Hm_lpvt_64ecd82404c51e03dc91cb9e8c025574=1614697139; __yjsv5_shitong=1.0_7_253e552513b2cf371866473b2e57fb4e5137_300_1614697145680_59.50.85.17_fe15699c; ab_sr=1.0.0_ZDRiZDU1NjAzNjRkMDUyOWE3ZTg3MWZlMjRhMGE4NzkwYmI3N2ExMzliMjY3MjIxOGIyY2EyMmMxNWQzOWFmY2UyZDZjMGFkYzVjNWZkNGQ1ZWIxMTJmYjZjM2Y0M2M2'
    }
url_start = 'https://www.ibswtan.com/17/17023/'# 凡人修仙传

# 创建书签
if '书签.txt' not in os.listdir():
    withopen('书签.txt', 'w') as f:
      f.write('1146042.html')# 第一章

end = ''
while end != 'q':
    withopen('书签.txt', 'r') as f:
      now = f.read()
    url = url_start + now
    res = requests.get(url=url, headers=headers)
    res.encoding = "utf-8"# 解码不行就gbk
    soup = bs4.BeautifulSoup(res.text, "html.parser")
    title = soup.find_all('h1')
    print(f"==========   {title.text}   =============")
    targets = soup.find_all("div", id="content")
    for i in targets:
      if str(i) != '<br/>' and str(i) != '\n':
            print(i)
            end = input()# 回车下一行,输入q结束,我喜欢一行一行读
            if end == 'q':
                break
    if end == 'q':
      break
    next_ = soup.find_all('a', text='下一章')
    withopen('书签.txt', 'w') as f:
      f.write(str(next_).split('"'))
    end = input('回车下一章')

w13323948825 发表于 2022-6-16 11:36:25

先学习一下。

accustem 发表于 2022-6-16 22:10:04

好奇,看看是什么样的代码

LYLR261002 发表于 2022-6-26 08:30:44

明月光_c_py 发表于 2022-6-27 11:46:39

1

ljp2213 发表于 2022-6-30 07:40:14

1

龘閖神 发表于 2022-7-4 18:25:24

3Q

fuyekongzhou 发表于 2022-7-8 14:07:23


3Q

打不起精神的你 发表于 2022-7-8 22:05:51

johnnysss 发表于 2022-7-11 18:31:23

{:5_109:}

体育老师~python 发表于 2022-7-12 06:32:27

学习

linruibin 发表于 2022-7-12 10:24:38

可以

电镜终结者 发表于 2022-7-12 11:11:07

6666666666666666666

小小鑫 发表于 2022-7-12 13:08:26

深海漩涡 发表于 2022-7-12 13:32:42

爬虫爬取纯妹妹网每个页面的图片

青出于蓝 发表于 2022-7-12 14:35:40

学习

street 发表于 2022-7-12 21:34:25

好好看看

追逐一场日落 发表于 2022-8-2 10:44:55

不可以涩涩

liujingyin 发表于 2022-8-5 18:58:49

1
页: 82 83 84 85 86 87 88 89 90 91 [92] 93 94 95 96 97 98 99 100
查看完整版本: 爬虫爬取纯妹妹网每个页面的图片