鱼C论坛

 找回密码
 立即注册
查看: 1057|回复: 2

[已解决]爬虫

[复制链接]
发表于 2020-7-29 20:28:47 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
import bs4
import re
import requests

class Noveldownload:
    def __init__(self):
        self.session=requests.Session()

    def get_novel(self,url):
        index_html = self.download(url,encoding='utf-8')
      



    def download(self,url,encoding):
        response = self.session.get(url)
        response.encoding= encoding
        html = response.text
        return html

    def get_chapter_info(self,index_html):
        div= re.findall(r'<div class="box_con">.*?</div>',index_html,re.S)[0]
        print(div)


if __name__=='__main__':
    url ='https://www.xiaoshuo530.com/files/article/info/7/7834.html'
   
    s=Noveldownload()
   
    s.get_novel(url)

  运行没错误,但为啥不打印啊


要爬的数据:
</script>

<div class="box_con">
        <div id="list">
                <dl>
                        <dt>《****.》最新章节(提示:已启用缓存技术,最新章节可能会延时显示,登录书架即可实时查看。)</dt>
                                                <dd> <a style="" href="/files/article/html/7/7834/2267508.html">第1796章</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/2266187.html">第1795章</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/2263155.html">第1794章</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/2261749.html">第1793章</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/2259888.html">第1792章</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/2259887.html">第1791章</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/2259886.html">第1790章</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/2248656.html">第1789章</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/2247770.html">第1788章</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/2247517.html">第1787章</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/2247516.html">第1786章</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/2244722.html">第1785章</a></dd>
                                               
                        <dt>《****.》正文</dt>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616932.html">正文</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616933.html">第一卷 第1章 ****</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616934.html">第一卷 第2章 死人变活</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616935.html">第一卷 第3章 不看白不看</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616936.html">第一卷 第4章 漂亮的女邻居</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616937.html">第一卷 第5章 可爱的女学生</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616938.html">第一卷 第6章 帮我揉下肚子</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616939.html">第一卷 第7章 借东西</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616940.html">第一卷 第8章 洗澡间的水声</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616941.html">第一卷 第9章 遇袭</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616942.html">第一卷 第10章 天仙少女</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616943.html">第一卷 第11章 不舒服</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616944.html">第一卷 第12章 他是**</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616945.html">第一卷 第13章 陷害</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616946.html">第一卷 第14章 非池中之物</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616947.html">第一卷 第15章 奇遇</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616948.html">第一卷 第16章 练功</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616949.html">第一卷 第17章 迷人的表姐</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616950.html">第一卷 第18章 占便宜</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616951.html">第一卷 第19章 乘人之危</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616952.html">第一卷 第20章 你放开我</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616953.html">第一卷 第21章 再次遇袭</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616954.html">第一卷 第22章 我要变强</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616955.html">第一卷 第23章 冷美人</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616956.html">第一卷 第24章 商议</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616957.html">第一卷 第25章 常乐赌场</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616958.html">第一卷 第26章 带刺的玫瑰</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616959.html">第一卷 第27章 小花</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616960.html">第一卷 第28章 两次特异功能</a></dd>
                                                <dd> <a style="" href="/files/article/html/7/7834/1616961.html">第一卷 第29章 我不是故意的</a></dd>
最佳答案
2020-7-29 20:59:02

因为你没有调用 get_chapter_info 函数呀,print 函数在这个方法里面所以才会打印哈

帮你的 index_html 换成实例属性了,直接用,代码改成这样就好:
import bs4
import re
import requests


class Noveldownload:
    def __init__(self):
        self.session = requests.Session()

    def get_novel(self, url):
        self.index_html = self.download(url, encoding='utf-8')


    def download(self, url, encoding):
        response = self.session.get(url)
        response.encoding = encoding
        html = response.text
        return html

    def get_chapter_info(self):
        div = re.findall(r'<div class="box_con">.*?</div>', self.index_html, re.S)[0]
        print(div)


if __name__ == '__main__':
    url = 'https://www.xiaoshuo530.com/files/article/info/7/7834.html'

    s = Noveldownload()
    s.get_novel(url)
    s.get_chapter_info()
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-7-29 20:59:02 | 显示全部楼层    本楼为最佳答案   

因为你没有调用 get_chapter_info 函数呀,print 函数在这个方法里面所以才会打印哈

帮你的 index_html 换成实例属性了,直接用,代码改成这样就好:
import bs4
import re
import requests


class Noveldownload:
    def __init__(self):
        self.session = requests.Session()

    def get_novel(self, url):
        self.index_html = self.download(url, encoding='utf-8')


    def download(self, url, encoding):
        response = self.session.get(url)
        response.encoding = encoding
        html = response.text
        return html

    def get_chapter_info(self):
        div = re.findall(r'<div class="box_con">.*?</div>', self.index_html, re.S)[0]
        print(div)


if __name__ == '__main__':
    url = 'https://www.xiaoshuo530.com/files/article/info/7/7834.html'

    s = Noveldownload()
    s.get_novel(url)
    s.get_chapter_info()
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-7-29 21:33:07 | 显示全部楼层
Twilight6 发表于 2020-7-29 20:59
因为你没有调用 get_chapter_info 函数呀,print 函数在这个方法里面所以才会打印哈

帮你的 index_htm ...

感谢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-19 16:56

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表