鱼C论坛

 找回密码
 立即注册
查看: 1224|回复: 3

[已解决]python request采集 正则 只能匹配一行,是啥情况

[复制链接]
发表于 2021-12-5 23:20:49 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
python request采集 正则 只能匹配一行,是啥情况
哪位大神帮我看一下,这正则 是哪里的问题,
代码如下,
我想匹配
SON_DATA.push(["48","603806","福斯特","196","9,838","-2,852","1247536.86","10.34","-3.31"]); 中的

603806   福斯特
里面有多行数据,代码我贴出来下面
这正则 应该怎么写才可以匹配到呢,谢谢
import requests
import re

def get_html(url):
    try:
        resp = requests.get(url)
        return resp.text
    except Exception as e:
        print(e)

if __name__ == "__main__":

   url = 'http://fund.jrj.com.cn/action/fhs/list.jspa?thisReportDate=0'
   html = get_html(url)
   print(html)




   pattern = re.compile(r'(?<=("))[\u4e00-\u9fa5]+(?=")',re.S)



   searchObj = pattern.search(html)


   print(searchObj.group())
最佳答案
2021-12-6 11:20:30
import requests
import re

def get_html(url):
    try:
        resp = requests.get(url)
        return resp.text
    except Exception as e:
        print(e)

if __name__ == "__main__":

   url = 'http://fund.jrj.com.cn/action/fhs/list.jspa?thisReportDate=0'
   html = get_html(url)


   pattern = re.compile(r'JSON_DATA.push\(\["\d+","(\d{6})","(.*?)".*?\]\);',re.S)



   searchObj = pattern.finditer(html)
   for each in searchObj:
           print(each.group(1),each.group(2))
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2021-12-6 10:53:14 | 显示全部楼层
帮我看一下,谢谢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-12-6 11:20:30 | 显示全部楼层    本楼为最佳答案   
import requests
import re

def get_html(url):
    try:
        resp = requests.get(url)
        return resp.text
    except Exception as e:
        print(e)

if __name__ == "__main__":

   url = 'http://fund.jrj.com.cn/action/fhs/list.jspa?thisReportDate=0'
   html = get_html(url)


   pattern = re.compile(r'JSON_DATA.push\(\["\d+","(\d{6})","(.*?)".*?\]\);',re.S)



   searchObj = pattern.finditer(html)
   for each in searchObj:
           print(each.group(1),each.group(2))
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-12-6 12:16:09 | 显示全部楼层
specail 发表于 2021-12-6 11:20
import requests
import re

从来没听说过,正则还需要循环的,这是啥原理 ,老铁
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-12 16:02

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表