|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
本帖最后由 Py与C。。。 于 2021-8-4 11:14 编辑
我用requests爬下来这样一段源码:
- {"filters":[],"red":"花","ret_type":"poemline-multi","ret_array":[{"dynasty":["唐"],"type":["poemline"],"literature_author":["李白"],"name":["杨花落尽子规啼,闻道龙标过五溪"],"source_poem":["闻王昌龄左迁龙标遥有此寄"],"display_name":["杨花落尽子规啼,闻道龙标过五溪"],"sid":["40ef283d7ad94206b9fb18a11049b1b2"],"source_poem_sid":["d6f4091694a544d085602c9c4a08ab23"],"source_poem_body":["杨花落尽子规啼,闻道龙标过五溪。 我寄愁心与明月,随君直到夜郎西。"]},{"dynasty":["唐"],"type":["poemline"],"literature_author":["王维"],"name":["人闲桂花落,夜静春山空"],"source_poem":["鸟鸣涧"],"display_name":["人闲桂花落,夜静春山空"],"sid":["d252c73ce28144bcb9876da1129e81d3"],"source_poem_sid":["d6f4091694a544d085602c9c4a08ab23"],"source_poem_body":["杨花落尽子规啼,闻道龙标过五溪。 我寄愁心与明月,随君直到夜郎西。"]}],"extra":{"entity-num":62857,"return-num":20,"total-page":200},"ad":[],"highlight":"蹄"}
复制代码
我想要display_name里面的内容,于是我用- re.findall(r'"display_name":["(.*?)"]',html)
复制代码 来匹配,可匹配不到,返回的是空列表,加re.S也不行。
有谁知道这是怎么回事吗?麻烦帮忙解决一下
用\转义一下就好了像这样 - re.findall(r'"display_name":\["(.*?)"\]',html)
复制代码
|
|