|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
本帖最后由 肥^o^帅 于 2019-5-22 10:08 编辑
代码先上- import requests
- import re
- import os
- import bs4
- def open(url):
- res=requests.get(url)
- return res
- url='http://www.yanwenzi.com/changyong/'
- res=open(url)
- res.encoding=res.apparent_encoding
- soup=bs4.BeautifulSoup(res.text,'html.parser')
- content=[]
- name=[]
- targets=soup.find_all('li')
- for each in targets:
- content.append(each.p)
- content=content[23:]
- for each in targets:
- name.append(each.div)
- name=name[23:]
- for i in range(len(name)):
- print('{}\n{}'.format(content[i],name[i]))
复制代码
这样爬取颜文字表情,但是结果却是这样:
<p>w(゚Д゚)w</p>
<div>啊啊</div>
<p>(ノへ ̄、)</p>
<div>擦眼泪</div>
<p>( ̄_, ̄ )</p>
<div>不屑</div>
<p>ヽ(✿゚▽゚)ノ</p>
<div>好耶</div>
<p>(๑•̀ㅂ•́)و✧</p>
<div>棒</div>
<p>( ̄ε(# ̄)☆╰╮o( ̄皿 ̄///)</p>
<div>抽</div>
<p>(づ ̄3 ̄)づ╭❤~</p>
<div>亲</div>
<p>Σ( ° △ °|||)︴</p>
<div>汗</div>
<p>(~ ̄(OO) ̄)ブ</p>
<div>笨</div>
<p>凸(艹皿艹 )</p>
<div>擦</div>
<p>(*  ̄3)(ε ̄ *)</p>
<div>啵啵</div>
<p>(* ̄rǒ ̄)</p>
<div>挖鼻屎</div>
<p>┗|`O′|┛ 嗷~~</p>
<div>嗷</div>
<p>φ(≧ω≦*)♪</p>
<div>乐</div>
<p>︿( ̄︶ ̄)︿</p>
<div>飞</div>
<p>(u‿ฺu✿ฺ)</p>
<div>好滴</div>
<p>Hi~ o(* ̄▽ ̄*)ブ</p>
<div>hi</div>
<p>♪(^∇^*)</p>
<div>啦啦</div>
<p>o(*≧▽≦)ツ┏━┓</p>
<div>拍桌</div>
<p>╰(*°▽°*)╯</p>
<div>惊喜</div>
>>>
p标签和div标签里的内容怎么正确显示? |
|