马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
本帖最后由 萌萌哒的大黑哥 于 2017-3-29 14:21 编辑
各位大佬帮小弟看一看,本人python新手,看了几天小甲鱼老师的视频,做了一个简易的天气查询,但是在从中国天气网上爬取过程中爬取出来的数据出现乱码,而且是部分,大体来说我也不太清楚。。。描述不清。。。简单说一下问题,第一个是乱码问题,第二个是爬取的数据只有部分,只爬取了第一次索引到的数据,各位帮我看一看,谢谢各位了
第一次发帖,有问题希望各位提出,我会认真吸取并改正
python版本是2.7# -*- coding: utf-8 -*-
import urllib
import re
def gethtml(url):
page=urllib.urlopen(url)
html=page.read()
return html
def getWeather(html):
dayre=re.search('<h1>(?P<a>.+?)</h1>',html)
weare=re.search('class="wea">+(?P<b>.+?)+</p>',html)
cre=re.search('</span>/<i>+(?P<c>.+?)+</i>',html)
if (dayre):
a=dayre.group("a")
print '今天是',a
if (weare):
b=weare.group("b")
print '天气是',b
if (cre):
c=cre.group("c")
print '温度是',c
html=gethtml('http://www.weather.com.cn/weather/101240101.shtml')
getWeather(html)
|