首先,请确保您已经安装了 parsel 和 requests 库。如果没有安装,可以使用以下命令安装:pip install parsel requests
然后,您可以使用以下代码来爬取城市和最低温度:import requestsfrom parsel import Selectorurl = "http://www.weather.com.cn/textFC/hb.shtml"# 发送请求并获取页面内容response = requests.get(url)response.encoding = "utf-8"html_content = response.text# 使用Parsel解析页面selector = Selector(text=html_content)# 定位城市和最低温度的XPathcities_xpath = "//div[contains(@class, 'conMidtab')]//td[2]/a/text()"min_temps_xpath = "//div[contains(@class, 'conMidtab')]//td[8]/text()"# 提取城市和最低温度cities = selector.xpath(cities_xpath).getall()min_temps = selector.xpath(min_temps_xpath).getall()# 将结果打印出来for city, min_temp in zip(cities, min_temps): print(f"{city}: {min_temp}")
这段代码首先发送一个请求到目标网址并获取HTML内容。接着,使用Parsel的 Selector 解析页面,然后根据XPath提取城市和最低温度的数据。最后,将结果打印出来。
请注意,这个代码只适用于该网址的当前结构。如果页面结构发生改变,您可能需要更新XPath以获取正确的数据。 |