|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
本帖最后由 fnfhv 于 2021-8-1 21:36 编辑
import pandas as pd
from requests_html import HTMLSession
session = HTMLSession()
session.encoding = 'utf-8-sig'
url_table = 'http://ggzyjy.linyi.gov.cn/linyi/jyxx/012003/012003001/20170522/7119052f-0f87-481c-b77c-fe3f6e28f20c.html'
obj_t = session.get(url_table)
doc = obj_t.html.xpath("//div[@class='ewb-article-info']",first=True)#
print(doc.text)#该处出现乱码
df = pd.read_html(obj_t.text)[0]
if df.shape[1] == 2:
df = pd.DataFrame(df.values.T,index=None, columns=df.index)
print(df)#此处正常 |
|