Perf3ct 发表于 2020-4-6 20:23:46

求助关于pycharm爬虫的问题

import urllib.request
import chardet
import


def main():
    url = input('请输入要检查的URL:')
    response = urllib.request.urlopen(url)
    html = response.read()

    encode = chardet.detect(html)['encoding']
    if encode == 'GB2312':
      encode = 'GBK'

    print('该网页使用的是:%s编码' % encode)


if __name__ == '__main__':
    main()

053 讲的课后作业 用pycharm运行出错
输入为:http://fishc.com
错误如下:
urllib.error.URLError: <urlopen error 由于连接方在一段时间后没有正确答复或连接的主机没有反应,连接尝试失败。>

请问这要怎么解决呢?

Perf3ct 发表于 2020-4-6 20:25:15

第三行那个import是没有的哈 后面不小心加上去的

wp231957 发表于 2020-4-6 20:25:48

模拟浏览器
另:网页编码直接查看网页源代码就可以了,不用这么麻烦

zltzlt 发表于 2020-4-6 20:26:20

输入 https://ilovefishc.com/ 试试

Perf3ct 发表于 2020-4-6 20:30:03

zltzlt 发表于 2020-4-6 20:26
输入 https://ilovefishc.com/ 试试

可以了 原来是这样 感谢

qiuyouzhi 发表于 2020-4-6 20:30:43

Perf3ct 发表于 2020-4-6 20:25
第三行那个import是没有的哈 后面不小心加上去的

我这里用IDLE没有问题啊
你加上headers试试

Perf3ct 发表于 2020-4-8 15:29:26

qiuyouzhi 发表于 2020-4-6 20:30
我这里用IDLE没有问题啊
你加上headers试试

还没有学headers...
页: [1]
查看完整版本: 求助关于pycharm爬虫的问题