鱼C论坛

 找回密码
 立即注册
查看: 1143|回复: 1

[已解决]萌新求问爬虫第一步

[复制链接]
发表于 2020-6-30 16:43:09 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
求问各位大佬们,我想从0开始学习爬虫,找了一个帖子https://www.cnblogs.com/www1707/p/10692298.html
他里面有个URL:https://wordpress-edu-3autumn.lo ... bout-the-future_04/
我打不开这个URL,求问通过什么途径可以打开吗
最佳答案
2020-6-30 20:11:54
本帖最后由 suchocolate 于 2020-6-30 20:15 编辑

是这个网站的问题,无法登陆,你换其他网址练习,比如:http://httpbin.org
1)get练习
import requests

headers={'User-Agent': 'Mozilla/5.0'}

r=requests.get('http://httpbin.org/get',  headers=headers)
print('status code is ' + str(r.status_code))
print(r.text)
2)post练习
import requests

headers={'User-Agent': 'Mozilla/5.0'}

data={
'name': 'suchocolate',
'time': '20190103'
}

r=requests.post('http://httpbin.org/post', data=data, headers=headers)
print('status code is ' + str(r.status_code))
print(r.text)

另外系统学习爬虫还是买本书,网上的查查特殊使用还可以,爬虫遵循一定的规律和方法,网上东一块西一块可能会误导你,耽误时间。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-6-30 20:11:54 | 显示全部楼层    本楼为最佳答案   
本帖最后由 suchocolate 于 2020-6-30 20:15 编辑

是这个网站的问题,无法登陆,你换其他网址练习,比如:http://httpbin.org
1)get练习
import requests

headers={'User-Agent': 'Mozilla/5.0'}

r=requests.get('http://httpbin.org/get',  headers=headers)
print('status code is ' + str(r.status_code))
print(r.text)
2)post练习
import requests

headers={'User-Agent': 'Mozilla/5.0'}

data={
'name': 'suchocolate',
'time': '20190103'
}

r=requests.post('http://httpbin.org/post', data=data, headers=headers)
print('status code is ' + str(r.status_code))
print(r.text)

另外系统学习爬虫还是买本书,网上的查查特殊使用还可以,爬虫遵循一定的规律和方法,网上东一块西一块可能会误导你,耽误时间。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-20 04:42

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表