马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
本帖最后由 getfeel 于 2020-8-22 20:16 编辑
同一个url,同样的headers,使用浏览器就不会分页,用requests 去爬就会分页
----------------------------------------------------------------------------------------
更新一下,使用浏览器抓取的cookies正常。但是requests获取的cookies就会分页。
目前来看可能是服务器在浏览的过程中在某一步对cookies做了一下认证之类的操作。
这是浏览器返回的部分代码<form name="form" method="post" action="query_list.jsp">
<input type="hidden" name="order_field" value="Name">
<input type="hidden" name="parent_id" value="1623">
<input type="hidden" name="page_num" value="1">
<input type="hidden" name="total_pages" value="1">
<input type="hidden" name="title" value="">
<input type="hidden" name="note" value="">
<input type="hidden" name="disp_mode" value="">
<input type="hidden" name="QueryModule" value="查询管理器">
<input type="hidden" name="BusinessID" value="">
<input type="hidden" name="GroupID" value=""><!-- 添加到的目的组 -->
<table border="0" width="100%" cellspacing="1" cellpadding="1">
<tr height="33">
<td nowrap>
<select class="filter_combox" name="filter_combox" size="1" onMouseMove="window.status='请选择过滤字段'" onMouseOut="window.status=''">
<option value="Name">名称</option>
<option value="DispMode">显示形式</option>
<option value="Owner">拥有者</option>
<option value="Note">备注</option>
</select>
<span title="请输入过滤条件">
<input name="filter_input" size="14" value="">
</span>
<input type="button" value="过滤" name="filter_btn" onclick="javascript:filter()">
</td>
<td align="right" nowrap>共27条记录 第1页 共1页 </td>
<td width="110" align="right" nowrap>
<input type="text" name="pages_input" size="6" value="页码" onFocus="this.value=''">
<span title="请输入跳转页码">
<input type="button" value="跳转" name="goto_btn" onclick="goToPage()">
</span>
</td>
</tr>
这是request返回的:<form name="form" method="post" action="query_list.jsp">
<input type="hidden" name="order_field" value="Name">
<input type="hidden" name="parent_id" value="1623">
<input type="hidden" name="page_num" value="1">
<input type="hidden" name="total_pages" value="2">
<input type="hidden" name="title" value="">
<input type="hidden" name="note" value="">
<input type="hidden" name="disp_mode" value="">
<input type="hidden" name="QueryModule" value="??ヨ?㈢?$?????">
<input type="hidden" name="BusinessID" value="">
<input type="hidden" name="GroupID" value=""><!-- 添加到的目的组 -->
<table border="0" width="100%" cellspacing="1" cellpadding="1">
<tr height="33">
<td nowrap>
<select class="filter_combox" name="filter_combox" size="1" onMouseMove="window.status='请选择过滤字段'" onMouseOut="window.status=''">
<option value="Name">名称</option>
<option value="DispMode">显示形式</option>
<option value="Owner">拥有者</option>
<option value="Note">备注</option>
</select>
<span title="请输入过滤条件">
<input name="filter_input" size="14" value="">
</span>
<input type="button" value="过滤" name="filter_btn" onclick="javascript:filter()">
</td>
<td align="right" nowrap>共27条记录 第1页 共2页 </td>
<td width="110" align="right" nowrap>
<input type="text" name="pages_input" size="6" value="页码" onFocus="this.value=''">
<span title="请输入跳转页码">
<input type="button" value="跳转" name="goto_btn" onclick="goToPage()">
</span>
</td>
</tr>
|