鱼C论坛

 找回密码
 立即注册
查看: 2324|回复: 4

python

[复制链接]
发表于 2019-9-27 17:45:28 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
一个爬虫的例子
网址:http://n.jgtong.com.cn/fjgs/BAlist.aspx?dq=1&pageIndex=2
问题:1、代码
         
  1. import urllib.request

  2. from bs4 import BeautifulSoup

  3. url = "http://n.jgtong.com.cn/fjgs/BAlist.aspx?dq=1&pageIndex=2"
  4. response = urllib.request.urlopen(url)
  5. html = response.read().decode("utf-8")
  6. soup = BeautifulSoup(html,"html.parser")
  7. print(soup)
复制代码

   
      以上代码爬取的网站代码与在浏览器中f12看到的代码是不一样的,为什么?

          2、
           
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2019-9-27 20:55:47 | 显示全部楼层
哪里不一样?
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-9-29 14:18:54 | 显示全部楼层
  1. <tbody><tr style="border-bottom:1px solid #fefefe;">                                       <td width="4%" valign="bottom">                                        <img src="images/a_r20_c15.jpg" width="13" height="13"></td>                                 <td width="84%" height="35" valign="bottom"><a target="_blank" href="BAdetail.aspx?id=567db1c2-6b4a-4180-977c-6c152d689f34" class="zi1">安信颐和公寓(1号车库)首次备案           公示     </a></td>      <td width="150" valign="bottom" class="zi_hun">2019-08-13</td> </tr><tr style="border-bottom:1px solid #fefefe;">                                       <td width="4%" valign="bottom">                                        <img src="images/a_r20_c15.jpg" width="13" height="13"></td>                                 <td width="84%" height="35" valign="bottom"><a target="_blank" href="BAdetail.aspx?id=9bd369f2-4405-456e-b96a-e4140dc926ae" class="zi1">学仕花园(16幢,19幢)首次备案           公示     </a></td>      <td width="150" valign="bottom" class="zi_hun">2019-08-12</td> </tr><tr style="border-bottom:1px solid #fefefe;">                                       <td width="4%" valign="bottom">                                        <img src="images/a_r20_c15.jpg" width="13" height="13"></td>                                 <td width="84%" height="35" valign="bottom"><a target="_blank" href="BAdetail.aspx?id=42764db8-b8d0-4243-aa64-60c10c432950" class="zi1">豪景家园(1幢)首次备案           公示     </a></td>      <td width="150" valign="bottom" class="zi_hun">2019-08-12</td> </tr><tr style="border-bottom:1px solid #fefefe;">                                       <td width="4%" valign="bottom">                                        <img src="images/a_r20_c15.jpg" width="13" height="13"></td>                                 <td width="84%" height="35" valign="bottom"><a target="_blank" href="BAdetail.aspx?id=a2b8ddfd-197a-461b-a5c0-094b427bcbc7" class="zi1">君宸苑(6幢)首次备案           公示     </a></td>      <td width="150" valign="bottom" class="zi_hun">2019-08-05</td> </tr><tr style="border-bottom:1px solid #fefefe;">                                       <td width="4%" valign="bottom">                                        <img src="images/a_r20_c15.jpg" width="13" height="13"></td>                                 <td width="84%" height="35" valign="bottom"><a target="_blank" href="BAdetail.aspx?id=f52d8fd3-b70a-4ed3-bcfa-c7ccd44559d2" class="zi1">雅乐花园(13幢,18幢)首次备案           公示     </a></td>      <td width="150" valign="bottom" class="zi_hun">2019-08-05</td> </tr><tr style="border-bottom:1px solid #fefefe;">                                       <td width="4%" valign="bottom">                                        <img src="images/a_r20_c15.jpg" width="13" height="13"></td>                                 <td width="84%" height="35" valign="bottom"><a target="_blank" href="BAdetail.aspx?id=d52c9799-ea9d-4c7c-b173-bd1f6daf9e79" class="zi1">文锦园(1幢)首次备案           公示     </a></td>      <td width="150" valign="bottom" class="zi_hun">2019-08-02</td> </tr><tr style="border-bottom:1px solid #fefefe;">                                       <td width="4%" valign="bottom">                                        <img src="images/a_r20_c15.jpg" width="13" height="13"></td>                                 <td width="84%" height="35" valign="bottom"><a target="_blank" href="BAdetail.aspx?id=8D488EAE-58EC-4C2E-8886-48C6B93AA7B0" class="zi1">蓝天新苑重新备案           公示     </a></td>      <td width="150" valign="bottom" class="zi_hun">2019-08-02</td> </tr><tr style="border-bottom:1px solid #fefefe;">                                       <td width="4%" valign="bottom">                                        <img src="images/a_r20_c15.jpg" width="13" height="13"></td>                                 <td width="84%" height="35" valign="bottom"><a target="_blank" href="BAdetail.aspx?id=15cc3f6a-c995-472d-a959-84e49ee4dab6" class="zi1">思贤雅苑(11幢,14幢,7幢)首次备案           公示     </a></td>      <td width="150" valign="bottom" class="zi_hun">2019-08-02</td> </tr><tr style="border-bottom:1px solid #fefefe;">                                       <td width="4%" valign="bottom">                                        <img src="images/a_r20_c15.jpg" width="13" height="13"></td>                                 <td width="84%" height="35" valign="bottom"><a target="_blank" href="BAdetail.aspx?id=21c934b7-6c20-47cc-9f1b-f6086ab83c9d" class="zi1">星韵城(A17幢,A9幢)首次备案           公示     </a></td>      <td width="150" valign="bottom" class="zi_hun">2019-08-02</td> </tr><tr style="border-bottom:1px solid #fefefe;">                                       <td width="4%" valign="bottom">                                        <img src="images/a_r20_c15.jpg" width="13" height="13"></td>                                 <td width="84%" height="35" valign="bottom"><a target="_blank" href="BAdetail.aspx?id=347b5990-b8c5-4651-aee9-9ced867925b1" class="zi1">怡安家园(1幢,2幢,3幢,4幢)首次备案           公示     </a></td>      <td width="150" valign="bottom" class="zi_hun">2019-08-02</td> </tr><tr style="border-bottom:1px solid #fefefe;">                                       <td width="4%" valign="bottom">                                        <img src="images/a_r20_c15.jpg" width="13" height="13"></td>                                 <td width="84%" height="35" valign="bottom"><a target="_blank" href="BAdetail.aspx?id=1B17A79C-7800-4AD1-8A48-C5837875D82E" class="zi1">御水华庭重新备案           公示     </a></td>      <td width="150" valign="bottom" class="zi_hun">2019-08-02</td> </tr><tr style="border-bottom:1px solid #fefefe;">                                       <td width="4%" valign="bottom">                                        <img src="images/a_r20_c15.jpg" width="13" height="13"></td>                                 <td width="84%" height="35" valign="bottom"><a target="_blank" href="BAdetail.aspx?id=5b8fb22c-49f0-4cda-bee2-83e375873c2c" class="zi1">泰和之春苑续建(1号车库)首次备案           公示     </a></td>      <td width="150" valign="bottom" class="zi_hun">2019-08-02</td> </tr><tr style="border-bottom:1px solid #fefefe;">                                       <td width="4%" valign="bottom">                                        <img src="images/a_r20_c15.jpg" width="13" height="13"></td>                                 <td width="84%" height="35" valign="bottom"><a target="_blank" href="BAdetail.aspx?id=7407e206-2cd5-4c2e-85b1-987b266107b4" class="zi1">衡麓花园(1幢,2幢,4幢,5幢,6幢)首次备案           公示     </a></td>      <td width="150" valign="bottom" class="zi_hun">2019-08-01</td> </tr><tr style="border-bottom:1px solid #fefefe;">                                       <td width="4%" valign="bottom">                                        <img src="images/a_r20_c15.jpg" width="13" height="13"></td>                                 <td width="84%" height="35" valign="bottom"><a target="_blank" href="BAdetail.aspx?id=1debbcbd-9e2d-4868-bea6-5f4fd6a83251" class="zi1">香荷名居(11幢,3幢,7幢)首次备案           公示     </a></td>      <td width="150" valign="bottom" class="zi_hun">2019-08-01</td> </tr><tr style="border-bottom:1px solid #fefefe;">                                       <td width="4%" valign="bottom">                                        <img src="images/a_r20_c15.jpg" width="13" height="13"></td>                                 <td width="84%" height="35" valign="bottom"><a target="_blank" href="BAdetail.aspx?id=76d66757-9b67-4bf5-9bf0-bfb991322e7d" class="zi1">邹区时代广场(1号车库,3号车库、4号车库,6号车库)首次备案           公示     </a></td>      <td width="150" valign="bottom" class="zi_hun">2019-08-01</td> </tr></tbody>
复制代码


  1. <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
  2. <html xmlns="http://www.w3.org/1999/xhtml">
  3. <head>
  4.     <meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
  5.     <title>常州市商品房备案公示</title>
  6.     <link href="../css.css" rel="stylesheet" type="text/css" />
  7.     <style type="text/css">
  8.         body
  9.         {
  10.             margin-left: 0px;
  11.             margin-top: 0px;
  12.             margin-right: 0px;
  13.             margin-bottom: 0px;
  14.         }
  15.         body, td, th
  16.         {
  17.             font-size: 14px;
  18.         }
  19.         .STYLE2
  20.         {
  21.             font-size: 12px;
  22.         }
  23.     </style>

  24.     <script src="../js/jquery-1.7.1.min.js" type="text/javascript"></script>

  25. </head>

  26. <script>

  27. //table分页        
  28.         var pageSize=15;  //每页显示的记录条数   
  29.         var curPage='2';   //显示第curPage页
  30.       
  31.         var len;         //总行数
  32.         var page;        //总页数
  33.        $(function(){   
  34.        len =$("#show_tab tr").length-1;   //去掉表头     
  35.         page=len % pageSize==0 ? len/pageSize : Math.floor(len/pageSize)+1;//根据记录条数,计算页数
  36.         console.log("len:"+len+"page:"+page);
  37.         document.getElementById("page").value=page;
  38.         alert(curPage)
  39.         displayPage();//显示第一页
  40.       $("#nextpage").click(function(){//下一页
  41.           if(curPage<page){
  42.               curPage+=1;
  43.           }
  44.           else{
  45.              // alert("yishizuihouyiye");
  46.           }
  47.          displayPage();
  48.          });
  49.       $("#lastpage").click(function(){//上一页
  50.           if(curPage>1){
  51.               curPage-=1;
  52.           }
  53.           else{
  54.              // alert("yishidiyiye");
  55.           }
  56.           displayPage();
  57.           });
  58.       $("#npage").click(function(){//跳到固定某一页
  59.           var npage=parseInt(document.getElementById("curPage").value);
  60.           if(npage>page||npage<1){
  61.              // alert("gaiyebucunzai");
  62.           }
  63.           else{
  64.               curPage=npage;
  65.           }
  66.           displayPage();
  67.           });
  68. });

  69. function displayPage(){  
  70.      var begin=(curPage-1)*pageSize;//起始记录号
  71.      var end = begin + pageSize;
  72.      console.log("  begin:"+len+"   end:"+end);
  73.      if(end > len ) end=len;
  74.      $("#show_tab tr").hide();
  75.      $("#show_tab tr").each(function(i){
  76.          if(i-1>=begin && i-1<end)//显示第page页的记录
  77.              {
  78.              $("#show_tab_one").show();
  79.              $(this).show();
  80.              document.getElementById("curPage").value=curPage;
  81.              }         
  82.      });

  83. }        
  84. function pageSize2(){
  85.      curPage=0;   //显示第curPage页   
  86.      pageSize=parseInt(document.getElementById("pageSize").value);
  87.       len =$("#show_tab tr").length-1;   //去掉表头     
  88.       page=len % pageSize==0 ? len/pageSize : Math.floor(len/pageSize)+1;//根据记录条数,计算页数
  89.       console.log("len:"+len+"   page:"+page);
  90.       document.getElementById("page").value=page;
  91.       curPage=1;
  92.       displayPage();//显示第一页   
  93. }







  94. var strorl='{"data":[{"BA_ID":"567db1c2-6b4a-4180-977c-6c152d689f34","XM_MC":"安信颐和公寓", "DH":"1号车库","BA_LX":"0","BA_BJSJ_SJ":"2019-08-13"},{"BA_ID":"9bd369f2-4405-456e-b96a-e4140dc926ae","XM_MC":"学仕花园", "DH":"16幢,19幢","BA_LX":"0","BA_BJSJ_SJ":"2019-08-12"},{"BA_ID":"42764db8-b8d0-4243-aa64-60c10c432950","XM_MC":"豪景家园", "DH":"1幢","BA_LX":"0","BA_BJSJ_SJ":"2019-08-12"},{"BA_ID":"a2b8ddfd-197a-461b-a5c0-094b427bcbc7","XM_MC":"君宸苑", "DH":"6幢","BA_LX":"0","BA_BJSJ_SJ":"2019-08-05"},{"BA_ID":"f52d8fd3-b70a-4ed3-bcfa-c7ccd44559d2","XM_MC":"雅乐花园", "DH":"13幢,18幢","BA_LX":"0","BA_BJSJ_SJ":"2019-08-05"},{"BA_ID":"d52c9799-ea9d-4c7c-b173-bd1f6daf9e79","XM_MC":"文锦园", "DH":"1幢","BA_LX":"0","BA_BJSJ_SJ":"2019-08-02"},{"BA_ID":"8D488EAE-58EC-4C2E-8886-48C6B93AA7B0","XM_MC":"蓝天新苑", "DH":"","BA_LX":"1","BA_BJSJ_SJ":"2019-08-02"},{"BA_ID":"15cc3f6a-c995-472d-a959-84e49ee4dab6","XM_MC":"思贤雅苑", "DH":"11幢,14幢,7幢","BA_LX":"0","BA_BJSJ_SJ":"2019-08-02"},{"BA_ID":"21c934b7-6c20-47cc-9f1b-f6086ab83c9d","XM_MC":"星韵城", "DH":"A17幢,A9幢","BA_LX":"0","BA_BJSJ_SJ":"2019-08-02"},{"BA_ID":"347b5990-b8c5-4651-aee9-9ced867925b1","XM_MC":"怡安家园", "DH":"1幢,2幢,3幢,4幢","BA_LX":"0","BA_BJSJ_SJ":"2019-08-02"},{"BA_ID":"1B17A79C-7800-4AD1-8A48-C5837875D82E","XM_MC":"御水华庭", "DH":"","BA_LX":"1","BA_BJSJ_SJ":"2019-08-02"},{"BA_ID":"5b8fb22c-49f0-4cda-bee2-83e375873c2c","XM_MC":"泰和之春苑续建", "DH":"1号车库","BA_LX":"0","BA_BJSJ_SJ":"2019-08-02"},{"BA_ID":"7407e206-2cd5-4c2e-85b1-987b266107b4","XM_MC":"衡麓花园", "DH":"1幢,2幢,4幢,5幢,6幢","BA_LX":"0","BA_BJSJ_SJ":"2019-08-01"},{"BA_ID":"1debbcbd-9e2d-4868-bea6-5f4fd6a83251","XM_MC":"香荷名居", "DH":"11幢,3幢,7幢","BA_LX":"0","BA_BJSJ_SJ":"2019-08-01"},{"BA_ID":"76d66757-9b67-4bf5-9bf0-bfb991322e7d","XM_MC":"邹区时代广场", "DH":"1号车库,3号车库、4号车库,6号车库","BA_LX":"0","BA_BJSJ_SJ":"2019-08-01"}]}';
  95. function ConvertToJsonForJs() {
  96.             
  97.          var  testJson = jQuery.parseJSON(strorl);
  98.          var html="";
  99.          var dts=testJson.data;
  100.          if(dts.length>0)
  101.          {
  102.          
  103.              for(var i=0;i<dts.length;i++)
  104.              {
  105.             
  106.                 html +='<tr style="border-bottom:1px solid #fefefe;">';
  107.                 html +='                                       <td width="4%" valign="bottom">';
  108.                 html  +='                                        <img src="images/a_r20_c15.jpg" width="13" height="13" /></td>';
  109.                 var DH="";
  110.                
  111.                 if(dts[i].DH!=null && dts[i].DH!=""){
  112.                
  113.                     if(dts[i].DH.length>25)
  114.                     {
  115.                     
  116.                         DH="("+dts[i].DH.substr(0,25)+"...)";
  117.                     }else{
  118.                     
  119.                         DH="("+ dts[i].DH +")";
  120.                     }
  121.                 }
  122.                
  123.                 html    +='                                 <td width="84%" height="35" valign="bottom"><a target="_blank" href="BAdetail.aspx?id='+ dts[i].BA_ID +'" class="zi1">'+dts[i].XM_MC+DH;
  124.                 if(dts[i].BA_LX=="0"){
  125.                
  126.                 html+="首次备案";
  127.                 }else{
  128.                  html+="重新备案";
  129.                 }
  130.                 html   +='           公示';
  131.                
  132.                 html   +='     </a></td>';
  133.                 html  +='      <td width="150" valign="bottom" class="zi_hun">'+ dts[i].BA_BJSJ_SJ +'</td>';
  134.                 html   +=' </tr>';
  135.              }
  136.              $("#show_tab").html(html);
  137.          
  138.          
  139.          }
  140.          
  141.            
  142.       }

  143. </script>

  144. <body>
  145.         <table width="1000" border="0" cellspacing="0" cellpadding="0"  align="center">
  146.                                             <tr>
  147.                                                 <td><img src="images/ss2.jpg"></td>
  148.                                             </tr>
  149.                                         </table>
  150.     <table width="1000" height="289" border="0" align="center" cellpadding="0" cellspacing="0">
  151.         <tr>
  152.             <td valign="top">
  153.                 <table width="100%" border="0" cellspacing="0" cellpadding="0">
  154.                     <tr>
  155.                         <td width="259" height="657" valign="top">
  156.                             <table width="100%" height="520" border="0" cellpadding="0" cellspacing="0">
  157.                                 <tr>
  158.                                     <td valign="top" background="images/main_r1_c1.jpg">
  159.                                         <table width="192" height="74" border="0" cellpadding="0" cellspacing="0">
  160.                                             <tr>
  161.                                                 <td background="images/m3.png">
  162.                                                     <table width="81%" height="34" border="0" align="center" cellpadding="0" cellspacing="0">
  163.                                                         <tr>
  164.                                                             <td class="zi_bai22">
  165.                                                                 房价公示
  166.                                                             </td>
  167.                                                         </tr>
  168.                                                     </table>
  169.                                                 </td>
  170.                                             </tr>
  171.                                         </table>
  172.                                         <table width="100%" border="0" cellspacing="0" cellpadding="0">
  173.                                             <tr>
  174.                                                 <td>
  175.                                                    
  176.                                                 </td>
  177.                                             </tr>
  178.                                         </table>
  179.                                         <table width="100%" height="55" border="0" cellpadding="0" cellspacing="0">
  180.                                             <tr>
  181.                                                 <td height="55" valign="top">
  182.                                                     <table width="222" border="0" align="right" cellpadding="0" cellspacing="0">
  183.                                                         <tr>
  184.                                                             <td width="211" height="51" valign="top" background="images/m2.png">
  185.                                                                 <table width="85%" height="40" border="0" align="center" cellpadding="0" cellspacing="0">
  186.                                                                     <tr>
  187.                                                                         <td>
  188.                                                                             <a href="?dq=1" class="zi_hei20">中心城区</a>
  189.                                                                         </td>
  190.                                                                     </tr>
  191.                                                                 </table>
  192.                                                             </td>
  193.                                                             <td width="9">
  194.                                                             </td>
  195.                                                         </tr>
  196.                                                     </table>
  197.                                                 </td>
  198.                                             </tr>
  199.                                         </table>
  200.                                         <table width="100%" height="55" border="0" cellpadding="0" cellspacing="0">
  201.                                             <tr>
  202.                                                 <td height="55" valign="top">
  203.                                                     <table width="222" border="0" align="right" cellpadding="0" cellspacing="0">
  204.                                                         <tr>
  205.                                                             <td width="211" height="51" valign="top" background="images/m2.png">
  206.                                                                 <table width="85%" height="40" border="0" align="center" cellpadding="0" cellspacing="0">
  207.                                                                     <tr>
  208.                                                                         <td>
  209.                                                                             <a href="?dq=2" class="zi_hei20">新北区</a>
  210.                                                                         </td>
  211.                                                                     </tr>
  212.                                                                 </table>
  213.                                                             </td>
  214.                                                             <td width="9">
  215.                                                             </td>
  216.                                                         </tr>
  217.                                                     </table>
  218.                                                 </td>
  219.                                             </tr>
  220.                                         </table>
  221.                                         <table width="100%" height="55" border="0" cellpadding="0" cellspacing="0">
  222.                                             <tr>
  223.                                                 <td height="55" valign="top">
  224.                                                     <table width="222" border="0" align="right" cellpadding="0" cellspacing="0">
  225.                                                         <tr>
  226.                                                             <td width="211" height="51" valign="top" background="images/m2.png">
  227.                                                                 <table width="85%" height="40" border="0" align="center" cellpadding="0" cellspacing="0">
  228.                                                                     <tr>
  229.                                                                         <td>
  230.                                                                             <a href="?dq=3" class="zi_hei20">武进区</a>
  231.                                                                         </td>
  232.                                                                     </tr>
  233.                                                                 </table>
  234.                                                             </td>
  235.                                                             <td width="9">
  236.                                                             </td>
  237.                                                         </tr>
  238.                                                     </table>
  239.                                                 </td>
  240.                                             </tr>
  241.                                         </table>
  242.                                         <table width="100%" height="55" border="0" cellpadding="0" cellspacing="0">
  243.                                             <tr>
  244.                                                 <td height="55" valign="top">
  245.                                                     <table width="222" border="0" align="right" cellpadding="0" cellspacing="0">
  246.                                                         <tr>
  247.                                                             <td width="211" height="51" valign="top" background="images/m2.png">
  248.                                                                 <table width="85%" height="40" border="0" align="center" cellpadding="0" cellspacing="0">
  249.                                                                     <tr>
  250.                                                                         <td>
  251.                                                                             <a href="?dq=4" class="zi_hei20">金坛市</a>
  252.                                                                         </td>
  253.                                                                     </tr>
  254.                                                                 </table>
  255.                                                             </td>
  256.                                                             <td width="9">
  257.                                                             </td>
  258.                                                         </tr>
  259.                                                     </table>
  260.                                                 </td>
  261.                                             </tr>
  262.                                         </table>
  263.                                         <table width="100%" height="55" border="0" cellpadding="0" cellspacing="0">
  264.                                             <tr>
  265.                                                 <td height="55" valign="top">
  266.                                                     <table width="222" border="0" align="right" cellpadding="0" cellspacing="0">
  267.                                                         <tr>
  268.                                                             <td width="211" height="51" valign="top" background="images/m2.png">
  269.                                                                 <table width="85%" height="40" border="0" align="center" cellpadding="0" cellspacing="0">
  270.                                                                     <tr>
  271.                                                                         <td>
  272.                                                                             <a href="?dq=5" class="zi_hei20">溧阳市</a>
  273.                                                                         </td>
  274.                                                                     </tr>
  275.                                                                 </table>
  276.                                                             </td>
  277.                                                             <td width="9">
  278.                                                             </td>
  279.                                                         </tr>
  280.                                                     </table>
  281.                                                 </td>
  282.                                             </tr>
  283.                                         </table>
  284.                                        <!-- <table width="100%" height="55" border="0" cellpadding="0" cellspacing="0">
  285.                                             <tr>
  286.                                                 <td height="55" valign="top">
  287.                                                     <table width="222" border="0" align="right" cellpadding="0" cellspacing="0">
  288.                                                         <tr>
  289.                                                             <td width="211" height="51" valign="top" background="images/m2.png">
  290.                                                                 <table width="85%" height="40" border="0" align="center" cellpadding="0" cellspacing="0">
  291.                                                                     <tr>
  292.                                                                         <td>
  293.                                                                             <a href="newslist.aspx?tid=001012006" class="zi_hei20">表格下载</a>
  294.                                                                         </td>
  295.                                                                     </tr>
  296.                                                                 </table>
  297.                                                             </td>
  298.                                                             <td width="9">
  299.                                                             </td>
  300.                                                         </tr>
  301.                                                     </table>
  302.                                                 </td>
  303.                                             </tr>
  304.                                         </table>-->
  305.                                     </td>
  306.                                 </tr>
  307.                             </table>
  308.                         </td>
  309.                         <td valign="top">
  310.                            
  311.                           
  312.                            
  313.                             <table width="732" height="729" border="0" align="center" cellpadding="0" cellspacing="0"
  314.                                 class="table2">
  315.                                 <tr>
  316.                                     <td valign="top" align="center">
  317.                                         <table width="100%" height="37" border="0" cellpadding="0" cellspacing="0">
  318.                                             <tr>
  319.                                                 <td background="images/main_bg.jpg">
  320.                                                     <table width="229" border="0" cellspacing="0" cellpadding="0">
  321.                                                         <tr>
  322.                                                             <td height="37" background="images/m1.png" class="zi_bai22">
  323.                                                                 <table width="90%" height="27" border="0" cellpadding="0" cellspacing="0">
  324.                                                                     <tr>
  325.                                                                         <td width="9%">
  326.                                                                            
  327.                                                                         </td>
  328.                                                                         <td width="91%" class="zi_bai22">
  329.                                                                             房价备案公示
  330.                                                                         </td>
  331.                                                                     </tr>
  332.                                                                 </table>
  333.                                                             </td>
  334.                                                         </tr>
  335.                                                     </table>
  336.                                                 </td>
  337.                                             </tr>
  338.                                         </table>
  339.                                         <table width="100%" border="0" cellspacing="0" cellpadding="0">
  340.                                             <tr>
  341.                                                 <td>
  342.                                                    
  343.                                                 </td>
  344.                                             </tr>
  345.                                         </table>
  346.                                         <table id="show_tab" width="100%">
  347.                                              
  348.                                         </table>
  349.                                         <table width="100%" border="0" cellspacing="0" cellpadding="0">
  350.                                         <tr>
  351.                                             <td height="10" align=center><a href="BAlist.aspx?dq=1&pageIndex=1">上一页</a><a href="BAlist.aspx?dq=1&pageIndex=3"> 下一页   </a>
  352.                                             </td>
  353.                                         </tr>
  354.                                     </table>
  355.                                     </td>
  356.                                 </tr>
  357.                             </table>
  358.                         </td>
  359.                     </tr>
  360.                 </table>
  361.                 <table width="100%" border="0" cellspacing="0" cellpadding="0">
  362.                     <tr>
  363.                         <td height="10">
  364.                         </td>
  365.                     </tr>
  366.                 </table>
  367.                 <table width="100%" border="0" cellspacing="0" cellpadding="0">
  368.                     <tr>
  369.                         <td height="1">
  370.                         </td>
  371.                     </tr>
  372.                 </table>
  373.             </td>
  374.         </tr>
  375.     </table>
  376. </body>

  377. <script>
  378. ConvertToJsonForJs();

  379. </script>

  380. </html>
复制代码
第一段代码是在查看元素时是可以看到的,在tbody这个标签中,我要爬取的目标数据就在里面;第二段代码,是爬取的代码,在tbody中就没有我要数据,变成了是在script中的var strorl;而且还有一个地方就是,含有var strorl的script标签,在查看元素的代码中,它是在head中的,但是爬取的代码中,它又不在head中了,这我就迷茫了,怎么也爬取不到这段数据,麻烦您给看看,问题出在哪里了,
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-9-29 14:36:14 | 显示全部楼层

我没法发图片,代码太多,简单说吧,就是我要的目标数据var strorl,f12查看的网站源代码时,它所处的位置如下:
  1. <head>
  2. ...
  3. ...
  4. <script src="../js/jquery-1.7.1.min.js" type="text/javascript"></script>
  5. <script>
  6. ..
  7. var strorl='{"data":[....]}';
  8. ...
  9. </script>
  10. </head>
复制代码

但是我爬取的代码就变成了下面这种了:
  1. <head>
  2. ...
  3. ...
  4. <script src="../js/jquery-1.7.1.min.js" type="text/javascript"></script>
  5. </head>
  6. <script>
  7. ...
  8. var strorl='{"data":[...]}';
  9. ...
  10. </script>
复制代码


而且在查看元素的代码中,var strorl这部分数据可以在body标签中看到,在爬取的代码中就没有了。然后我就迷茫了,网上查了很久也没有查到怎么解决,所以就来求助了!
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-9-29 16:22:11 | 显示全部楼层
额。。。。。已经解决了,原来一个正则表达式就能解决的问题!
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-1-19 14:41

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表