|
|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
尝试爬去天猫的一个信息,然后发现传入的url构成中有2个参数是需要从cookie中提取的
提取的方式写在了一个js函数中,(基本js小白,大约能看懂基本语法,约等于0)
问题来了,怎么先运行这个js获取要的信息,然后再运行爬虫?
或者,我这个思路不对?并不需要运行JS?
下面这段就是网页中的js代码,我要爬的链接需要isg和isg2两个参数,目测就是靠这个JS来生成的,求思路
- <script>
- (function(w,d){
- try{
- var l,url='//mdskip.taobao.com/core/initItemDetail.htm?sellerPreview=false&household=false&itemId=555299818582&isForbidBuyItem=false&tmallBuySupport=true&cartEnable=false&cachedTimestamp=1508919956754&isSecKill=false&addressLevel=3&isPurchaseMallPage=false&tryBeforeBuy=false&isUseInventoryCenter=true&isRegionLevel=false&offlineShop=false&isAreaSell=false&isApparel=true&showShopProm=false&service3C=false&queryMemberRight=false',isg=document.cookie.match('(^|;) ?l=([^;]*)(;|$)'),isg2 =document.cookie.match('(^|;) ?isg=([^;]*)(;|$)');
- if(!url){return;}
- var arr=["callback=setMdskip","timestamp="+(+new Date()),"isg="+(isg&&isg[2]),"isg2="+(isg2&&isg2[2])],reg=/[?&^](ip|campaignId|key|abt|cat_id|q|u_channel|areaId)=([^&]+)/g,params=w.location.search;
- while(r=reg.exec(params)){arr.push(r[1]+"="+r[2]);}
- d.referrer && (arr.push("ref="+encodeURIComponent(d.referrer)));
- w.onMdskip=function(c){l=l?c(l):c}
- w.setMdskip=function(v){l=l?l(v):v;}
- try{
- var head=d.head || d.getElementsByTagName("head")[0];
- var script=d.createElement("script");
- head.insertBefore(script,head.firstChild);
- script.src=url+'&'+arr.join("&");
- }
- catch(err){
- d.write('<script src="'+url+'&'+arr.join("&")+'" async="async"></'+'script>');
- }
- }catch(e){
- w.onMdskip=null;
- setTimeout(function(){throw err;},0);
- }
- }(window,document))
- </script>
复制代码 |
|