×îÖÕ°æ¡¾18½û¡¿Ò»Ö»ÔôÄÜÅÀ¶¯Í¼µÄ¡ª¡ª»Æ³æ¡£ÉðÊ¿ºÍÃÃ×Ó¶¼À´¿´¿´°É£¡,Python½»Á÷,±à³ÌÓïÑÔ×¨Çø,ÓãCÂÛÌ³

¼²·ç¡£ÒâÆÆÌìÇç ·¢±íÓÚ 2016-10-19 19:29:06

×îÖÕ°æ¡¾18½û¡¿Ò»Ö»ÔôÄÜÅÀ¶¯Í¼µÄ¡ª¡ª»Æ³æ¡£ÉðÊ¿ºÍÃÃ×Ó¶¼À´¿´¿´°É£¡

±¾Ìû×îºóÓÉ Ò»¸öÕËºÅ ÓÚ 2020-3-28 11:17 ±à¼

Ñ§ÁËÒ»¸öÐÇÆÚÓã¸çµÄ¡¶pythonÁã»ù´¡ÏµÁÐ¡·ÖÕÓÚÅª³öµã¶«Î÷ÁË£¡

»¨ÁËÒ»ÏÂÎç¸ãÁËÒ»Ö»¡°»Æ³æ¡±¡£»¶Ó¸÷Î»¸ßÊÖÖ¸µ¼£¬ÐÂÊÖ½¨Òé¡£

·½±ãµÄeasygui Óë Ç¿´óµÄbeautiful soupÊÇ±ØÐëµÄ

Ö»ÒªÅªÇå³þÍøÕ¾µÄ½á¹¹£¬ÕÒµ½ÄãÒªÅÀÈ¡µÄ×ÊÔ´µÄ¹²Í¬µã£¬ºÏÀíµÄÄäÃûºÍÒì³£´¦Àí¾Í»ù±¾Ã»ÓÐÎÊÌâÁË¡£

´úÂëÒÑ¸üÐÂ£¬×îÖÕÎÊÌâ½â¾ö¡ª¡ª>´ø×÷Æ··¬ºÅ...^_^

´úÂë£º

import urllib.request as ur
import urllib.parse as up
import re
import easygui as e
import socket
from bs4 import BeautifulSoup

def find_download(h_soup,where,count):
   #ÏÂÃæµÄÈýÌõÓï¾äÊÇÎªÁË·ÖÀà£¬¹ýÂËÈ¡·¬ºÅ¡£Ã»¸öÍøÕ¾µÄÌØµã¶¼²»Ò»Ñù£¬Òª×Ô¼ºÕÒ¹æÂÉ¡£
   H = h_soup.find("h1",class_ = "article-title").a.get_text()
   if H != "¡¾" :
         try :#ÓÐÐ©·¬ºÅÎ´Öª
               str1 = h_soup.find("h2").span.span.get_text()
         except :
               str1 = "404notfind%d"
   elif "¡¾¹ã¸æÕÐ×â¡¿" in H:
         return count
   else :
         str1 = ''
         for i in H:
               str1 += i
               if i == "¡¿":
                     break

   timeout = 10#ÉèÖÃÏÂÔØ±»ÔÊÐíµÄ×î´óÊ±¼ä
   for l in h_soup.find_all("img",class_ = re.compile("align.+"),src = re.compile(".{3,4}[    DISCUZ_CODE_0    ]quot;)):
         #ÏÂÃæµÄifÊÇ¹ýÂËËÄ¸öÀ¬»øÍ¼Æ¬
         if l["src"] in ["http://ww1.sinaimg.cn/large/e75a115bgw1ezy20gtzgpj20m80b4gol.jpg","http://ww2.sinaimg.cn/mw690/e75a115bgw1f8ambv7odog20a00327h9.gif","http://ww3.sinaimg.cn/mw690/e75a115bgw1f76bno2v7kj20a0032wew.jpg","http://ww2.sinaimg.cn/mw690/e75a115bgw1ezm9k3vracj20by0by0tk.jpg"]:
               continue
         url_fin = l["src"]
         for i in range(3):#ÍøÂ·»ò×ÊÔ´ÎÊÌâÒý·¢´íÎó×î¶à3´Î
               try :
                     request_fin = ur.Request(url_fin,headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.31 (KHTML, like Gecko) Chrome/26.0.1410.43 BIDUBrowser/6.x Safari/537.31'})#ÄäÃû
                     fin_img = ur.urlopen(request_fin,timeout = timeout).read()
                     break
               except :
                     pass
         else :
               continue
         file = open(where+"\\"+"%s_%d.gif" % (str1,count),'wb')
         file.write(fin_img)
         file.close()
         print("ÒÑÏÂÔØ:"+"\n"+"%s_%d.gif" % (str1,count))
         count += 1
   return count


def tryopen(req):#ÍøÂ·ÓÐ´íÎó×î¶à5´Î
   errorTimes = 0
   while errorTimes != 10:
         try:
               errorTimes += 1
               return ur.urlopen(req,timeout = 10).read().decode("utf-8")
         except:
               pass
   return None


def main():
   if e.buttonbox("Are you ready?","»Æ³æ",choices = ("of cause!","i'm Gay.")) == "of cause!":
         while 1:
               have = e.multenterbox("ÊäÈëÄãÒªµÄÒ³Êý£¬Èç¹ûÖ»ÒªÒ»Ò³¾ÍÌîÒ»ÑùµÄ£º","»Æ³æ",fields = ("ÆðÊ¼Ò³","½áÊøÒ³"))
               if have != '' and have != '':
                     nice = int(have)
                     day = int(have)
                     if nice > 1000 or day > 1000:
                           e.msgbox("ÉðÊ¿Çë×¢ÒâÉíÌå£¡")
                           continue
                     break
               e.msgbox("serious?")

         where = e.diropenbox("ÄãÒª±£´æµ½ÄÄ£¿")
         i = nice
         while 1:#·ÖÈý²ã
               url1 = "http://www.gifjia.com/neihan/page/%d/" % i
               request1 = ur.Request(url1,headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.31 (KHTML, like Gecko) Chrome/26.0.1410.43 BIDUBrowser/6.x Safari/537.31'})#ÄäÃû
               html1 = tryopen(request1)
               h1_soup = BeautifulSoup(html1)#Ö÷Ò³
               text = '&&!@#$#@' #ÎªÁËµÚÒ»´ÎÄÜÔËÐÐ
               word = 0#´ÊÌõÊý
               for j in h1_soup.find_all("a",href = re.compile("+/[    DISCUZ_CODE_0    ]quot;)):
                     if text in j["href"]: #ÎªÁË·ÀÖ¹ÖØ¸´ÅÀ£¬ËûÍøÕ¾ÓÐµÄurlºóÃæ¶àµã¶«Î÷µ«ÊÇ±íÊ¾µÄºÍµ±Ç°Ò³ÃæÊÇÍ¬Ò»¸öÒâË¼
                           continue
                     word += 1
                     if word > 11:#´ÊÌõºóÃæ»¹ÓÐÎ´ÖªÁ¬½Ó·ÀÖ¹ÅÀÆ«ÁË¡£¡£11ÊÇÒòÎªÇ°Ãæ»¹ÓÐÒ»¸ö·ÏÁ¬½Ó£¬Ò»¹²10¸ö´ÊÌõ¡£Ì«²»ÖÇÄÜÁË¡£¡£¡£
                           break
                     url2 = j["href"]
                     text = url2
                     count = 0 #Ö÷Ò³ÉÏÃ¿Ò»¸ö´ÊÌõÀïµÄÍ¼Æ¬±àºÅ
                     request2 = ur.Request(url2,headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.31 (KHTML, like Gecko) Chrome/26.0.1410.43 BIDUBrowser/6.x Safari/537.31'})#ÄäÃû
                     html2 = tryopen(request2)
                     try :
                           h2_soup = BeautifulSoup(html2)#µÚÒ»²ãÁ¬½Ó¸±Ò³
                           count = find_download(h2_soup,where,count)
                     except:
                           continue
                     for k in h2_soup.find_all("a",href = re.compile(j["href"]+"+/")):
                           url3 = k["href"]
                           if j["href"]+"1/" == k["href"]:#·ÀÖØ¸´ÅÀµÚÒ»Ò³
                                 continue
                           request3 = ur.Request(url3,headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.31 (KHTML, like Gecko) Chrome/26.0.1410.43 BIDUBrowser/6.x Safari/537.31'})#ÄäÃû
                           html3 = tryopen(request3)
                           try :
                                 h3_soup = BeautifulSoup(html3)#¸±Ò³»¹·ÖºÃ¶àÒ³
                                 count = find_download(h3_soup,where,count)
                           except:
                                 pass
               if i >= day:
                     break
               i += 1
   else :
         e.msgbox("¨q¡É¨r(¦á¦ä¦á)¨q¡É¨r")


if __name__ == '__main__':
   main()

ÀïÃæÓÃµ½µÄÖªÊ¶¶¼ÊÇÓã¸ç½²¹ýµÄ£¬¸÷Î»±ÈÎÒ»¹ÐÂµÄÊÖÖ»ÒªÅ¬Á¦Ñ§Ò»ÖÜ£¬ÕâÖÖÍæÒâÐÅÊÖÄéÀ´

ÁíÍâ£¬³ÌÐò¿ÉÄÜ»¹»áÓÐÐ©Ð¡ÎÊÌâ£¬ÎÒ»á³ÖÐø¸üÐÂ£¬°Ñ·¢ÏÖµÄÎÊÌâ½â¾ö£¬Ò²»¶Ó·¢ÏÖÎÊÌâµÄ¸÷Î»·´À¡

¼²·ç¡£ÒâÆÆÌìÇç ·¢±íÓÚ 2016-10-19 19:30:02

×Ô¶¥Ò»ÏÂ£¬Ã÷Ìì¿´·´À¡{:10_256:}

xuwei276 ·¢±íÓÚ 2016-10-19 19:59:20

ÎÒ¿´ÁËÒ»¸öÔÂÉ¶¶¼Ã»Ñ§»á~~

¼²·ç¡£ÒâÆÆÌìÇç ·¢±íÓÚ 2016-10-19 20:05:08

xuwei276 ·¢±íÓÚ 2016-10-19 19:59
ÎÒ¿´ÁËÒ»¸öÔÂÉ¶¶¼Ã»Ñ§»á~~

ÐÖµÜ£¨Å®Ê¿£©²»±Ø»ÒÐÄ£¬Ö»ÒªÅ×¿ªÔÓÄîÄÍÐÄ×øÒ»ÏÂÎç£¬×ÜÄÜ¸ãµã¶«Î÷³öÀ´µÄ{:5_108:}

20498.4 ·¢±íÓÚ 2016-10-19 20:33:53

ÄãÕ¦Ñ§µÃÕâÃ´¿ì¡£¡£¡£

wxl123992851 ·¢±íÓÚ 2016-10-19 20:53:22

ÕæÀ÷º¦Å¶£¬ÎÒÑ§ÁËÈýËÄÌìÁË£¬Ï£ÍûÄÜºÍÄãÒ»ÑùÀ÷º¦

¼²·ç¡£ÒâÆÆÌìÇç ·¢±íÓÚ 2016-10-19 20:54:40

20498.4 ·¢±íÓÚ 2016-10-19 20:33
ÄãÕ¦Ñ§µÃÕâÃ´¿ì¡£¡£¡£

¹¤¿Æ´óÑ§ßÂ£¬Äã¶®µÃ£¬Ì«ÏÐÁË

¼²·ç¡£ÒâÆÆÌìÇç ·¢±íÓÚ 2016-10-19 21:00:37

wxl123992851 ·¢±íÓÚ 2016-10-19 20:53
ÕæÀ÷º¦Å¶£¬ÎÒÑ§ÁËÈýËÄÌìÁË£¬Ï£ÍûÄÜºÍÄãÒ»ÑùÀ÷º¦

¼ÓÓÍ£¬ÎÒÃÇÂÛÌ³£¬¾²Ì¬Í¼Æ¬ÓÐÁË£¬¶¯Ì¬Í¼Æ¬ÓÐÁË£¬ÏÂÒ»²½¾Í£¬£¬{:10_256:}ºÇºÇ£¬²»ÒªÎó½âÎÒµÄÒâË¼°¡¡£{:10_264:}

hellozhulei ·¢±íÓÚ 2016-10-19 21:05:31

¿´¿´´óÉñ

jsjyyjs ·¢±íÓÚ 2016-10-19 21:17:35

ÔõÃ´¸ãµÄ

·ç´µÓêÆð#Àá»¨Âä ·¢±íÓÚ 2016-10-19 21:34:19

¿ÉÒÔµÄ{:10_258:}

Ð¡½£½£ ·¢±íÓÚ 2016-10-19 21:43:10

look

ÂóÅ© ·¢±íÓÚ 2016-10-19 21:47:49

Ò»ÏÂ ÓÐÃ»ÓÐ´úÂë

¼²·ç¡£ÒâÆÆÌìÇç ·¢±íÓÚ 2016-10-19 21:52:17

±¾Ìû×îºóÓÉ ¼²·ç¡£ÒâÆÆÌìÇç ÓÚ 2016-10-19 21:55 ±à¼

ÂóÅ© ·¢±íÓÚ 2016-10-19 21:47
Ò»ÏÂ ÓÐÃ»ÓÐ´úÂë

Â¥ÏÂµÄ¸÷Î»¡£»Ø¸´¿É¼û

mrya ·¢±íÓÚ 2016-10-19 23:49:28

666°¡

ÎÞÐÄÍûÔÂ ·¢±íÓÚ 2016-10-19 23:54:36

ÕâÃ´À÷º¦£¬À´Ñ§Ï°ÏÂ£¡

cuml ·¢±íÓÚ 2016-10-20 00:10:37

{:10_258:}

342517802 ·¢±íÓÚ 2016-10-20 07:35:57

AV??{:10_266:}

xxzj01 ·¢±íÓÚ 2016-10-20 07:50:46

ÀíÇå¹ØÏµ½á¹¹

Èç¹û772815726 ·¢±íÓÚ 2016-10-20 08:38:36

ÎÒÒ²Ïë±äµÃÕâÃ´À÷º¦

Ò³: [1] 2 3 4 5 6 7 8 9 10

ÓãCÂÛÌ³'s Archiver

×îÖÕ°æ¡¾18½û¡¿Ò»Ö»ÔôÄÜÅÀ¶¯Í¼µÄ¡ª¡ª»Æ³æ¡£ÉðÊ¿ºÍÃÃ×Ó¶¼À´¿´¿´°É£¡