wusuoshishi 发表于 2015-10-17 07:49:55

me dong dong

kaisenlee 发表于 2015-10-24 00:13:38

这个可以学习一下

lly212 发表于 2015-10-26 18:59:32

哈哈 谢谢你无私分享

whososyour 发表于 2015-10-27 00:18:20

233333333333333

lh81561505 发表于 2015-10-27 23:19:23

顶 加油 看了很有意思

John_Jiang 发表于 2015-10-28 09:54:39

看看 谢谢楼主咯

lizi4355 发表于 2015-10-28 22:16:45

:shy:先下载了再说了

新雏变老鸟 发表于 2015-10-28 23:01:17

代码复制好说IP这些感觉好高深

irvin 发表于 2015-10-29 10:38:22

:titter:看着有意思呀,学以致富

szzmx13 发表于 2015-10-29 13:10:36

现试试看

zzh3960 发表于 2015-10-29 14:00:07

Imagist 发表于 2015-10-29 14:42:57

谢谢分享!!!~~

jade1120 发表于 2015-11-2 13:42:26

:smile:smile:smile:smile:smile:smile:smile

lakdstalker 发表于 2015-11-3 10:28:49

感谢分享

狼本善 发表于 2015-11-3 11:36:51

{:9_240:}{:7_113:}

我爱小惠 发表于 2015-11-12 16:24:04

p = re.compile(r'''<tr\sclass[^>]*>\s+
                                    <td>.+</td>\s+    #这句我不懂,代理网页的审查元素是这样的
# <td>_</td>,中间只有一个横杠,为什么要加一个'+'号,麻烦楼主解释一下,谢谢!。
                                    <td>(.*)?</td>\s+
                                    <td>(.*)?</td>\s+
                                    <td>(.*)?</td>\s+
                                    <td>(.*)?</td>\s+
                                    <td>(.*)?</td>\s+
                                    <td>(.*)?</td>\s+
                              </tr>''',re.VERBOS

cuibaowenown2 发表于 2015-11-12 17:50:26

我爱小惠 发表于 2015-11-12 16:24
p = re.compile(r''']*>\s+
                                    .+\s+    #这句我不懂,代理网页的审 ...

是以防中间有更多的字符,.+可以匹配的更多而已,不用太在意这个

我爱小惠 发表于 2015-11-13 08:07:09

cuibaowenown2 发表于 2015-11-12 17:50
是以防中间有更多的字符,.+可以匹配的更多而已,不用太在意这个

感谢回复,这个我知道原因了,这丫的是一个标签双击打开里面还有东西的,呵呵。

294885154 发表于 2015-11-18 12:29:22

1111111111111111

gaoxiaone 发表于 2015-12-3 13:43:04

6666666666
页: 1 2 3 4 [5] 6 7 8 9 10 11 12 13 14
查看完整版本: 自动抓取代理IP并智能更换IP爬yande.re原图的爬虫(15禁)