小甲鱼 发表于 2015-1-19 17:06:11

已有 12 人购买  本主题需向作者支付 5 鱼币 才能浏览 购买主题

小龙_h 发表于 2015-1-20 10:53:56

沙发?
{:9_217:}
哈哈,支持一下下,支持小甲鱼

jiagd0105 发表于 2015-1-20 22:07:21

re.search(r'ab{3, 10}c', 'abbbbbbc')
re.search(r'ab{3,10}c', 'abbbbbbc')

大括号里面加了个空格就不对了

什么都不懂呀 发表于 2015-1-28 12:10:31

来支持小甲鱼{:9_226:}

夏sir 发表于 2015-1-28 15:14:41

支持小甲鱼{:1_1:}

xiuos 发表于 2015-1-28 16:53:09

第57解课,看匹配ip的时候想到一个方法
import re
re.search(r'({1,3}\.){3}({1,3})','192.12.131.9')
:lol:

小甲鱼 发表于 2015-1-28 19:31:28

xiuos 发表于 2015-1-28 16:53
第57解课,看匹配ip的时候想到一个方法

这样会匹配 999.999.999.999 这样的无效 ip。

xiuos 发表于 2015-1-31 13:07:59

学了小甲鱼的正则学以致用,抓取代理ip,:lol:有什么可以优化的还要请小甲鱼老师指导
import urllib.request
import re

head = {}
head['User-Agent']='Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'
data = {}
url = 'http://cn-proxy.com/'
data = urllib.parse.urlencode(data).encode('utf-8')

req = urllib.request.Request(url,data,head)
response = urllib.request.urlopen(req)

html = response.read().decode('utf-8')
listip = re.findall(r"<tr>.+?</tr>",html,re.S)
#print(listip)

for each in listip:
    li = re.findall(r"<td>.+?</td>",each,re.S)
    if len(li):
      ip = re.search(r'(({1,3}\.){3}({1,3}))',li)
      if ip:
            port = re.search(r'{1,5}',li)
            print(ip.group(0)+":"+port.group(0))

梦醉美 发表于 2015-2-1 18:40:19

支持小甲鱼

菜子zzk 发表于 2015-2-1 19:02:07

支持楼主,感谢分享!

流泉 发表于 2015-2-7 20:27:11

支持下,辛苦了!

劫陨 发表于 2015-2-14 01:55:11

支持 小甲鱼老师~~

蜘蛛侠yan 发表于 2015-3-8 00:15:35

好,记入我的Python语法学习先,
谢谢老师

swsm 发表于 2015-3-12 18:51:38

支持呦,python!!!

T--MAC 发表于 2015-3-24 21:03:55

复制不了?

士多啤梨 发表于 2015-4-12 01:27:00

支持楼主:ton:

View 发表于 2015-5-15 17:47:33

:big支持支持支持

Juneel 发表于 2015-5-19 15:39:30

甲鱼。。。。。。。。。。。。

View 发表于 2015-6-4 09:20:41

:lol::lol:支持小甲鱼

View 发表于 2015-6-4 15:16:48

{:1_1:}{:1_1:}谢谢小甲鱼,爱你
页: [1] 2 3 4 5 6 7 8 9 10
查看完整版本: Python3 正则表达式特殊符号及用法(详细列表)