|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
本帖最后由 oooipussy 于 2020-6-20 17:59 编辑
- import urllib.request
- import re
- block = "0000000000000dc3998b2615c2a1754dd38eda2ab80624e9562873c5b20a4713"
- block_url = "https://btc.com/" + block
- block_page = '?page=2&order_by=tx_block_idx&asc=1'
- print (block_url)
- response = urllib.request.urlopen(block_url)
- html = response.read().decode('utf-8','ignore')
- result_next_block = re.search('(https://btc.com/)(\d(\w|\d){33})(")' , html)
- print (result_next_block)
复制代码 上面是 对某块 网页的读取
在取地址的时候 只能取得地址 33位 而不是 34位 为什么
我的正则 刚刚学的
也就是这句:
result_next_block = re.search('(https://btc.com/)(\d(\w|\d){33})(")' , html)
结果是这样的:
https://btc.com/0000000000000dc3 ... 4e9562873c5b20a4713
<_sre.SRE_Match object; span=(17373, 17424), match='https://btc.com/16aMVLpAWj9zDXpooSx9WyXxkLEwgHwL6> 这里最后还应该有一个S ,也就是正确结果是16aMVLpAWj9zDXpooSx9WyXxkLEwgHwL6S
但是我为什么取不到?
哪里不对么?
|
|