ip代理!!!!!!!!!!
'{'HTTP': '112.111.77.42 : 9999'}''{'HTTP': '123.169.36.227 : 9999'}'
'{'HTTP': '122.192.175.30 : 9999'}'
'{'HTTP': '113.121.38.252 : 9999'}'
'{'HTTP': '175.42.123.27 : 9999'}'
'{'HTTP': '123.55.102.10 : 9999'}'
'{'HTTP': '113.120.38.193 : 9999'}'
'{'HTTP': '120.83.100.36 : 9999'}'
'{'HTTP': '110.249.176.26 : 8060'}'
'{'HTTP': '223.242.225.222 : 9999'}'
'{'HTTP': '123.163.27.122 : 9999'}'
'{'HTTP': '112.111.77.141 : 9999'}'
'{'HTTP': '1.196.177.197 : 9999'}'
把爬到的ip保存到csv文件中,如上所示。但是在另一个py文件中要读取这些ip,读取出来的都是字符串,没办法转换成列表去遍历使用。
问下大家都是怎么构建ip代理池的 怎么会没办法呢?保存成txt,用readlines,返回的不就是列表么? 疾风怪盗 发表于 2020-10-16 18:47
怎么会没办法呢?保存成txt,用readlines,返回的不就是列表么?
感谢感谢 疾风怪盗 发表于 2020-10-16 18:47
怎么会没办法呢?保存成txt,用readlines,返回的不就是列表么?
还是不行啊,readlines返回的就是全部,在一个列表里,但是我要for循环readlines的话,就是一个一个的字符串,还是不能变列表
是薛 发表于 2020-10-16 19:05
还是不行啊,readlines返回的就是全部,在一个列表里,但是我要for循环readlines的话,就是一个一个的字 ...
要么eval字符串得到字典
要么字符串的单引号替换为双引号后反序列化 本帖最后由 疾风怪盗 于 2020-10-16 19:27 编辑
proxy={'http':'118.212.106.81:9999'}
你是要变成这样咯,可以用5楼提到的eval
也可以自己写啊,你readlines后是读取了全部数据,列表,循环下就是单个数据'{'HTTP': '112.111.77.42 : 9999'}'
split对冒号切片,把后面的数据不就是112.111.77.42 : 9999么,放到proxy={'http':' '}里字符串拼接一下,
不就好了么,这不是很简单的么?都是最基础的知识
如果你连这个都不会,那还怎么写爬虫?
页:
[1]