python 字符串问题 求解
本帖最后由 暗夜之隐 于 2021-7-24 09:39 编辑网页上的字被反爬字库转了的。
出来的结果:
a = '\U000be900' #这是直接在网页上得到的
aa = {'uBE900': '七'}#这是解析字库得到的
问题是如何把 a 转换成 aa字典的键值这样才好来替换成字
字符串 a 我没明白是什么编码 长度只有1 type(a) 的结果又是字符串,我无法转出和字典一样的键值。正则对变量 a 也没用 把url发出来看看,你这么说很难看的明白
目测像编码转换。。。
为了反扒弄个其他方式加密,把所有文字用字库来加密整,说实话感觉不太真实 一般来说可以看这个网站编码有没有一个统一的规律,有的话可以先把字符串转成列表,然后利用这个规律对列表进行操作,提取所需部分作转换,比如大小写转换,最后合并成字符串再比对。
之前做过一个简单的爬虫软件(技术力很低的而已),稍微有一丢丢经验,不知道对你的问题有没有帮助。 笨鸟学飞 发表于 2021-7-24 16:25
把url发出来看看,你这么说很难看的明白
目测像编码转换。。。
为了反扒弄个其他方式加密,把所有文字用 ...
a = '\U000be900' #这是直接在网页上得到的
aa = {'uBE900': '七'}#这是解析字库得到的
目的你可以试一下,把a 变量换成 字典aa的键,已知 a里面的U000就等于u后面就只是大小写问题而已。但就是做不到 url不方便发吗?如果确实是这样,那只能是找规律了
看你发的这一个你只能知道一个没卵用的规律
我理解你的意思,a字符串里面有转义字符,你不好操作转成键值而已。。。代码仅供参考
a = '\U000be900'
aa = {'uBE900': '七'}
b = {'\U000be900':'uBE900'}
c = b
print(aa) 笨鸟学飞 发表于 2021-7-24 22:07
url不方便发吗?如果确实是这样,那只能是找规律了
看你发的这一个你只能知道一个没卵用的规律
我理解你 ...
不是这个意思 。
我从网页上得到 a 变量这是一个字。但是自定义的字库。我解析出来的的字库字典是aa = {'uBE900': '七'}
那 a = '\U000be900' , aa = {'uBE900': '七'} 我如何把a变成七。就需要把网页得到的 a 变量转换成字典的键值,但是转换不出来 笨鸟学飞 发表于 2021-7-24 22:07
url不方便发吗?如果确实是这样,那只能是找规律了
看你发的这一个你只能知道一个没卵用的规律
我理解你 ...
简单的说:如何把字符串 a = '\U000be900'改变成 字符串 'uBE900' 暗夜之隐 发表于 2021-7-25 09:47
简单的说:如何把字符串 a = '%u000be900'改变成 字符串 'uBE900'
发了代码了啊
页:
[1]