|
发表于 2023-2-21 14:35:59
|
显示全部楼层
如果你要从网页中抓取的小说内容被编码成大小写英文、数字和加号等字符,那么可能是采用了一种编码方式,比如Base64编码或者其他编码方式。你可以使用Python中的相应库对这种编码进行解码。
对于状态码变成了304重定向,这通常意味着你请求的资源已经被缓存,服务器直接返回了缓存的内容,而没有返回实际的资源。如果你需要获取最新的内容,你可以尝试在请求中添加一些参数,比如时间戳等,以避免缓存。
以下是使用Python进行解码的示例代码:
- import base64
- encoded_str = "SGVsbG8gV29ybGQh" # 编码后的字符串
- decoded_str = base64.b64decode(encoded_str).decode('utf-8') # 解码
- print(decoded_str)
复制代码
如果你要解码其他编码方式的字符串,你可以使用Python的相应库进行解码,比如:
对于URL编码的字符串,可以使用urllib.parse.unquote方法进行解码。
对于HTML实体编码的字符串,可以使用html.unescape方法进行解码。
对于其他编码方式的字符串,可以参考相应的解码方法进行解码。
希望这些信息对你有所帮助!
|
|