鱼C论坛

 找回密码
 立即注册
查看: 2257|回复: 2

[已解决]爬虫过程中遇到的解码问题

[复制链接]
发表于 2020-5-18 16:08:37 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
UnicodeEncodeError: 'UCS-2' codec can't encode characters in position 69-69: Non-BMP character not supported in Tk


这是发生的错误,请问我爬取微博的数据之后,准备写在txt文件上,用的是utf-8编码形式打开的,然后发现如果在微博中爬取的内容出现了其他网页的链接,就是比如微博转发的内容里包括了其他网页的链接, 就会抛出这个错误,请问可以怎么解决呢?
最佳答案
2020-5-18 16:10:59
通过正则遍历然后sub替换成”“空字符串可行吗?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-5-18 16:10:59 | 显示全部楼层    本楼为最佳答案   
通过正则遍历然后sub替换成”“空字符串可行吗?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-18 17:58:13 From FishC Mobile | 显示全部楼层
忽略之呢,会有影响不
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-11 17:03

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表