[爬虫]记第二次爬虫------词霸翻译
终于开启了爬虫路,然后大致方向是全栈,最后希望能走到机器学习之前本来打算爬百度翻译的,结果一直报错不能正常爬取,听ZLOE 大佬启发, 换了一个翻译网站练手,
爬取目标:查询到目标词性,翻译,音标
目标网址:http://www.iciba.com/index.php
成品图
爬虫重要的还是爬之前的网页分析,分析到位了,爬虫写起来才舒服,关于分析网页,我也是个菜鸟,还是用浏览器的开发工具 找找get啊 post啊还遇到过xhr和doc只能说爬的越多,越熟能生巧吧
这次关于程序的写法上,用到了这些:
json数据字典化:
通常json字典化都是这样的:
data3 = json.loads(json_str)
但是这样需要import json模块,按照上图方式,不引入json模块也可以直接字典化
Python join()方法:
Python join() 方法用于将序列中的元素以指定的字符连接生成一个新的字符串。
异常处理:
try......except Exception
这个处理是为了防止有些不存在的单词引发的报错......emmmmm我的原意是这个意思.
上一期链接:http://bbs.fishc.com/thread-103008-1-1.html
同上次,附源码,谢谢赏脸{:5_91:}
**** Hidden Message *****
好强的样子!如果能把发音也爬下来就好了~ 陆陆陆 楼主666啊 感谢楼主 像番茄加两个蛋 发表于 2018-1-13 19:05
好强的样子!如果能把发音也爬下来就好了~
音频也可以爬,其实找到了音标,发音就在旁边 只是我没有想好这个音标怎么和发音放一起 所以就没有爬音标
谢谢谢大佬
页:
[1]