[爬虫]记第二次爬虫-词霸翻译,萌新交流区,萌新训练营,鱼C论坛

孤独的嫖客 发表于 2018-1-13 17:20:44

[爬虫]记第二次爬虫------词霸翻译

终于开启了爬虫路,然后大致方向是全栈,最后希望能走到机器学习
之前本来打算爬百度翻译的,结果一直报错不能正常爬取,听ZLOE 大佬启发, 换了一个翻译网站练手,

爬取目标:查询到目标词性,翻译,音标
目标网址:http://www.iciba.com/index.php

成品图

爬虫重要的还是爬之前的网页分析,分析到位了,爬虫写起来才舒服,关于分析网页,我也是个菜鸟,还是用浏览器的开发工具找找get啊 post啊还遇到过xhr和doc只能说爬的越多,越熟能生巧吧

这次关于程序的写法上,用到了这些:
json数据字典化:

通常json字典化都是这样的:
data3 = json.loads(json_str)
但是这样需要import json模块,按照上图方式,不引入json模块也可以直接字典化

Python join()方法:
Python join() 方法用于将序列中的元素以指定的字符连接生成一个新的字符串。

异常处理:
try......except Exception

这个处理是为了防止有些不存在的单词引发的报错......emmmmm我的原意是这个意思.
上一期链接:http://bbs.fishc.com/thread-103008-1-1.html
同上次,附源码,谢谢赏脸{:5_91:}
**** Hidden Message *****

像番茄加两个蛋 发表于 2018-1-13 19:05:33

好强的样子！如果能把发音也爬下来就好了~

mas黑子 发表于 2018-1-13 20:16:30

陆陆陆

陌生の你 发表于 2018-1-13 21:57:18

楼主666啊感谢楼主

孤独的嫖客 发表于 2018-1-13 22:22:15

像番茄加两个蛋发表于 2018-1-13 19:05
好强的样子！如果能把发音也爬下来就好了~

音频也可以爬,其实找到了音标,发音就在旁边只是我没有想好这个音标怎么和发音放一起所以就没有爬音标

hong9424 发表于 2018-1-15 10:53:39

谢谢谢大佬

页: [1]

鱼C论坛's Archiver

[爬虫]记第二次爬虫------词霸翻译