51job简历python爬虫

孤独的嫖客 · 发表于 2018-9-24 07:53:53

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

之前求职的时候,作为练习项目,爬了一下51job的招聘信息,为避免遗忘,现在记录一下.
爬取目标:
https://search.51job.com/list/000000,000000,0000,00,9,99,python爬虫,2,1.html
爬取字段:

登录/注册后可看大图

先上最终爬取结果图示:

登录/注册后可看大图

所用到的包:

from lxml import etree
import requests
import time
import pymysql

复制代码

相关元素的xpath定位:

node_list = html.xpath("//div[@class='dw_table']")
for node in node_list:
'''
Position 职位名称
Company 公司名称
Place 工作地区
Wages 薪资
Time 发布时间
Link 详情链接
'''
Position = node.xpath("./div/p/span/a/@title")
Company = node.xpath("./div/span[@class='t2']/a/text()")
Place = node.xpath("./div[@class='el']/span[2]/text()")
Wages = node.xpath("./div[@class='el']/span[3]/text()")
Time = node.xpath("./div[@class='el']/span[4]/text()")
Link = node.xpath("./div/p/span/a/@href")

复制代码

文章中使用了Mysql数据库,如果想尝试运行代码,请先创建匹配的数据表:

CREATE TABLE `51job` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`职位名称` text,
`公司名称` text,
`工作地区` text,
`薪资` text,
`发布时间` text,
`详情页` text,
PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=0 DEFAULT CHARSET=utf8;

复制代码

代码全文:

游客，如果您要查看本帖隐藏内容请回复

乔一丨JOY · 发表于 2018-9-24 08:53:26

学习

miladuo · 发表于 2018-9-30 15:44:41

谢谢LZ的无私奉献，学习一下！

YUANxin · 发表于 2018-10-1 08:51:57

感谢分享

June_xr · 发表于 2018-10-6 21:39:05

感谢分享

JYVKX · 发表于 2018-10-7 23:07:57

123

蓝忘机的兔子2 · 发表于 2018-10-8 10:45:11

学习一下！

hefu77 · 发表于 2018-10-8 12:15:35

学习了

隋唐 · 发表于 2018-10-8 12:47:22

51job简历python爬虫

jack77 · 发表于 2018-10-8 13:07:17

wjzeng · 发表于 2018-10-8 17:50:26

学习~

z11397444 · 发表于 2018-10-8 18:32:39

Alex6189 · 发表于 2018-10-9 14:55:22

66666666

yw2311 · 发表于 2018-10-9 15:48:11

请问如何创建匹配的数据表？

yw2311 · 发表于 2018-10-9 15:54:32

  File "C:/Users/wf/Desktop/job.py", line 8, in <module>
class My51job():
  File "C:/Users/wf/Desktop/job.py", line 25, in My51job
charset='utf8')
  File "D:\Python37\lib\site-packages\pymysql\__init__.py", line 94, in Connect
return Connection(*args, **kwargs)
  File "D:\Python37\lib\site-packages\pymysql\connections.py", line 261, in __init__
self.password = self.password.encode('latin1')
UnicodeEncodeError: 'latin-1' codec can't encode characters in position 0-3: ordinal not in range(256)

yw2311 · 发表于 2018-10-9 15:55:56

请问可以在phpstudy 里面创造数据库吗 51job爬虫这个

lntv2 · 发表于 2018-10-9 16:32:25

怎么用？

yw2311 · 发表于 2018-10-9 17:08:42

上面的可以了，如果想限制地区和职业要怎么设置？

wwhywhy · 发表于 2018-10-10 10:47:30

学习啊！

wangtianyuan · 发表于 2018-10-10 11:07:50

账号		自动登录	找回密码
密码			立即注册

[作品展示] 51job简历python爬虫

马上注册，结交更多好友，享用更多功能^_^