鱼C论坛

 找回密码
 立即注册
查看: 1522|回复: 7

[已解决]求助一个爬虫数据的存储问题

[复制链接]
发表于 2019-11-16 13:58:34 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x

有关东方财富网,http://data.eastmoney.com/hsgt/top10/2019-11-12.html
想试着爬取上面十大成交股的数据,但是爬出来的数据都是图片上那种,请问有没有办法直接做成列表然后保存excel或者直接保存excel?
另外这个网能不能用requests爬,东方财富网很多别的数据我都可以从network里找到数据源,但是这个找不到。。


  1. from selenium import webdriver
  2. import time
  3. import pandas as pd

  4. browser = webdriver.Chrome()
  5. browser.get('http://data.eastmoney.com/hsgt/top10/2019-11-12.html')
  6. time.sleep(5)
  7. eid = 'Rank_hgt_1'
  8. em = browser.find_element_by_id(eid)
  9. print(em.text)
  10. browser.close()
复制代码
最佳答案
2019-11-17 09:32:27
添加代码
  1. import xlwt
  2. wb = xlwt.Workbook()        #创建一个工作簿
  3. ws = wb.add_sheet('sheet1')        #增加一个sheet1的工作表
  4. lists = em.text.split('\n')
  5. for i in range(len(lists)):
  6.     for j in range(len(lists[i].split(' '))):
  7.         ws.write(i,j,lists[i].split(' ')[j])        #在i行j列插入数据
  8. wb.save('data.xls')
复制代码


微信截图_20191117093206.png
QQ截图20191116135439.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2019-11-17 09:32:27 | 显示全部楼层    本楼为最佳答案   
添加代码
  1. import xlwt
  2. wb = xlwt.Workbook()        #创建一个工作簿
  3. ws = wb.add_sheet('sheet1')        #增加一个sheet1的工作表
  4. lists = em.text.split('\n')
  5. for i in range(len(lists)):
  6.     for j in range(len(lists[i].split(' '))):
  7.         ws.write(i,j,lists[i].split(' ')[j])        #在i行j列插入数据
  8. wb.save('data.xls')
复制代码


微信截图_20191117093206.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

发表于 2019-11-17 17:09:18 | 显示全部楼层
本帖最后由 Stubborn 于 2019-11-17 17:12 编辑
  1. centent = f"{a},{b}"
  2. # 之间用逗号隔开,英文的
  3. with open("**.csv", "a") as f:
  4.     f.write(centent)
复制代码


标准的CSV储存,可有用excle打开
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-11-17 17:11:47 From FishC Mobile | 显示全部楼层
Stubborn 发表于 2019-11-17 17:09
标准的CSV储存,可有用excle打开

第一句那个是神马语法?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-11-17 17:13:06 | 显示全部楼层
wp231957 发表于 2019-11-17 17:11
第一句那个是神马语法?

和 字符串的format() 一样,更加方便一点,
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-11-18 20:12:24 | 显示全部楼层

另外问下,这个网的数据能用requests.get爬吗,我在network找了好久都没找到网址
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-11-19 16:04:14 | 显示全部楼层
占位,以便后面学习用!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-11-22 21:03:40 | 显示全部楼层
Astray.R 发表于 2019-11-18 20:12
另外问下,这个网的数据能用requests.get爬吗,我在network找了好久都没找到网址

可以啊
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-20 23:19

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表