鱼C论坛

 找回密码
 立即注册
查看: 1340|回复: 1

[已解决]关于爬取数据后对应关系的问题,谢谢

[复制链接]
发表于 2020-8-1 12:48:48 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
  1. 例如从:www.xxx.com获取出
  2. 名称 = ['一','二','三']
  3. 链接 = ['www1','www2','www3']

  4. 再解析每一个链接,得到每一链接下面对应的解析结果,例如每个链接下载都是一个列表

  5. www1 对应的数据   ['1','2','3']
  6. www2 对应的数据   ['4','5','6']
  7. www3 对应的数据   ['7','8','9']

  8. 保存时想这样

  9. 一   1
  10. 一   2
  11. 一   3
  12. 二   4
  13. 二   5
  14. 二   6
  15. 三   7
  16. 三   8
  17. 三   9

  18. 请帮忙给个思路,谢谢
复制代码
最佳答案
2020-8-5 22:33:57
本帖最后由 suchocolate 于 2020-8-5 22:39 编辑

  1. import requests
  2. from lxml import etree
  3. from openpyxl import Workbook


  4. if __name__ == '__main__':
  5.     wb = Workbook()
  6.     ws = wb.active
  7.     headers = {'user-agent': 'firefox'}
  8.     name_list = ['一', '二', '三']
  9.     link_list = ['www1', 'www2', 'www3']
  10.     row = 1
  11.     for n, v in enumerate(name_list):
  12.         r = requests.get(link_list[n], headers=headers)
  13.         # html = etree.HTML(r.text)
  14.         # data = html.xpath('//div/text()')
  15.         data = ['1', '2', '3']
  16.         for item in data:
  17.             ws['a' + str(row)] = v
  18.             ws['b' + str(row)] = item
  19.             row = row + 1
  20.     wb.save("test.xlsx")
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-8-5 22:33:57 | 显示全部楼层    本楼为最佳答案   
本帖最后由 suchocolate 于 2020-8-5 22:39 编辑

  1. import requests
  2. from lxml import etree
  3. from openpyxl import Workbook


  4. if __name__ == '__main__':
  5.     wb = Workbook()
  6.     ws = wb.active
  7.     headers = {'user-agent': 'firefox'}
  8.     name_list = ['一', '二', '三']
  9.     link_list = ['www1', 'www2', 'www3']
  10.     row = 1
  11.     for n, v in enumerate(name_list):
  12.         r = requests.get(link_list[n], headers=headers)
  13.         # html = etree.HTML(r.text)
  14.         # data = html.xpath('//div/text()')
  15.         data = ['1', '2', '3']
  16.         for item in data:
  17.             ws['a' + str(row)] = v
  18.             ws['b' + str(row)] = item
  19.             row = row + 1
  20.     wb.save("test.xlsx")
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-6-24 20:43

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表