jjxx2005 发表于 2020-8-1 12:48:48

关于爬取数据后对应关系的问题,谢谢

例如从:www.xxx.com获取出
名称 = ['一','二','三']
链接 = ['www1','www2','www3']

再解析每一个链接,得到每一链接下面对应的解析结果,例如每个链接下载都是一个列表

www1 对应的数据   ['1','2','3']
www2 对应的数据   ['4','5','6']
www3 对应的数据   ['7','8','9']

保存时想这样

一   1
一   2
一   3
二   4
二   5
二   6
三   7
三   8
三   9

请帮忙给个思路,谢谢

suchocolate 发表于 2020-8-5 22:33:57

本帖最后由 suchocolate 于 2020-8-5 22:39 编辑


import requests
from lxml import etree
from openpyxl import Workbook


if __name__ == '__main__':
    wb = Workbook()
    ws = wb.active
    headers = {'user-agent': 'firefox'}
    name_list = ['一', '二', '三']
    link_list = ['www1', 'www2', 'www3']
    row = 1
    for n, v in enumerate(name_list):
      r = requests.get(link_list, headers=headers)
      # html = etree.HTML(r.text)
      # data = html.xpath('//div/text()')
      data = ['1', '2', '3']
      for item in data:
            ws['a' + str(row)] = v
            ws['b' + str(row)] = item
            row = row + 1
    wb.save("test.xlsx")
页: [1]
查看完整版本: 关于爬取数据后对应关系的问题,谢谢