鱼C论坛

 找回密码
 立即注册
楼主: 小甲鱼

[办公] 使用Python读写Excel文件(1)

  [复制链接]
发表于 2018-10-31 00:04:26 | 显示全部楼层
盛大、
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-10-31 20:37:06 | 显示全部楼层
想学习一下
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-11-1 15:45:42 | 显示全部楼层
朕想知道
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-11-4 00:19:18 | 显示全部楼层
..
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2018-11-4 16:59:29 | 显示全部楼层
朕想知道
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-11-5 08:17:18 | 显示全部楼层
朕想知道
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-11-6 15:27:13 | 显示全部楼层
朕想知道
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-11-6 15:46:45 From FishC Mobile | 显示全部楼层
朕想知道
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-11-7 16:48:22 | 显示全部楼层
朕想知道
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-11-7 17:02:57 | 显示全部楼层
朕想知道
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-11-7 22:04:39 | 显示全部楼层
  1. import urllib.request

  2. from bs4 import BeautifulSoup as bs

  3. import re

  4. import openpyxl

  5. def urlopen(url):

  6.     head = {}

  7.     head['Accept'] = 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8'
  8.     head['Accept-Language'] = 'zh-CN,zh;q=0.9'
  9.     head['Cache-Control'] = 'no-cache'
  10.     head['Connection'] = 'keep-alive'
  11.    
  12.     head['Cookie']='bid=Wv1u2my5GJI; gr_user_id=ec943490-8875-40fe-b5b9-538d784cbf84; _vwo_uuid_v2=D6C966AC33758154BD3FC61FB43687FE2|718456dd9cd6126870e9d38c3a11a25e; douban-fav-remind=1; viewed="26820803_1200840_30209224"; ps=y; dbcl2="186505260:SSyljm2guj8"; push_noty_num=0; push_doumail_num=0; ck=giUI; ap_v=0,6.0; _pk_ref.100001.4cf6=%5B%22%22%2C%22%22%2C1541515329%2C%22https%3A%2F%2Ffishc.com.cn%2Fthread-94979-1-1.html%22%5D; _pk_ses.100001.4cf6=*; __utma=30149280.1606666109.1528767205.1540645031.1541515329.9; __utmb=30149280.0.10.1541515329; __utmc=30149280; __utmz=30149280.1541515329.9.4.utmcsr=fishc.com.cn|utmccn=(referral)|utmcmd=referral|utmcct=/thread-94979-1-1.html; __utma=223695111.832413198.1541515329.1541515329.1541515329.1; __utmb=223695111.0.10.1541515329; __utmc=223695111; __utmz=223695111.1541515329.1.1.utmcsr=fishc.com.cn|utmccn=(referral)|utmcmd=referral|utmcct=/thread-94979-1-1.html; __yadk_uid=VJnac125pQedgBMAqBXBVd9hGRBckHeH; _pk_id.100001.4cf6=607e87647801a894.1541515329.1.1541515370.1541515329.'
  13.     head['Host']='movie.douban.com'
  14.     head['Pragma']='no-cache'
  15.     head['Upgrade-Insecure-Requests']='1'
  16.     head['User-Agent']='Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'


  17.     req = urllib.request.Request(url,headers = head)
  18.    
  19.     html = urllib.request.urlopen(req)

  20.     html = html.read()

  21.     return html

  22. def xia():

  23.    

  24.     ye =0

  25.     wb = openpyxl.Workbook()

  26.     ws = wb.active

  27.     for i in range(10):

  28.         url = 'https://movie.douban.com/top250?start={}&filter='.format (ye)

  29.         ye = ye+25

  30.         html = urlopen(url)

  31.         html = html.decode('utf-8')

  32.         htm = bs(html,'lxml')

  33.         data = htm.ol

  34.         da = str(data)

  35.         url_name = re.findall(r'(href=".*?)">\n<span class="title">(.*?)<',da)

  36.         dao =re.findall(r'\n                            (.*?)<br',da)

  37.         pin = re.findall(r'property="v:average">(.*?)<',da)

  38.         for i in range(25):
  39.             print('电影名:'+url_name[i][1])

  40.             print('链接:'+url_name[i][0])

  41.             print('导演:'+dao[i])

  42.             print('电影评分'+pin[i]+'\n\n')



  43.             ws.append([url_name[i][1],pin[i],url_name[i][0],dao[i]])

  44.     wb.save('电影.xlsx')
  45.    
  46. xia()
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-11-8 16:10:45 | 显示全部楼层
怎么才能从txt文件中读出来以后,再写到excel中呢
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-11-10 20:37:29 | 显示全部楼层
牛逼
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2018-11-15 21:00:09 | 显示全部楼层
朕想知道
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-11-19 15:09:04 | 显示全部楼层
“朕想知道
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-11-19 16:36:36 | 显示全部楼层
I love FishC.com!
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-11-20 22:09:01 | 显示全部楼层
朕想知道
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-11-21 09:39:05 | 显示全部楼层
朕想知道
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-11-27 09:20:13 | 显示全部楼层
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2018-12-1 19:41:55 | 显示全部楼层
z
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-6-3 19:51

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表