|
|

楼主 |
发表于 2019-3-25 09:12:18
|
显示全部楼层
import pandas as pd
import time
file = open('E:/123.txt')
line = file.readline()
filmname = [] #电影名称
showdate = [] #上映日期
overdate = [] #结束放映日期
boxoffice= [] #票房收入
#读取每一行,判断是否是电影行,如果是对其行进行切分
while line:
line = file.readline()
if "http://www.movie.com/bor/" in line:
ls = line.split(';')
filmname.append(ls[0].split(',')[-1])
showdate.append(ls[1])
overdate.append(ls[2])
boxoffice.append(float(ls[7][len("票房(万)"):]))
#将数据保存DataFrame类型
df_filminfo = pd.DataFrame({"电影名称":filmname,
"上映日期":showdate,
"结束放映日期":overdate,
"票房收入":boxoffice
})
#将数据改为日期类型
df_filminfo['上映日期'] = pd.to_datetime(df_filminfo['上映日期'])
df_filminfo['结束放映日期'] = pd.to_datetime(df_filminfo['结束放映日期'])
#保存csv文件
df_filminfo.to_csv("E:/ans0201.csv", index=False, sep=',')
这个就是从本地文件里提取内容的 |
|