求助
采用urllib爬取https://movie.douban.com/chart 页面下的电影名称,将其保存在movie.csv文件中 搜一下,豆瓣的代码很多的 这个怎么和你问题描述一毛一样,字都不差,你们是同学吗?https://fishc.com.cn/thread-185647-1-1.html 不一样 应该是吧 本帖最后由 suchocolate 于 2020-11-30 20:28 编辑
2951 发表于 2020-11-30 19:31
应该是吧
他的问题解决了,照着里面的代码写就行了。 本帖最后由 suchocolate 于 2020-11-30 20:33 编辑
2951 发表于 2020-11-30 19:30
不一样
from urllib import request
from lxml import etree
import csv
def main():
headers = {'User-Agent': 'Firefox'}
req = request.Request('https://movie.douban.com/chart', headers=headers)
r = request.urlopen(req)
html = etree.HTML(r.read().decode('utf-8'))
result = html.xpath('//span[@style="font-size:13px;"]/text()')
print(result)
with open('movies.csv', 'w', encoding='utf-8') as csvfile:
writer = csv.writer(csvfile)
for item in result:
writer.writerow()
print('done')
if __name__ == '__main__':
main()
页:
[1]