2951 发表于 2020-11-30 00:52:56

求助

采用urllib爬取https://movie.douban.com/chart 页面下的电影名称,将其保存在movie.csv文件中

wp231957 发表于 2020-11-30 08:49:27

搜一下,豆瓣的代码很多的

suchocolate 发表于 2020-11-30 10:02:52

这个怎么和你问题描述一毛一样,字都不差,你们是同学吗?
https://fishc.com.cn/thread-185647-1-1.html

2951 发表于 2020-11-30 19:30:14

不一样

2951 发表于 2020-11-30 19:31:00

应该是吧

suchocolate 发表于 2020-11-30 20:05:07

本帖最后由 suchocolate 于 2020-11-30 20:28 编辑

2951 发表于 2020-11-30 19:31
应该是吧

他的问题解决了,照着里面的代码写就行了。

suchocolate 发表于 2020-11-30 20:28:08

本帖最后由 suchocolate 于 2020-11-30 20:33 编辑

2951 发表于 2020-11-30 19:30
不一样

from urllib import request
from lxml import etree
import csv


def main():
    headers = {'User-Agent': 'Firefox'}
    req = request.Request('https://movie.douban.com/chart', headers=headers)
    r = request.urlopen(req)
    html = etree.HTML(r.read().decode('utf-8'))
    result = html.xpath('//span[@style="font-size:13px;"]/text()')
    print(result)
    with open('movies.csv', 'w', encoding='utf-8') as csvfile:
      writer = csv.writer(csvfile)
      for item in result:
            writer.writerow()
    print('done')


if __name__ == '__main__':
    main()
页: [1]
查看完整版本: 求助