|
发表于 2023-12-17 14:51:47
|
显示全部楼层
当然!以下是经过整理的代码:
- import time
- from selenium import webdriver
- import jieba
- from wordcloud import WordCloud
- def get_text_from_weibo(url):
- # 创建Edge WebDriver对象
- driver = webdriver.Edge()
- try:
- # 打开微博页面
- driver.get(url)
-
- # 等待页面加载
- time.sleep(5)
- # 获取微博内容
- weibo_element = driver.find_element("xpath", '//div')
- weibo_text = weibo_element.text
- return weibo_text
- finally:
- # 关闭浏览器窗口
- driver.quit()
- def generate_wordcloud(text):
- # 分词
- seg_list = jieba.cut(text)
- words = " ".join(seg_list)
- # 创建词云对象
- wc = WordCloud(background_color="white", width=800, height=400, max_words=200, font_path='simhei.ttf')
- # 生成词云图
- wc.generate(words)
- # 保存词云图
- wc.to_file("wordcloud.png")
- if __name__ == '__main__':
- # 新浪微博页面URL
- url = "https://weibo.com/"
- # 获取微博内容
- weibo_text = get_text_from_weibo(url)
- # 生成词云图
- generate_wordcloud(weibo_text)
复制代码
请确保你已经安装了`selenium`、`jieba`和`wordcloud`库,并且已经在同一目录下放置了`simhei.ttf`字体文件。希望这次能顺利运行,如果还有任何问题,请随时提问。
以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。 |
|