鱼C论坛

 找回密码
 立即注册
查看: 1366|回复: 6

求问怎么让程序run出结果

[复制链接]
发表于 2020-8-6 00:57:16 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
自己试了好久,真的最后run不出来了……不知道哪里卡住……

求问各路大神怎么能够得出结果……
谢谢!

  1. # @Software : PyCharm


  2. import requests
  3. import bs4
  4. import re

  5. #拆解list
  6. def downgradedict(init_dic):
  7.     list = []
  8.     for k in init_dic:
  9.         list.append(init_dic[k])
  10.     return list

  11. #获取指定单词的所有具体解释词条
  12. def getexplanations(word):
  13.     set = []
  14.     url = "https://www.lexico.com/definition/%s" %word
  15.     headers = {
  16.         'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.98 Safari/537.36'}
  17.     res = requests.get(url, headers=headers)
  18.     data = bs4.BeautifulSoup(res.text, "html.parser")
  19.     #抓出来的会有许多空列表,这里只把有内容的部分加入返回值的集合里面
  20.     for i in range(0, 20):
  21.         for j in range(0, 20):
  22.             exp = data.select(
  23.                 "#content > div.lex-container > div.main-content > div > div > div > div > section:nth-child( %d ) > ul > li:nth-child( %d ) > div > p > span.ind" % (
  24.                 i, j))
  25.             if len(exp) == 1:
  26.                 key = exp[0]
  27.                 set.append(key.get_text())
  28.             elif len(exp) == 0:
  29.                 pass
  30.     return set

  31. [b]上面这个函数经常会run出来许多空列表,不知道有没有什么方便的方法能直接略过它们[/b]

  32. #将抓出来的解释列表化为单词列表
  33. def getwords(list):
  34.     list2 = []
  35.     for i in list:
  36.         k = re.split(r'[;,\s]\s*', i)
  37.         #只留下纯单词,不要标点符号和括号
  38.         for x in k:
  39.             x = x.lower()
  40.             x = x.replace(".", "")
  41.             x = x.replace(")", "")
  42.             x = x.replace("(", "")
  43.             #单词列表里面词不重复
  44.             if x not in list2:
  45.                 list2.append(x)
  46.             elif x in list2:
  47.                 pass
  48.     return list2

  49. [b]似乎是这一步出了问题,但不知道具体如何[/b]

  50. #指定一个单词,然后找与之相关的所有解释,统计里面出现出来的词,再加回这个单词列表里面,直到列表不再增长
  51. def getallwords(word):
  52.     set1 = [word]
  53.     set2 = []
  54.     while sorted(set1) != sorted(set2):  #设立两个列表,比较两个列表是否一致(研究需要这一点)
  55.         for i in set1:
  56.             x = getexplanations(i)
  57.             y = getwords(x)
  58.             for item in y:               #遍历第一个表单里面的单词,然后找与这些单词相关所有词典解释使用的单词
  59.                 if item not in set2:     #如果找到的这些单词不在列表2,则将这些单词添加进列表1和列表2
  60.                     set1.append(item)
  61.                     set2.append(item)
  62.                 else:
  63.                     pass                 #如果这些单词已经存在,则略过
  64.     return set2

  65. print(getallwords('phrase'))
复制代码

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-8-6 08:47:56 | 显示全部楼层
不是跑不出来...是要跑N久...用多进程搞搞吧~~~
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-8-6 11:17:51 | 显示全部楼层
yhhpf 发表于 2020-8-6 08:47
不是跑不出来...是要跑N久...用多进程搞搞吧~~~

并不会进程 > <

稍微改了下最后循环的结构,先跑跑看了……
  1. def getallwords(word):
  2.     set1 = [word]
  3.     set2 = [word]
  4.     while len(set1) != 0:
  5.         for i in set1:
  6.             x = getexplanations(i)
  7.             y = getwords(x)
  8.             for item in y:
  9.                 if item in set1:
  10.                     set1.remove(item)
  11.                 else:
  12.                     set1.append(item)
  13.                 if item not in set2:
  14.                     set2.append(item)
  15.                 else:
  16.                     pass
  17.     return set2
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-8-6 16:27:42 | 显示全部楼层
clclclcl 发表于 2020-8-6 11:17
并不会进程 > <

稍微改了下最后循环的结构,先跑跑看了……

这个确实最好用进程搞,要不你学学进程?
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

 楼主| 发表于 2020-8-6 20:22:00 | 显示全部楼层
陈尚涵 发表于 2020-8-6 16:27
这个确实最好用进程搞,要不你学学进程?

这就去学
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-8-6 20:27:56 | 显示全部楼层
改进了一下,能run出来了
  1. # @Software : PyCharm

  2. from lxml.etree import HTML
  3. import requests
  4. import re
  5. import bs4

  6. #拆解list
  7. def downgradedict(init_dic):
  8.     list = []
  9.     for k in init_dic:
  10.         list.append(init_dic[k])
  11.     return list


  12. #获取指定单词的所有具体解释词条
  13. def getexplanations(word):
  14.     url = "https://www.lexico.com/definition/%s" %word
  15.     headers = {
  16.         'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Safari/537.36'
  17.     }
  18.     request = requests.get(url, headers=headers)
  19.     html = HTML(request.text)
  20.     word_content = html.xpath('//span[@class="ind"]/text()')
  21.     return word_content[:1]

  22. #将抓出来的解释列表化为单词列表
  23. def getwords(list):
  24.     list2 = []
  25.     for i in list:
  26.         k = re.split(r'[;,\s]\s*', i)
  27.         #只留下纯单词,不要标点符号和括号
  28.         for x in k:
  29.             x = x.lower()
  30.             x = x.replace(".", "")
  31.             x = x.replace(")", "")
  32.             x = x.replace("(", "")
  33.             #单词列表里面词不重复
  34.             if x not in list2:
  35.                 list2.append(x)
  36.             elif x in list2:
  37.                 pass
  38.     return list2

  39. #指定一个单词,然后找与之相关的所有解释,统计里面出现出来的词,再加回这个单词列表里面,直到列表不再增长
  40. def getallwords(word):
  41.     set1 = [word]
  42.     set2 = [word]
  43.     while len(set1) != 0:
  44.         for i in set1:
  45.             x = getexplanations(i)
  46.             y = getwords(x)
  47.             set1 = list(set(y) - set(set2))
  48.             set2 = list(set(set2).union(y))
  49.     return set2

  50. print(getallwords('position'))
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-8-7 13:59:43 | 显示全部楼层
clclclcl 发表于 2020-8-6 20:27
改进了一下,能run出来了

总算解决了
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-6-25 05:58

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表