求助参数传导！

shangrilas · 发表于 2018-12-21 16:12:36

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

想将def get_txtname(html): 里面的l5在def get_titlename(html):→f = open(path+r'\\test.txt','a')处引用，打开已由l5命名写好文件名的txt文档

==================================================================================================
import urllib.request
import re
import os
import string

path = os.getcwd()  # 获取当前路径

def open_url(url):
req = urllib.request.Request(url)
req.add_header('User-Agent',
               'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.80 Safari/537.36')
page = urllib.request.urlopen(url)
html = page.read().decode('utf-8')
return html

def get_txt(html):
lst1 = str(r'<head>[\s\S]*<title>.*</title>')
lst2 = (r'<div id="tac">[\s\S]*<div class="info bottominfo">')
l1 = str(re.findall(lst1,html))
l1 = l1[51:].replace('\'','').replace('\"', '').replace('>]','')
l1list = l1.split(',')[0]
l2 = str(re.findall(lst2,html))
l2 = l2[92:].replace(r'\u3000\u3000','    ').replace('<br/><br/>','\n')[:-60]
l2 = re.sub('\*',' ',l2)
l2 = str(l2)
f = open(path+r'\\test.txt','a')
f.write(l1list)
f.write('\n\n')
f.write(l2)
f.write('\n\n\n')
print(l1list + '→→→下载完成→→→')

def get_titlename(html):
lst3 = str(r'<head>[\s\S]*<title>.*</title>')
l3 = str(re.findall(lst3,html))
print(l3)
l3 = l3[43:].split('_')[0].replace('txt下载','\n  ——').replace('(','').replace(')','')
print(l3 + '→正在下载')
f = open(path+r'\\test.txt','a')
f.write(l3)
f.write('\n\n')
print(l3 + '→→→titlename下载完成→→→')

def get_txtname(html):
lst4 = str(r'<head>[\s\S]*<title>.*</title>')
l4 = str(re.findall(lst4,html))
l5 = l4[43:].split('txt')[0]
f = open(path+r'\\%s.txt'%(l5),'a')
f.close

if __name__ == '__main__':
print('使用说明：'
      '示例：《武道乾坤》，URL https://www.xiashu.la/2186/  ，该书目录为即为2186')
url0 = 'https://www.xiashu.la'
ml = input('请输入目录')
url1 = url0 + r'/' + ml + r'/'
print('你输入的目录为：%s'%url1)
chapters = input('请输入总章节数(示例80页，则输入80):')
chapters = int(chapters)
print("当前工作目录 : %s" % path)
get_txtname(open_url(url1))
get_titlename(open_url(url1))
for chapter in range(1,chapters+1):
      url = url1 +'read_'+ str(chapter) + '.html'
      print(url)
      get_txt(open_url(url))
===================================================================================

塔利班 · 发表于 2018-12-21 16:40:22

想用的对象要么返回，要么用全局变量

shangrilas · 发表于 2018-12-21 16:46:26

塔利班发表于 2018-12-21 16:40
想用的对象要么返回，要么用全局变量

新手上路，能给详细说说吗？

塔利班 · 发表于 2018-12-21 16:47:53

def get_txtname(html):
lst4 = str(r'<head>[\s\S]*<title>.*</title>')
l4 = str(re.findall(lst4,html))
l5 = l4[43:].split('txt')[0]
f = open(path+r'\\%s.txt'%(l5),'a')
f.close()
return l5

shangrilas · 发表于 2018-12-21 22:54:20

本帖最后由 shangrilas 于 2018-12-21 23:52 编辑

塔利班发表于 2018-12-21 16:47
def get_txtname(html):
lst4 = str(r'[\s\S]*.*')
l4 = str(re.findall(lst4,html))

还是不对啊。运行报错啊
这只是有个返回值啊!

需要在if __name__ == '__main__':
         ...................
         l5 = get_txtname(open_url(url1))
         ...................

账号		自动登录	找回密码
密码			立即注册

求助参数传导！

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块