|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
如题:我想将一个文件夹里的txt文本(数量比较多),全部改为WORD,要怎么实现,另外,我还希望,将这个每个word中字数保存到表格中,表格中需要两个数据,WORD文件名,以及这个WORD中文本的字数。请问这个要怎么实现,有大神可以指点下吗?
本帖最后由 qq1151985918 于 2021-3-10 22:20 编辑
这是我刚刚敲的代码,你可以对照一下,我的不一定对,你的不一定错,自己试试看吧
代码有点问题,你应该看得出来,反斜杠\\\\\\\\\\\\\有很多应该是 双反斜杠,而被论坛屏蔽掉了一些
- import os
- import docx
- import openpyxl
- doc_help = r"""----------------------------------------------------
- 请输入需要读取txt的路径
- 如txt文档路径为 C:\Users\Administrator\Desktop\txt\001.txt
- 请输入 C:\Users\Administrator\Desktop\txt
- ----------------------------------------------------"""
- print(doc_help)
- txtspath = input("请输入路径:")
- files = filter(lambda x:x[-4:].lower() == ".txt",os.listdir(txtspath))
- def savedocx(path,data):
- file = docx.Document()
- file.add_paragraph(data)
- file.save(path)
- if not os.path.exists(txtspath + "\\data\"):
- os.makedirs(txtspath + "\\data\")
- if not os.path.exists(txtspath + "\\txt-docx\"):
- os.makedirs(txtspath + "\\txt-docx\")
-
- xlsxpath = txtspath + "\\data\" + "data.xlsx"
- wb = openpyxl.Workbook()
- ws = wb.active
- ws.column_dimensions['A'].width = 30.0
- ws.append(['文件名','字数'])
- for file in files:
- txtpath = txtspath + "\" + file
- docxpath = txtspath + "\\txt-docx\" + file[:-4] + ".docx"
-
- data = open(txtpath).read()
- savedocx(docxpath,data)
- ws.append([file,str(len(data))])
- wb.save(xlsxpath)
- print("OK")
复制代码
|
|