qq4625817 发表于 2020-12-4 00:03:48

用docx库保存爬取的数据换行符变成空格

如题,我在代码中print出来的有\r\n\t\u3000的符号,但是我保存成docx文件时不会识别这些符号就像这样:

国家公务员考试2021年时事政治:国考国际时政(11月27日)由国家公务员考试网时事政治栏目由提供,更多关于国际时政,国家公务员考试时事政治的内容,请关注国家公务员考试网/广东公务员考试网!         1、世卫组织:全球累计新冠确诊病例超6000万例          世界卫生组织26日公布的最新数据显示,全球累计新冠确诊病例超过6000万例,达到60074174例。       2、日本防卫研究所涉华报告不客观不负责不专业         国防部新闻发言人任国强26日在国防部例行记者会上表示,日本防卫研究所涉华报告不客观不负责不专业。

如果换行符起作用的话应该是这样的:

          国家公务员考试2021年时事政治:国考国际时政(11月27日)由国家公务员考试网时事政治栏目由提供,更多关于国际时政,国家公务员考试时事政治的内容,请关注国家公务员考试网/广东公务员考试网!
          1、世卫组织:全球累计新冠确诊病例超6000万例
          世界卫生组织26日公布的最新数据显示,全球累计新冠确诊病例超过6000万例,达到60074174例。
          2、日本防卫研究所涉华报告不客观不负责不专业
          国防部新闻发言人任国强26日在国防部例行记者会上表示,日本防卫研究所涉华报告不客观不负责不专业。

笨鸟学飞 发表于 2020-12-4 00:35:55

写入之前把'\n'替换成'^l'试试看
word里面的换行符是shift+6,line的首字母(小写)

qq4625817 发表于 2020-12-4 22:38:32

笨鸟学飞 发表于 2020-12-4 00:35
写入之前把'\n'替换成'^l'试试看
word里面的换行符是shift+6,line的首字母(小写)

替换\n成^l 后word文件里直接变成了这样{:10_243:}:
^p          国家公务员考试2021年时事政治:国考国际时政(11月27日)由国家公务员考试网时事政治栏目由提供,更多关于国际时政,国家公务员考试时事政治的内容,请关注国家公务员考试网/广东公务员考试网! ^p          1、世卫组织:全球累计新冠确诊病例超6000万例 ^p          世界卫生组织26日公布的最新数据显示,全球累计新冠确诊病例超过6000万例,达到60074174例。 ^p          2、日本防卫研究所涉华报告不客观不负责不专业 ^p          国防部新闻发言人任国强26日在国防部例行记者会上表示,日本防卫研究所涉华报告不客观不负责不专业。 ^p          3、以色列为“美打击伊朗”做准备:如遭美国打击,伊朗可能对以进行报复 ^p          《纽约时报》此前报道

qq4625817 发表于 2020-12-4 22:40:27

qq4625817 发表于 2020-12-4 22:38
替换\n成^l 后word文件里直接变成了这样:
^p          国家公务员考试2021年时事政治:国考国际时 ...

这个是^p的,^l也试过,同上

qq4625817 发表于 2020-12-4 23:14:07

笨鸟学飞 发表于 2020-12-4 00:35
写入之前把'\n'替换成'^l'试试看
word里面的换行符是shift+6,line的首字母(小写)

突然发现直接print出来pycharm已经排好了格式,我直接复制进文档了,,,
页: [1]
查看完整版本: 用docx库保存爬取的数据换行符变成空格