ssqchina 发表于 2023-7-17 14:59:30

网页保存为PDF用哪个模块好?希望代码少而精

网页保存为PDF用哪个模块好?希望代码少而精,谢谢

陶远航 发表于 2023-7-17 14:59:50

你可以使用Python中的pdfkit模块来将网页保存为PDF文件。pdfkit是一个基于wkhtmltopdf的简单而强大的HTML转PDF工具。下面是一个使用pdfkit的示例:

首先,确保你已经安装了pdfkit和wkhtmltopdf。你可以使用以下命令进行安装:

pip install pdfkit


然后,使用以下代码将网页保存为PDF文件:

import pdfkit

def save_webpage_as_pdf(url, output_path):
    try:
      pdfkit.from_url(url, output_path)
      print("网页已保存为PDF文件!")
    except Exception as e:
      print("保存PDF时出错:", str(e))

# 示例用法
url = "https://www.example.com"# 修改为你想保存为PDF的网页URL
output_path = "output.pdf"# 修改为你想保存的PDF文件路径
save_webpage_as_pdf(url, output_path)


在上述代码中,from_url函数接受一个URL参数和一个输出路径参数,并将指定的网页保存为PDF文件。你只需要将url变量修改为你想保存为PDF的网页的URL,将output_path变量修改为你想保存的PDF文件的路径。

请注意,你还需要安装wkhtmltopdf工具。你可以在https://wkhtmltopdf.org/downloads.html 下载适合你操作系统的安装包,并确保将其路径添加到系统环境变量中。

希望这能满足你的需求!

isdkz 发表于 2023-7-17 15:14:16

在Python中,你可以使用 pdfkit 和 wkhtmltopdf 两个库来实现将网页保存为PDF。以下是一个基本的使用方式:

首先你需要安装这两个库,可以使用pip命令进行安装:

pip install pdfkit


然后你需要下载并安装 wkhtmltopdf 。因为 pdfkit 是 wkhtmltopdf 的包装库,需要它来转换网页为PDF。你可以从这个网址进行下载安装:https://wkhtmltopdf.org/downloads.html。注意安装完毕后,需要将 wkhtmltopdf 的路径添加到环境变量中。

安装完毕后,你可以使用下面的代码将网页保存为PDF:

import pdfkit

# URL
url = 'http://google.com'

# 将网页保存为PDF
pdfkit.from_url(url, 'out.pdf')


这个代码将把网页保存为名为'out.pdf'的PDF文件。同样地, pdfkit 也可以从文件和字符串生成PDF。

另外, pdfkit 提供了许多选项来调整PDF的输出,例如:页面大小,方向,编码,等等。你可以在这里查看全部的选项:https://wkhtmltopdf.org/usage/wkhtmltopdf.txt。

例如,如果你想要输出A4纸大小的PDF,你可以这样做:

options = {
    'page-size': 'A4',
}

pdfkit.from_url(url, 'out.pdf', options=options)


这将会生成一个A4纸大小的PDF。

wuliangtdi 发表于 2023-7-17 16:13:08

本帖最后由 wuliangtdi 于 2023-7-17 16:17 编辑

右键,另存为pdf不就好了

https://i4.mjj.rip/2023/07/17/3dbb62a847ceac9a988fde64c634190a.png
页: [1]
查看完整版本: 网页保存为PDF用哪个模块好?希望代码少而精