Python如何将Word转换为PDF

在本篇文章中，我们将介绍如何使用Python将Word文档转换为PDF文件。通过以下几个方面的阐述，你将了解到完整的代码示例和详细的解释。

一、安装所需库

1、首先，我们需要安装python-docx库来读取和处理Word文档。可以使用以下命令在命令行中安装：

pip install python-docx

2、接下来，我们需要安装pdfkit库来将HTML文件转换为PDF。可以使用以下命令安装：

pip install pdfkit

3、最后，你需要在系统上安装wkhtmltopdf工具。根据你的操作系统不同，安装方式会有所不同。你可以从各个官方网站下载适用于你的系统的安装包，并按照说明进行安装。

二、读取Word文档

1、首先，导入python-docx库：

import docx

2、接下来，使用以下代码加载Word文档：

doc = docx.Document('input.docx')

请确保将`input.docx`替换为你的实际文件路径。

三、将Word文档转换为HTML

1、将Word文档的内容提取为HTML字符串：

html = ""
for para in doc.paragraphs:
    html += "<p>" + para.text + "</p>"

2、将提取的HTML字符串保存为HTML文件：

with open('output.html', 'w', encoding='utf-8') as file:
    file.write(html)

四、将HTML文件转换为PDF

1、首先，导入pdfkit库：

import pdfkit

2、使用以下代码将HTML文件转换为PDF：

pdfkit.from_file('output.html', 'output.pdf')

请确保将`output.html`和`output.pdf`替换为你的实际文件路径。

五、完整代码示例

import docx
import pdfkit

# 读取Word文档
doc = docx.Document('input.docx')

# 将Word文档转换为HTML
html = ""
for para in doc.paragraphs:
    html += "<p>" + para.text + "</p>"

with open('output.html', 'w', encoding='utf-8') as file:
    file.write(html)

# 将HTML文件转换为PDF
pdfkit.from_file('output.html', 'output.pdf')

以上是使用Python将Word文档转换为PDF的完整代码示例。通过这些代码，你可以轻松地实现Word转PDF的功能。