核心功能 - 把PDF转图片

这个小型自动化脚本可以方便地获取整个 PDF 页面并将它们转换为图像。该脚本使用流行的 PyMuPDF 模块,该模块以其 PDF 文本提取而闻名。

在你的 PDF 项目中使用它

批量 PDF 到图像

实现代码

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30


# PDF to Images


# pip install PyMuPDF


import fitz


def pdf_to_images(pdf_file):


    doc = fitz.open(pdf_file)


    for p in doc:


        pix = p.get_pixmap()


        output = f"page{p.number}.png"


        pix.writePNG(output)


pdf_to_images("test.pdf")