❖ 利用命令行工具pdfimages来提取PDF中的图片
pdfimages
是一个非常简便好用的PDF图片提取工具,很简单的一个命令就可以提取出PDF指定页面里的所有图片。但是,
注意:
pdfimages
只能提取
PDF中的图片,和imagemagick
的生成
图片有本质上的不同!也就是说,如果PDF中的内容不是图片的话,那么就提取不出来。
安装:
pdfimage
是poppler-utils
工具的一个子集,所以需要安装poppler-utils
或poppler
才能使用。Mac上,直接homebrew:
$ brew install poppler
安装好后就可以用pdfimages
命令了,用法如下:
# 提取出来的图片保存为默认的. ppm格式文件 (图片文件巨大,会比pdf文件大23倍左右) $ pdfimages sample.pdf img_name # 设定提取的图片保存为png格式 (图片大小是3倍左右) $ pdfimages -png sample.pdf img_name # 提取某一页的图片 (last one page) $ pdfimages -l 3 sample.pdf img_name # 提取前几页的图片(first number of pages) $ pdfimages -f 2 sample.pdf img_name
提取的图片,会按照指定的位置和名字生成如img_name-000.jpg, img_name-001.jpg, img_name-002.jpg
这样的文件,每一个图片都对应着PDF中原始的图片。
如果没有图片,则不输出。
原文地址:https://www.jianshu.com/p/37e8c96ab33a
相关推荐
-
【Python开发微信助手】03 项目优化&短视频下载功能 python基础
2020-6-17
-
Python3.6 Dtrace实战 python基础
2019-2-22
-
带着问题学习分布式系统之数据分片 python基础
2019-5-15
-
Python 工匠:善用变量来改善代码质量 python基础
2018-12-5
-
CNN之yolo目标检测算法笔记 python基础
2019-10-7
-
给Python学习者的文件读写指南(含基础与进阶,建议收藏) python基础
2018-10-30
-
基于python的性能测试工具Locust学习 python基础
2019-8-29
-
IPython notebook 安装与使用 python基础
2020-5-31
-
Mac系统安装Tomcat服务器 python基础
2019-6-27
-
函数调用的参数规则与解包 python基础
2018-3-4