python-PyPDF2
大家好,又见面了,我是你们的朋友全栈君。
作用:处理PDF文档
提取文本,旋转页面,叠加页面
1.pdfFileObj = open(‘meetingminutes.pdf’,’rb’)#打开pdf文档
2.pdfReader = PyPDF2.PdfFileReader(pdfFileObj)#获取pdf文档数据
3.pdfReader.numPages#获取页数
4.pageObj = pdfReader.getPage(0)#获取指定页码的内容,从0开始
5.pageObj.extractText()#返回该页文本的字符串 注:难以做到全部提取
6.pageObj.rotateClockwise(90)#旋转页面。只能旋转90*x度
7.pageObj.mergePage(pdfReader.getPage(1))#将两页重叠
解密
1.pdfReader.isEncrypted#判断文档是否加密
2.pdfReader.decrypt(‘rosebud’)#对加密的文档进行解密
加密
1.pdfwriter = PyPDF2.PdfFileWriter()#新建PdfFileWriter对象
pdfwriter.encrypt(‘sdsd’)#加密
新建
1.无法世界添加内容,只能从其他pdf文档中拷贝过来加入
eg:
import PyPDF2
pdfFile = open(‘meetingminutes.pdf’,’rb’)#打开一个现有的文档
pdfReader = PyPDF2.PdfFileReader(pdfFile)#获取内容
pdfwriter = PyPDF2.PdfFileWriter()#新建PdfFileWriter对象
for pageNum in range(pdfReader.numPages):#向PdfFileWriter对象中添加内容
pageObj = pdfReader.getPage(pageNum)
pdfwriter.addPage(pageObj)
pdfOutputFile = open(‘newFile.pdf’,’wb’)#新建一个pdf文档
pdfwriter.write(pdfOutputFile)#向文档中写入内容
pdfOutputFile.close()
注:所有的修改操作均无法再原文件上操作,只能将修改结果写入新文件中
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/152397.html原文链接:https://javaforall.cn
相关文章
- python 替换字符串中的元素「建议收藏」
- Python turtle 模块可以编写游戏,是真的吗?
- python里的def 方法中->代表什么意思?
- Python实现教务信息管理系统
- dataframe loc iloc_python的isnull函数
- Python-drf前戏38.3-前端Vue03
- 情人节来了,教你个用 Python 表白的技巧「建议收藏」
- python不同开根号速度对比[通俗易懂]
- python操作ES数据库「建议收藏」
- python海龟作图红绿灯_海龟作图—用Python绘图
- 我用Python分析我过去一年的消费,发现了这些
- Python中的eval()、exec()及其相关函数
- Python 进制转换函数及前缀截取
- 羊了个羊,但是Python简(li)单(pu)版
- java和python哪个值得学-学java好还是Python好?
- 极具参考价值的Python面试题!从创业公司到一线大厂的所有面经汇总
- Python 高阶函数
- python 四大基础数据结构及操作
- python画图函数
- 【Python实践-1】求一元二次方程的两个解[通俗易懂]