在PDF文件中使用JavaScript代码的文档
在PDF内运行JavaScript代码上,我在哪里可以找到文档? 我从未在PDF文档中添加JavaScript操作.但是,我使用JavaScript进行了很多Web开发.我对PDF文档中对JavaScript有任何熟悉的人有一些问题. NitroPDF和Adobe Acrobat绝对支持PDF文件中的JavaScript. 是否存在各种对象的标准,可以通过JavaScript操纵PDF文件?我到目前为止发现的所有内容都来自Adobe.其他任何地方似乎都引用了Adobe的文档.是否有标准,还是Adobe只是"事实上"标准? 另外,所有PDF观众都支持JavaScript动作吗? 我可以找到的关于在PDF文档中使用JavaScript的最佳文档是来自Adobe - adobe :: acrobat javascript脚本指南. NitroPDF具有此链接 - nitropdf :: Javascript :: Javascript in Pdf Files ,
14 2024-01-09
编程技术问答社区
Python PyPDF2加入页面
我有一个pdf,上面有一个大表格,所以我需要将每页表加入大页面中的大桌子. PYPDF2或其他库可以吗? 欢呼 解决方案 仅处理类似的事情,它需要输入PDF,并且通过配置文件可以设置单页的最终模式. 用 pypdf2 实施,但它仍然存在一些PDF-Files的问题(必须深入研究更深入地进行挖掘). https://github.com/lageos/pdf-stitcher 原则上,将页面添加到另一个页面,例如: import PyPDF2 with open('input.pdf', 'rb') as input_file: # load input pdf input_pdf = PyPDF2.PdfFileReader(input_file) # start new PyPDF2 PageObject output_pdf = input_pdf.getPage(page_number) # get se
16 2023-07-08
编程技术问答社区
用pypdf2改变pdf文件的元数据
我想在PDF文件的元数据中添加元数据键值对. 我找到了几年的答案,但我认为这是复杂的.我猜今天有一种更简单的方法: https://stackoverflow.com/a/3257340/633961 我没有与pypdf2结婚,如果有一种更简单的方法,那我就这样走了吗? 解决方案 您可以使用 pdfrw pip install pdfrw 然后运行 from pdfrw import PdfReader, PdfWriter trailer = PdfReader("myfile.pdf") trailer.Info.WhoAmI = "Tarun Lalwani" PdfWriter("edited.pdf", trailer=trailer).write() ,然后检查PDF自定义属性 其他解决方案 我很惊讶地看到没有 pypdf2 当问题明确要求pypdf2时,这里是: from PyPDF2 import P
40 2023-06-23
编程技术问答社区
用PDFMiner解析一个没有/Root对象的PDF
我正在尝试使用PDFMiner Python绑定从大量PDF中提取文本.我为许多PDF编写的模块,但是我在PDF的子集中遇到了一个神秘的错误: ipython堆栈跟踪: /usr/lib/python2.7/dist-packages/pdfminer/pdfparser.pyc in set_parser(self, parser) 331 break 332 else: --> 333 raise PDFSyntaxError('No /Root object! - Is this really a PDF?') 334 if self.catalog.get('Type') is not LITERAL_CATALOG: 335 if STRICT: PDFSyntaxError: No /Root object! - Is
198 2023-06-19
编程技术问答社区
用PHP或PHPMailer发送填充的PDF邮件
我的公司目前正在尝试简化我们提交表格的流程.我读到,我们正在尝试使用php或phpmailer可以做的事情,但我似乎遇到了障碍. 我们要做的是在浏览器中打开一个可填充的PDF,完成它,然后单击底部的按钮将其通过电子邮件发送给指定的收件人. 我目前有一个PHP脚本,该脚本允许我使用phpmailer和我们的服务器电子邮件服务给空白文档发送电子邮件. 我尝试使用phpmailer的" AddStringAttachment"功能: IsSMTP(); // telling the class to use SMTP $mail->Host = "xxx.xxx.org"; // SMTP server $mail->From = "xxx@xxx.org"; $mai
56 2023-06-06
编程技术问答社区
计算pdf中(Td, TD, Tm, cm, T*)内容流的确切位置?
获取或计算PDF中的(TD,TD,TM,CM,T*)的确切位置? 作为人类,我能够计算(无论是替换最后一个TD还是添加到最后一个TD或用字体添加到Fontsize))通过比较PDF内容流中标签的位置,该位置位于PDF和Content Stream位置的位置,值.但是我无法按编程来计算字形的完美位置.请参阅屏幕短. 在上图中,左侧框是PDF UI字形,右侧框包含相关的内容流.在内容流中,我突出了两个TD位置. 在第一个圈子中 3.321 -6.47599832 TD TD位置应添加到最后的TD位置.假设X1,Y1. current_x_pos = x1+3.321 curent_y_pos = y1-6.475999832 然后我们可以获得字形" T"的确切位置. 在第二个突出显示的圆圈中,新的TD位置(231.544 366.377990 TD)被完全替换为 current_x_pos = 231.544 curent_y
24 2023-05-22
编程技术问答社区
操纵PDF文件
我想将PDF文件读为文本(Postscript),在文件结构中添加新对象,然后将最终输出保存为新的PDF,但是如果我刚刚复制了PDF PostScript内容并将其粘贴到新创建的pdf文件(其中encoding='ansi'),该文件不起作用. 我确定这可能是编码问题,但是我不确定在操纵原始PostScript内容后,我应该做什么才能拥有有效的PDF文件格式. 这是与我无用的代码: pdf_file = open('Input.pdf', 'r', encoding='ansi').read() pdf_file_bytes = bytearray(pdf_file, 'ansi') pdf_file = open('Output_bytes.pdf', 'wb').write(pdf_file_bytes) 正如我所说,输出PDF无效! 解决方案 第一个问题; PDF文件的内容是PDF,而不是PostScript. 其次,pdf是一个二进制文件遗迹,
46 2023-05-22
编程技术问答社区
PDF文件的操作
我有几个具有以下属性的PDF: 每个pdf包含一个不同的"文档"数量,其中有不同的页面. "文档"中的每个页面都有文本,例如"第3页". 我希望能够自动识别PDF中每个"文档"的第一页和最后一页(注意:这与PDF的第一页和最后一页不同,因为每个PDF可能包含几个"文档" )并将其提取到新的PDF中,以供以后打印和档案. 我不确定在此问题上可以使用哪些工具以及可以解决哪些库来解决此问题. 有什么建议吗?最好是免费的,可用于创建将在Windows上运行的工具. 解决方案 Java有一个不错的免费PDF库.查看 itext . 来自Itext网站: 您可以使用Itext到: 将PDF运送到浏览器 从XML文件或数据库生成动态文档 使用PDF的许多交互功能 添加书签,页码,水印等 拆分,串联和操纵PDF页面 自动填充PDF表格 将数字签名添加到PDF文件 等等... 由于是Java,因此Windows或其他任何地方都不应
20 2023-05-22
编程技术问答社区
如何将多个pdf串联成一个,每个输入的pdf从偶数页开始?
我有一个文档,每个文档都有一个不可预测的页面. 说: a.pdf(1页:A1) b.pdf(3页:b1,b2,b3) c.pdf(4页:C1,C2,C3,C4) 我想将这些输入文件合并为一个.pdf,我将双面打印.输入文件的每个第一页都必须在正面(右)页面. 这意味着预期的结果将为 |A1 --|B1 B2|B3 --|C1 C2|C3 C4| with" - "是空白页. 目前,我正在使用pdftk cat. 似乎通过重大脚本有一个解决方案,使用: # Get number of pages pdftk x.pdf dump_data | grep "NumberOfPages" # If the number of pages is odd, add a blank page to x.pdf # Loop # Cat the whole 我想知道是否有更简单的解决方案? 例如,是否可以在每个文件的开始时添加页面断
26 2023-05-22
编程技术问答社区
用ghostscript将单页分割成两页
我有一个PDF,其中包含示例幻灯片和每页多个幻灯片.如何使用ghostscript将文件分开,以便每页有一个幻灯片? 解决方案 很久以前,我为comp.lang.postscript上的某人编写了一些代码来执行此操作,这同样是用于PowerPoint幻灯片.该后录代码假定所有"子页面"(即幻灯片)在PDF页面上的大小和位置相同,并且所有PDF页面的大小都是相同的.将以下内容保存为称为pdf_slice.ps的文件,并按照注释中所述的使用. %!PS % Copyright (C) 2011 Artifex Software, Inc. All rights reserved. % % This software is provided AS-IS with no warranty, either express or % implied. % % This software is distributed under license and may not be cop
26 2023-05-22
编程技术问答社区
如何从命令行将PDF转换为灰度,避免被栅格化?
我正在尝试转换为灰度这个pdf: U/10351891/page-27.pdf 带有PDFWRITE设备的Ghostscript(V 9.10)失败,"无法将颜色空间转换为灰色,将策略转换为LeaveCoLornargeNANG,".消息. 我能够通过中介PS文件(使用GS,PDFTOPS(V 0.24.3)或PDF2PS)进行转换,但是此转换将整个PDF栅格化. 我尝试了很多其他事情:使用QPDF(V 5.0.1)或PDFTK(v 1.44)将PDF归一化,将其转换为SVG文件,然后通过Inkscape(V 0.48.4)返回到PDF ...上班. 我发现的唯一一种解决方案(在生产环境中不适合我)是在我的Mac上使用预览,并手动或使用Automator脚本应用石英灰色调滤波器. 有人找到另一种工作方式吗? 还是可以将PDF归一化或解决问题以防止鬼影消息"无法转换颜色空间..."或以另一种方式强制颜色空间? 谢谢! 解决方案 gs \ -sDE
64 2023-05-22
编程技术问答社区
将多个PDF合并成一个PDF
我的代码有一些问题.我正在尝试通过包含许多PDF的驱动文件夹循环,然后将其合并到一个文件中.当我使用代码时,它只是为驱动器文件夹中的最后一个PDF创建PDF,而不是按预期将它们合并在一起. function MergeFiles(){ var folder = DocsList.getFolderById('myFolderID'); var files = folder.getFiles(); var blobs = []; for( var i in files ) blobs.push(files[i].getBlob().getBytes()); Logger.log(blobs.push(files[i].getBlob().getBytes())); var myPDF = Utilities.newBlob(blobs.pop(), "application/pdf", "newPDF.pdf"); folder.
48 2023-05-22
编程技术问答社区
在PDF中使用Javascript
在哪里可以找到有关在 PDF 中运行 Javascript 的文档? 我从未在 pdf 中添加过 javascript 操作.但是,我已经使用 javascript 进行了相当多的 Web 开发.对于熟悉 PDF 中的 javascript 的人,我有几个问题. NitroPDF 和 Adob​​e Acrobat 绝对支持 PDF 中的 javascript.是否有关于存在的各种对象以及通过 javascript 处理 pdf 的功能的标准? 到目前为止,我发现的所有内容都来自 Adob​​e.其他任何地方似乎都引用了 Adob​​e 的文档.是否有标准,或者 Adob​​e 只是“事实上的"标准. 另外,是否所有 PDF 查看器都支持 javascript 操作? 我能找到的关于在 pdf 文档中使用 javascript 的最佳文档来自 Adob​​e - Adobe :: Acrobat Javascript 脚本指南 NitroPDF 有这个链接
1300 2022-07-17
编程技术问答社区