将办公室文件转为PDF
我已经看到了几个有关此的线程,但是在我的搜索中并没有得到很直接的答案.我有一个Web应用程序,需要使用DOC,DOCX,XLS,XLSX文件并将其转换为PDF.现在,我们有一个使用Microsoft.office.interop.word库的过程,该库将打开文档,将其打印到PS文件,然后GPL GhostScript将PS文件转换为PDF. 这个过程可以正常运行,但是总体上有几个步骤,这最初是在几年前开发的,当时很难找到PDF打印驱动程序并接口它.本着更新的精神,我正在尝试寻找一种更好的方法来处理此问题.主要原因是,在我们的应用程序中,我们使用Web服务调用来执行转换过程的提升操作,较新的Windows Server,尤其是用于开发Window 7的窗口,即使在模仿中打开文件的功能也导致了某些问题与Interop库. 所有这些都可以弄清楚并淘汰,但是我想知道是否有一种更新,更好的方法可以解决这个问题.我已经研究了PDF995,但是没有找到一种很好地通过编程方式进入并直接将文件
0 2024-01-03
编程技术问答社区
为Xamarin.Forms UWP项目将XAML转换为PDF并分页
直到最近,我一直坚持如何实现"导出" A stacklayout 在项目中的PDF中"导出"报告的目标. - 背景故事 - 以前,我曾试图继续使用已放置的(在项目中) pdfsharp 软件包,以将XAML中显示的数据转换为客户端的PDF.长话短说,我无法获得 pdfsharp 去做我需要做的事情,然后变成 syncfusion .他们似乎具有我需要实现这一目标的功能.基于他们的代码样本,我能够接近我的目标,但不是完全.他们有捕获部分,并且分页部分没有,但没有两者的组合.我本质上需要为 captureasync()保存以制作整个报告的PDF. 解决方案 - 如何解决? - 进行了一些挖掘后,我遇到了一个答案文章(我永远感激)并使用它锻造解决方案. 这是我的XAML内容页面的示例:
4 2023-12-17
编程技术问答社区
将PDF转换为Excel,将每个PDF页放在不同的工作表中
我试图将PDF文件(带有16页)转换为Excel文件,以便运行我在Excel中已经有了我已经有的程序.我有一个将PDF转换为Excel的代码,但是我希望宏将PDF文件的每个单独页面放在我的Excel文件中的其他工作表中(当前它复制了PDF的所有页面和粘贴页面1进入工作表). 所有页面都有相同的标题,如果有帮助.我当前的代码在下面包括,谢谢. Private Sub CommandButton1_Click() 'Declare Variable(s) Dim appAA As Acrobat.CAcroApp, docPDF As Acrobat.CAcroPDDoc Dim strFileName As String, intNOP As Integer, arrI As Variant Dim intC As Integer, intR As Integer, intBeg As Integer, intEnd As Integer 'Initialize Varia
2 2023-11-16
编程技术问答社区
扫描仪扫描文件的最佳设置(TIFF和PDF)
为了扫描文档(白色和黑色文本)并将其用于OCR转换(最佳结果),哪些标准设置和PDF和TIFF格式的规范是什么? 是什么? 解决方案 对于OCR,最佳扫描设置为: 常规文本的300 dpi分辨率,特别小字体(精美印刷)的400 dpi分辨率 黑白文字,小字体的灰度,图片的颜色 tiff格式. Group4用于黑白(非常小的文件大小).如果需要颜色,请使用未压缩的(非常大的文件大小). 某些OCR技术可能具有特殊的偏好,这可能会有所帮助,但通常是次要的. 其他解决方案 出于OCR的目的,我会在300dpi,b/w或灰度的情况下扫描文档,以及未压缩的TIFF或PNG格式. 其他解决方案 300DPI对于"完美"输入是最佳的,如果您正在使用不完美的输入(例如,从打字机或点矩阵打印机中使用),那么高分辨率实际上将丢弃Tesseract.在这种情况下,最好使用较低的分辨率隐藏缺陷.例如.使用点矩阵打印机,我在150dpi的结果中获得了比300dpi的结果明
18 2023-10-21
编程技术问答社区
如何从1992年开始修改这个从纯文本到PDF转换的PostScript,以便真正指定页面大小?
我正在尝试将明文文档转换为PDF.唯一接近实际工作的方法是安装" ghostscript",然后使用以下PostScript脚本,由se用户@redgrittybrick(谢谢)挖出,该脚本(感谢),该脚本(感谢)(在脚本下方)并产生PDF从中. 它在技术上有效,但是在视觉上以视觉上的顶部和左边的边缘弄乱了每页的顶部和左边缘,以使顶部边距变为"太多",左边的边距有点"太多了"(与右边相比利润).至少在 sumatrapdf 中查看时,这是我唯一的PDF查看器. 脚本状态: /topmargin 1 inch def /leftmargin 1 inch def 但是,它 在视觉上看起来 最高边距可能是 4 英寸,而不是1英寸在文件中说.如果将其修改为0,则最终的PDF 视觉上 似乎具有1英寸的顶部边距.另一方面,如果我将左侧的左侧修改为0英寸,则一直延伸到左边框. 视觉上看起来正确的方式 me ,顶部/右/底部/左侧的余量是: /topmargin 0
4 2023-10-18
编程技术问答社区
SWFTools的分段故障
我使用swftools pdf2swf将PDF转换为SWF时会遇到分割故障(核心倾倒)错误.有没有人遇到这个问题或知道可能是什么问题. 我在错误之前收到的通知是: NOTICE File contains jpeg pictures NOTICE file contains soft masks NOTICE file contains forms NOTICE file contains transparency groups Segmentation fault (core dumped) 这可能无法帮助我,但值得一试. 解决方案 并尝试使用" -o 1"标志运行PDF2SWF. 其他解决方案 使用GDB并将其附加到核心转储,看看发生了什么... 其他解决方案 检查DMESG,您可能会看到类似的内容: pdf2swf[23607]: segfault at 0 ip 00f88400 sp bf8af690 error 4 in libj
0 2023-08-25
编程技术问答社区
如何用python提取文件夹中的pdf文本并保存在数据框中?
我有很多文件夹,每个文件夹都有几个PDF文件(其他文件类型,例如.xlsx或.doc也在那里).我的目标是为每个文件夹提取PDF的文本,并创建一个数据框架,其中每个记录是"文件夹名称",每列以字符串表单中的每个文件夹中每个PDF文件的文本内容表示. . 我设法从一个PDF文件中提取文本,其中tika package(下面代码).但是无法在文件夹或其他文件夹中的其他PDF上迭代循环,以构建结构化的数据帧. 在 # import parser object from tike from tika import parser # opening pdf file parsed_pdf = parser.from_file("ducument_1.pdf") # saving content of pdf # you can also bring text only, by parsed_pdf['text'] # parsed_pdf['content
16 2023-07-10
编程技术问答社区
使用PdfBox将Pdf转换为图像
使用pdfbox将PDF(填充)转换为JPEG时.复选框中的刻度转换为框字符 warn [org.apache.pdfbox.rendering.type1glyph2d]无代码的字形52 (A20)在字体zapfdingbats 中 公共静态void main(string [] args)抛出异常{ try (final PDDocument document = PDDocument.load(new File("C:\\Users\\priyadarshini.s\\Downloads\\ADWE3244_Merge(1).pdf"))){ ClassLoader classloader = Thread.currentThread().getContextClassLoader(); InputStream is = classloader.getResourceAsStream("zapfdingbats.ttf");
8 2023-06-30
编程技术问答社区
将线性文件转为PDF文件,并断开许多页
我尝试掩盖线性到PDF文档.我想让它打破许多页面. try { android.graphics.pdf.PdfDocument document = new android.graphics.pdf.PdfDocument(); android.graphics.pdf.PdfDocument.PageInfo pageInfo = new android.graphics.pdf.PdfDocument.PageInfo.Builder(linear2.getWidth(), linear2.getHeight(), 1).create(); android.graphics.pdf.PdfDocument.Page page = document.startPage(pageInfo); Canvas canvas = page.getCanvas(); Paint paint = new Paint(); canvas.drawPaint(paint); li
30 2023-06-30
编程技术问答社区
用javascript将PDF转换为DOM
我已经去过很长时间了,我所能发现的只是这个 pdf2dom Parser并且可能是 this 的反向工程版本.无论如何,这是我的问题.对于任何渲染引擎,其输入都应是数据流(在我的情况下为PDF内容),其输出应为选择的格式(在我的情况下,DOM,HTML&CSS). 但是,我不是从服务器中获取" PDF数据"(我不知道的东西)并将存储在JavaScript变量中并使用JavaScript而不是使用Java或C ++,而是可以获取" PDF数据"的流(这是我不知道的东西)将其渲染并将其附加到DOM? 如何出现原始的" PDF数据"(是否有任何特定格式..等)? 欢迎所有输入. 注意:应该兼容. 解决方案 已经完成了.结果是 pdf.js .请注意,它通过将PDF渲染到画布上来工作.结果可以保证. PDF的某些功能当前是不可能的. 其他解决方案 PDF通常是Postscript +嵌入闪存,JavaScript和其他各种其他内容的子集的子集. 将P
34 2023-06-30
编程技术问答社区
关于用Node JS将pdf转换成图片的问题
该计划是创建一个PDF文件(仅由单个页面组成),然后用户选择是否以PDF或图像下载.我已经编写了用于生成PDF的代码,到目前为止,它运行良好.现在的问题是如何将其转换为图像.是否可以转换文件而不安装诸如ghostscript等的内容? 我是一个完整的菜鸟,非常感谢建议. (建议使用哪些库也有帮助) 用于生成PDF 的代码 import PDFDocument from "pdfkit"; static async medicalPrescription(req, res) { // Some code for generating the PDF contents... filename = encodeURIComponent(filename) + '.pdf' res.setHeader('Content-disposition', 'attachment; filename="' + filename + '"') r
20 2023-06-26
编程技术问答社区
如何使用pdf。js公司
我正在考虑使用 pdf.js (一种允许嵌入PDF的开源工具在网页中).没有关于如何使用它的任何文件. 我假设我要做的是制作一个HTML页面,并在标题中引用的脚本,然后在身体中,我将某种功能调用带有文件名和位置的数组.谁能在这里帮我吗? 解决方案 尝试Google'ing pdf.js documentation /* create the PDF document */ var doc = new pdf(); doc.text(20, 20, 'hello, I am PDF.'); doc.text(20, 30, 'i was created in the browser using javascript.'); doc.text(20, 40, 'i can also be created from node.js'); /* Optional - set properties on the document */ doc.setProperties({
16 2023-05-22
编程技术问答社区
在一个复杂的网络应用程序上出现转换输入异常
当我在特定转换器上调用execute()或schedule()方法时,我已经得到了这个ConversionInputException. 我认为代码是正确的,因为如果我将代码作为一个简单的Java应用程序执行,则它与输入相同的文件完美奏效. 当我将代码部署为JAR并从复杂的Web应用程序调用代码时,我总是拥有此ConversionInputException. 我还尝试了文件对象的InputStream,但我也有同样的例外. 我能够使用MS-WORD打开文件,没有任何问题,我也可以在运行相同代码的独立Java应用程序中转换它. 这是我使用的代码 private void convert(File inputFile, File outputFile) { boolean conversion=false; IConverter converter=com.b80.common.d2.wf.utility.CustomConverte
6 2023-05-22
编程技术问答社区
文件结束前-XWPFD文档转PDF转换器
我没有将文档的内容附加到CTBody类,而是将所有数据从Word文档传输到使用XWPFDocument类,但 我遇到了以下错误.当我将其转换为pdf 时,该错误指向XWPFDocument Doc fr.opensagres.poi.xwpf.converter.core.core.xwpfconverterexception:org.apache.xmlbeans.xmlexception:error:错误:文件的早期末端. FileInputStream fis = new FileInputStream("1.docx"); FileInputStream fis1 = new FileInputStream("2.docx"); XWPFDocument xdoc = new XWPFDocument(OPCPackage.open(fis)); XWPFDocument xdoc1 = new X
6 2023-05-22
编程技术问答社区
java excel到pdf的转换
我需要将 xlsx 文档转换为 pdf 格式. 我知道 itext 可以保存pdf文档, docx4j 可以读写xslx. 实际上,我们的应用程序都用于建筑报告. 但是我们有非常困难的模板,所以我不能只阅读XSLX(DOCX4J),然后将其写入PDF(ITEXT).格式将丢失,所以我需要另一个转换lib. 我还听说过商业图书馆,例如(想要使用开源解决方案. 任何人可以帮我吗? 解决方案 是否必须在Java中完成? 如果是,也许请看 apache poi 否则,为什么不使用使用PDF打印机的小型本机应用程序,并致电相关的API直接将文件打印到PDF?当然,Java并不是为了做这类工作而真正制作的... 例如,这是一个非Java框架:其他解决方案 我使用了Itext和Apache Poi: FileInputStream filecontent = new FileInputStream(new File(sourcepath)); File
10 2023-05-22
编程技术问答社区
如何用ghostscript来模拟pdf设备的叠印效果
我正在将PDF转换为其他格式,我想让最终输出pdf/jpg/png等具有与选择Adobe Acrobat读取器中的模拟过度打印选项时相同的效果. 我在 ghostscript-不显示具有覆盖的对象 设备pdfwrite与选项不起作用-dsimulateOverPrint = true. 编辑2 可以找到示例输入文件在这里 输入PDF文件具有图层,我正在尝试将其转换为可以看到基础层的客户端的PDF,而无需单击Adobe PDF Pro应用程序的工具菜单中的SimLuateOverPrint选项. 试图获得帮助的新手. 解决方案 从根本上说,正如我在您之前发布的问题上所说的那样,您不能.有两个原因; 首先(前面渲染设备)夸张仅针对CMYK空间定义,因此获得过多的输出的唯一方法是使用CMYK设备.您可以通过设置-dsimulateOverprint(在不在情况下为默认值)来模拟 spot Colors 的效果.您不能在任何不是CMYK的设备上完全表示
8 2023-05-22
编程技术问答社区
用Itext将Pdf页面转换为字节数组
我的问题 我正在寻找一种将单个pdf页面转换为字节[]的方法(如每个pdf页面一个字节[],这样我就可以将它们施加到bufferedimage []. > 以这种方式,所有转换都是在内存中完成的,而不是制作临时文件,使其更快又不混乱.我可能会在以后使用字节阵列进行服务调用.如果我只能将图书馆使用才能使用,那就太好了,但是,如果没有其他方式,我对其他库开放. 我现在拥有的 这是我当前拥有的代码 public static BufferedImage toBufferedImage(byte[] input) throws IOException { InputStream in = new ByteArrayInputStream(input); BufferedImage bimg = ImageIO.read(in); return bimg; } public static BufferedImage[] extract(fin
128 2023-05-22
编程技术问答社区
PDF压缩库/工具
我正在研究一个项目,以减少PDF的大小,并压缩它们.我想知道市场上有任何好的工具/图书馆(.net)真的很好. 我确实尝试了一些工具,例如On -Stream压缩,但结果并不令人满意. 解决方案 可以轻松地从PDF中挤出一些其他(mega-)字节.例如,众所周知的" pdf32000_2008.pdf" 已经进行了足够的优化?文件大小为8,995,189字节.它使用对象和Xref流,(几乎)没有图像,所有图像都被包装紧.还是不是? 查看页面字典: Dict:9 [1 0 R] . /Annots Array:3 . /Contents Stream:3 [2 0 R] . /CropBox Array:4 . /MediaBox Array:4 . /Parent Dict:4 [124248 0 R] . /Resources Dict:4 . /Rotate 0 (Number) . /StructParents 2 (Number
24 2023-05-22
编程技术问答社区
用ITextSharp将HTML文件转换为PDF文件
我想完成以下操作: 给定HTML文件的路径名和PDF文件的所需路径名,使用ItextSharp将HTML文件转换为PDF.我看到了很多与此相关的代码样本,但并非完全需要.我相信我的解决方案将需要使用itextsharp.text.html.simpleparser.htmlworker.parsetolist()函数,但是我很难与实际的HTML文件一起使用并输出实际的PDF文件. > public void GeneratePDF(string htmlFileName, string outputPDFFileName) {...} 是我真的想正常工作的功能. 预先感谢 编辑:这是我尝试过的示例: iTextSharp.text.Document doc = new Document(); PdfWriter.GetInstance(doc, new FileStream(Path.GetFullPath("fromHTML.pdf"
18 2023-05-22
编程技术问答社区