嵌入图片为base64,而不是输出到文件夹中
从DOCX转换为HTML时,您可以指定任何图像的输出路径 org.docx4j.Docx4J.toHTML(wordMLPackage, imageDirPath, imageTargetUri, fos2); 和由此产生的HTML文档通过文件参考图像: 相反,我希望转换器将文件嵌入为base64.这可能吗? 解决方案 您不需要自定义ConversionImageHandler来实现这一目标. 您可以简单地将ImagedIrpath设置为空字符串,并且图像将嵌入 org.docx4j.Docx4J.toHTML(wordMLPackage, "", "", fos2); 这是因为org.docx4j.model.images.AbstractConversionIm
0 2024-04-24
编程技术问答社区
Android-docx4j构建问题
我正在开发Android应用程序.在其中,我需要在应用程序中显示DOCX,XLSX文件.我已经在Internet上进行了搜索,发现 docx4j 会将DOCX,XLSX文件转换为HTML(OR)PDF.因此,我打算显示WebView中 docx4j 的HTML返回. 这样我已经从 github 下载了来源.我也对链接​​中给出的Eclipse.ini文件进行了更改. 但是,我无法执行该应用程序.运行应用程序时,我会得到以下例外. [2014-11-24 17:19:34 - AndroidDocxToHtml-master] Conversion to Dalvik format failed with error 1 详细日志: [2014-11-24 17:19:34 - AndroidDocxToHtml-master] Dx warning: Ignoring InnerClasses attribute for an anonymous inner
14 2024-04-04
编程技术问答社区
POI或docx4j能否读取有密码保护的Word文档?
我对POI有一个问题,我想帮助. 我有一个个人日记,我将每天的条目纳入一个单词.doc,每月存储在一个年份文件夹中.我添加一个密码打开每个密码,因此它们都被加密. 我想使用卢克(Lucene)来索引整个集合以允许更好的搜索(例如,"我上次写的是哪一天和一年,我喜欢燕麦片?"). 第一步是使用poi读一个单词.doc,但是我无法离开一角钱,因为它无法读取我的加密文件. 我已经写了这个课: package model; import org.apache.commons.logging.Log; import org.apache.commons.logging.LogFactory; import org.apache.poi.hwpf.HWPFDocument; import org.apache.poi.hwpf.model.DocumentProperties; import org.apache.poi.poifs.crypt.Decryptor;
8 2024-02-29
编程技术问答社区
如何用java在docx中创建具有不同风格的三个TOC?
如何在DOCX文件中创建三个或更多TOC,其中一个是针对标题1、2、3,而其他toc则用于由程序创建的另一种样式?例如,我为表标题创建了一种样式,我想为具有此样式的段落创建一个TOC. 我希望这些TOC不在文件末尾的特殊段落中. apache-poi最好这样做? docx4j? aspose? 我用apache-poi编写我的其他代码. 解决方案 使用aspose.words for Java,您可以使用带有所需开关参数的inserttabletableContents()方法在Word文档中添加TOC字段.您可以根据需要添加尽可能多的TOC字段.以下代码添加了具有不同样式的三个不同的TOC字段. 指定开关的最简单方法是使用insert-> Reference--> index和表菜单插入和配置内容表,然后切换字段代码的显示以查看交换机.您可以在Microsoft Word中按Alt+F9以切换字段代码打开或关闭. 例如,在创建目录之后,将以下字段插入文档
2 2024-02-29
编程技术问答社区
计算用docx4j编辑过的word文件的页数/行数
我在这里找到了一些帖子,如何使用Apache-Poi库来计数页面/行. 但是我的代码现在已经使用了docx4j,完全替代它是太多的工作. 因此,我的问题是,如何从类型WordprocessingMLPackage的对象中获取到类型XWPFDocument的对象,以计算当前文档的行和页面. private XWPFDocument convertDocx4J(WordprocessingMLPackage wp) { XWPFDocument oiDoc = null; //TODO... return oiDoc; } 解决方案 从docx4j的WordProcessingmlpackage到POI的最简单方法是使用Docx4j的API保存为DOCX,然后使用POI加载. 但是您可以从Docx4j获取页面信息;请参阅
8 2024-02-29
编程技术问答社区
替换.docx内的文本模板(Apache POI、Docx4j或其他)。
我想使用正则表达式(Java Regex)中的 MS Word ( .docx )文档进行替换: Example: …, с одной стороны, и %SOME_TEXT% именуемое в дальнейшем «Заказчик», в лице %SOME_TEXT% действующего на основании %SOME_TEXT% с другой стороны, заключили настоящий Договор о нижеследующем: … 我试图获取文本模板(例如%some_text%)使用 apache poi -xwpf 并替换文本,但不能保证替换,因为POI分离 运行 =>我得到这样的东西(System.out.println(run.getText(0))): … , с одной стороны, и % SOME_TEXT % именуемое в дальнейшем «Зак
10 2024-02-29
编程技术问答社区
如何用java将doc,docx文件转换为pdf?
我能够使用DOCX4J从DOCX文件中生成PDF.但是我需要将DOC文件转换为PDF,包括图像和表. 是否有任何方法可以将DOC转换为Java中的DOCX .或(doc to pdf)? 解决方案 docx4j包含or​​g.docx4j.convert.in.doc,它使用poi读取.doc,但这是概念的证明,而不是生产准备代码.最后我检查了一下,POI的HWPF解析二进制.doc. 此外,您可以使用Libreoffice或OpenOffice将DOC转换为DOCX.但是,如果您要使用libreoffice或openoffice,则可以使用它直接将.doc和.docx转换为PDF. Google" JodConverter". 其他解决方案 crib POI单元测试,我想出了这一点以从Word文档中提取文本: public String getText(String document) { try { ZipInputStream i
8 2024-02-29
编程技术问答社区
如何使用docx4j读取word文档并获取其中所有样式的部分内容
我正在使用docx4j处理Word文档格式.我有一个单位文档,该文档在表格数量上分配.我想阅读所有表,如果找到一些关键字,那么我想将这些内容带到其他格式化的Word文档中.我的Word文档如下. 就像从上方一样,我想拿出低于某些标题的内容.在这里,我的关键字是示例文本.因此,每当重复示例文本时,都需要将内容获取到新的Word文档. 我正在使用以下代码. MainDocumentPart mainDocumentPart = null; WordprocessingMLPackage docxFile = WordprocessingMLPackage.load(new File(fileName)); mainDocumentPart = docxFile.getMainDocumentPart(); WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.cre
12 2024-02-29
编程技术问答社区
如何获得Word/Excel文档的页数/张数?
在我的项目中,我有一个要求显示Word文档(.doc,.docx)文件中的页面和Excel文档(.xls,.xlsx)中的表格数量.我试图使用docx4j读取.docx文件,但是性能非常差,但我只需要count nord count而尝试使用apache poi.我遇到了一个错误,类似: "trouble writing output: Too many methods: 94086; max is 65536. By package:" 我想知道是否有Android的任何付费/开源库. 解决方案 无法在MS Word文件中显示精确的页面,因为对于不同的用户而言,它会有所不同.确切的数字取决于打印机设置,纸张设置,字体,可用图像等. 仍然可以为二进制文件执行以下操作: 打开文件使用poifsfilesystem或npoifsfilesystem 仅在构造函数hwpfdocumentcore中提取fileinformation block 在HWPFDo
6 2024-02-29
编程技术问答社区
在java中读取.docx文件
我试图在Java中读取一个文件,以下是代码: public void readFile(String fileName){ try { BufferedReader reader= new BufferedReader(new FileReader(fileName)); String line=null; while((line=reader.readLine()) != null ){ System.out.println(line); } }catch (Exception ex){} } 在TXT文件的情况下,它可以正常工作.但是,如果是DOCX文件,它是在打印怪异的字符.如何在Java中读取.docx文件. 解决方案 import java.io.File; import java.io.FileInputStrea
4 2024-02-29
编程技术问答社区
将扩展名为".dotx "的文件(模板)转换为 "docx"(Word文件)。
如何使用poi apis或docx4j将" .dotx"字模板转换为普通的.docx"? 解决方案 需求将/word/document.xml的内容类型从application/vnd.openxmlformats-officedocument.wordprocessingml.template.main+xml更改为application/vnd.openxmlformats-officedocument.wordprocessingml.document.main+xml. 使用apache poi 4.0.1的示例: import java.io.FileInputStream; import java.io.FileOutputStream; import org.apache.poi.xwpf.usermodel.*; public class WordReadDOTXSaveDOCX { public static void main(String
4 2024-02-29
编程技术问答社区
使用java从Word(Docx)中读取方程式和公式到html并保存数据库
我有一个单词/docx文件,该文件具有图像下方的方程式 我想读取文件Word/docx的数据并保存到我的数据库 在需要时,我可以从数据库中获取数据并在我的HTML页面上显示 我使用apache poi读取数据表格docx文件,但不能接受方程式 请帮我! 解决方案 Word *.docx文件是ZIP包含XML文件的存档,办公室打开XML . Word *.docx文档中包含的公式是. 不幸的是,这种XML格式在Microsoft Office外面并不是很广为人知.因此,它在HTML中不直接使用.但幸运的是它是XML,因此可以使用带有XSLT的数据.因此,我们可以将OMML转换为 Mathml 用例. 通过XSLT的转换过程主要基于XSL转换的定义.不幸的是,创建这样的东西也不是真正容易的.但是幸运的是Microsoft已经完成了,如果安装了当前Microsoft Office,则可以在%ProgramFiles%\中的Microsoft Office程序目录中找到
0 2024-02-29
编程技术问答社区
如何用Java将.docx的一段复制到另一个.docx并保留样式
我正在尝试将.docx中的特定段落复制到另一个空的.docx.我遇到的问题是,来自源的样式,子弹,编号等.docx并未保留在目标.docx中. .我的代码 任何人都可以告诉我,要在上述代码中添加哪些更改? 预先感谢! public class WordFinal { public static void main(String[] args) throws IOException, XmlException { XWPFDocument doc = new XWPFDocument(new FileInputStream("source.docx")); XWPFDocument destDoc =new XWPFDocument(); OutputStream out = new FileOutputStream("Destination.docx"); XWPFParagraph
2 2024-02-29
编程技术问答社区
用于处理docx文档的Apache POI或docx4j
您认为哪种最好用来将DOCX文档读为Java对象,为什么? 换句话说.哪个库支持大多数字样? 解决方案 披露:我领导docx4j项目 尽管DOCX4J也可以处理PPTX和XLSX,但主要用于DOCX操作.用插图,就像在写作时一样,无论您想对DOCX文档做什么,DOCX4J都应该能够为您提供帮助.有一个单页概述 对于许多常见要求,DOCX4J提供了更高级别的API.这些包括: 创建/open/save docx(当然) 报告/文档生成,使用多种方法:(i)变量 替换,(ii)XML数据绑定(特别是强),(iii)mailmerge 导出为HTML,XHTML 导出为PDF(带有字体支持) 对于其他任何事情,您可以操纵DOCX的JAXB表示形式. JAXB是Java社区标准,包括Java 6中,并且在Eclipselink的Moxy中具有强大的替代实现. (POI使用XML Bean代替JAXB) 有一个探索DOCX,并生成Java代
10 2024-02-29
编程技术问答社区
如何修复由PDFBox设置的PDF/A元数据(与Docx4j和XDocReport一起工作)
为了达到可访问性级别PDF/A-1A,我使用PDFBox v2.0.13在PDF上设置XMP元数据.在设置元数据之前,我将文件从.docx转换为PDF.我尝试了两种方法来进行转换:一种使用XdocReport v.2.0.1,另一种使用docx4j v.6.1.0. . 在Java类中,我有以下代码: PDDocumentInformation info = pdf.getDocumentInformation(); info.setTitle("Apache PDFBox"); info.setSubject("Apache PDFBox adding meta-data to PDF document"); info.setCreator("MyCreator"); ... DublinCoreSchema dcSchema = metadata.createAndAddDublinCoreSchema(); dcSchema.setTitle(info.getTitle(
8 2024-02-28
编程技术问答社区
Docx4j转换为pdf的问题
我知道此游戏机报告中有很多问题,但是由于我不是Docx4J和所有相关软件包中的专家,所以我想有一些解释,尤其是关于它有格式化问题的原因. 请给我一些帮助. This is the console output 09:40:08,964 WARN [org.docx4j.fonts.PhysicalFonts] (http-/0.0.0.0:8080-5) Aborting: file:/C:/Windows/FONTS/impact.ttf (can't get EmbedFontInfo[] .. try deleting fop-fonts.cache?) 09:40:09,025 INFO [org.docx4j.fonts.RunFontSelector] (http-/0.0.0.0:8080-5) rPrDefault/rFonts referenced Times New Roman 09:40:09,477 INFO [org.docx4j.openpack
26 2024-02-28
编程技术问答社区
用docx4j将图片添加到doc文件中
我正在尝试使用Android中的DOCX4J库将图像添加到DOCX文件中. 我面临一个例外: E/AndroidRuntime(21818): java.lang.ExceptionInInitializerError E/AndroidRuntime(21818): at org.apache.xmlgraphics.image.loader.impl.AbstractImageSessionContext.newSource(AbstractImageSessionContext.java:134) E/AndroidRuntime(21818): at org.apache.xmlgraphics.image.loader.impl.AbstractImageSessionContext.needSource(AbstractImageSessionContext.java:280) E/AndroidRuntime(21818): at org.apac
10 2024-02-09
编程技术问答社区
com.android.ide.common.process.ProcessException: org.gradle.process.internal.ExecException。
在我的项目中导入docx4j库后,我正在构建我的Android项目.我应该怎么做才能摆脱这个例外. 错误:任务执行失败':app:dexdebug'. > com.android.ide.common.common.process.processexception:org.gradle.process.internal.execexception:process'command'/usr/lib/lib/jvm/jva-7-7-openjdk-Amd64/bin/bin/java' - 零退出值2 解决方案 我有相同的错误.但是我通过在依赖项中添加build.gradle的以下缺少行来解决问题. compile'c​​om.parse.bolts:螺栓-Android:1.+' After adding this line, my dependencies body was like this: dependencies { compile fileTree(dir:
18 2024-01-27
编程技术问答社区
如何将HTML转换为形式良好的DOCX,并保持样式属性不变
我正在尝试使用DOCX4J将HTML5文件转换为DOCX.更大的了解HTML包含阿拉伯数据和英语数据.我已经对HTML的元素进行了样式.我的HTML在Chrome上看起来很整洁,但是当我使用DOCX4J转换为DOCX时,丢失了阿拉伯文本格式.在MS Word上,它表明我的阿拉伯文本具有大胆的样式设置,但并不大胆.同样,RTL方向也丢失了.表从RTL逆转到LTR. 作为解决方法,我使用BufferedWriter生成.doc文件,该文件将我的HTML文件与造型属性匹配,但是HTML中存在base64映像,该图像在.doc文件中不显示.因此,需要转换为.docx格式.我的要求是由我的HTML生成的可编辑文档. 请指导我通过,因为我一直在挠头.源示例代码也没有起作用. 这是我用来将html转换为docx的代码. public boolean convertHTMLToDocx(String inputFilePath, String outputFilePath, boolean
4 2024-01-23
编程技术问答社区
如何在docx中接受修订/跟踪修改(ins/del)?
在MS -WORD 2010中,在文件中有一个选项 - >信息在共享之前检查该文档是否有问题.这使得可以处理跟踪更改(对最新版本),并立即从文档中删除所有注释和注释. 这种可能性是否也可以在DOCX4J中使用,还是我需要投资相应的Jaxb-Objects并写下Traverse Finder? 手动这样做可能是很多工作,因为我必须将RunIns(w:ins)添加到R(w:r)并删除RunDel(w:del).我还看到w:del一次w:ins.在这种情况下,我不知道这是反之亦然. 进一步的研究带来了这一XSLT: 如果不适合以一种简单的方式解决此请求,我将更改约束.对于我来说,有一种将所有内容的文本作为String进行的方法是足够的. contentAccessor可以是P或Tc.该字符串应在R内部或内部R内部(其中R内)内部,为此,我有一个半解决方案.交织部分始于else if (child instanceof RunIns) {的线.但是如上所述,我不确定如何出现嵌套的d
22 2023-12-24
编程技术问答社区