Apache POI 架构
Apache POI 由各种组件组成,并构成一个架构以形成一个工作系统。
例如POIFS和HSSF组件分别用于读写微软的Office和Open Office文件。
POIFS是 POI 中最稳定、最古老的部分。它支持读和写功能。它是 OLE 2 复合文档格式到纯 Java 的端口。我们所有(非 XML)Microsoft Office 格式的组件最终都依赖于它。
HSSF组件用于使用 Java 读写 Microsoft Excel 97 (-2003) 文件格式。XSSF 用于在 Java 中读写 Microsoft Excel XML (2007+) 文件格式 (OOXML)。SS 是一个包,它通过一个通用的 API 为这两种格式提供读写能力。
HWPF用于处理 Java 中的 Microsoft Word 97 (-2003) 文件。它支持读取和有限的写入功能。
HSLF用于处理 Java 中的 Microsoft PowerPoint 97(-2003) 文件格式。它提供读取和写入功能。
HDGF是我们将 Microsoft Visio 97(-2003) 文件格式移植到纯 Java 的端口。目前只支持非常低层次的阅读,以及简单的文本提取。
HPBF用于处理 Java 中的 Microsoft Publisher 98(-2007) 文件格式。它目前仅支持大约一半的文件部分的低级别读取和简单的文本提取。
HMEF用于将 Microsoft TNEF(传输中性编码格式)文件格式处理为纯 Java。TNEF 有时被 Outlook 用于对邮件进行编码,通常以 winmail.dat 的形式出现。HMEF目前只支持低层阅读,但我们希望增加文本和附件提取。
HSMF负责处理 Java 中的 Microsoft Outlook 消息文件格式。它目前仅支持 MSG 文件的部分文本内容和一些附件。
以下是 POI 的组件及其 Maven artifactId。
组件 | 应用类型 | Maven artifactId |
---|---|---|
POIFS | OLE2 Filesystem | Poi |
HPSF | OLE2 Property Sets | Poi |
HSSF | Excel XLS | Poi |
HSLF | PowerPoint PPT | Poi-scratchpad |
HWPF | Word DOC | Poi-scratchpad |
HDGF | Visio VSD | Poi-scratchpad |
HPBF | Publisher PUB | Poi-scratchpad |
HSMF | Outlook MSG | Poi-scratchpad |
DDF | Escher common drawings | Poi |
HWMF | WMF drawings | Poi-scratchpad |
OpenXML4J | OOXML | poi-ooxml plus either poi-ooxml-schemas or ooxml-schemas and ooxml-security |
XSSF | Excel XLSX | Poi-ooxml |
XSLF | PowerPoint PPTX | Poi-ooxml |
XWPF | Word DOCX | Poi-ooxml |
XDGF | Visio VSDX | Poi-ooxml |
Common SL | PowerPoint PPT and PPTX | poi-scratchpad and poi-ooxml |
Common SS | Excel XLS and XLSX | poi-ooxml |
热门文章
优秀文章