Apache POI 架构

Apache POI 由各种组件组成,并构成一个架构以形成一个工作系统。

例如POIFS和HSSF组件分别用于读写微软的Office和Open Office文件。

POIFS是 POI 中最稳定、最古老的部分。它支持读和写功能。它是 OLE 2 复合文档格式到纯 Java 的端口。我们所有(非 XML)Microsoft Office 格式的组件最终都依赖于它。

HSSF组件用于使用 Java 读写 Microsoft Excel 97 (-2003) 文件格式。XSSF 用于在 Java 中读写 Microsoft Excel XML (2007+) 文件格式 (OOXML)。SS 是一个包,它通过一个通用的 API 为这两种格式提供读写能力。

HWPF用于处理 Java 中的 Microsoft Word 97 (-2003) 文件。它支持读取和有限的写入功能。

HSLF用于处理 Java 中的 Microsoft PowerPoint 97(-2003) 文件格式。它提供读取和写入功能。

HDGF是我们将 Microsoft Visio 97(-2003) 文件格式移植到纯 Java 的端口。目前只支持非常低层次的阅读,以及简单的文本提取。

HPBF用于处理 Java 中的 Microsoft Publisher 98(-2007) 文件格式。它目前仅支持大约一半的文件部分的低级别读取和简单的文本提取。

HMEF用于将 Microsoft TNEF(传输中性编码格式)文件格式处理为纯 Java。TNEF 有时被 Outlook 用于对邮件进行编码,通常以 winmail.dat 的形式出现。HMEF目前只支持低层阅读,但我们希望增加文本和附件提取。

HSMF负责处理 Java 中的 Microsoft Outlook 消息文件格式。它目前仅支持 MSG 文件的部分文本内容和一些附件。

以下是 POI 的组件及其 Maven artifactId。

组件 应用类型 Maven artifactId
POIFS OLE2 Filesystem Poi
HPSF OLE2 Property Sets Poi
HSSF Excel XLS Poi
HSLF PowerPoint PPT Poi-scratchpad
HWPF Word DOC Poi-scratchpad
HDGF Visio VSD Poi-scratchpad
HPBF Publisher PUB Poi-scratchpad
HSMF Outlook MSG Poi-scratchpad
DDF Escher common drawings Poi
HWMF WMF drawings Poi-scratchpad
OpenXML4J OOXML poi-ooxml plus either poi-ooxml-schemas or
ooxml-schemas and ooxml-security
XSSF Excel XLSX Poi-ooxml
XSLF PowerPoint PPTX Poi-ooxml
XWPF Word DOCX Poi-ooxml
XDGF Visio VSDX Poi-ooxml
Common SL PowerPoint PPT and PPTX poi-scratchpad and poi-ooxml
Common SS Excel XLS and XLSX poi-ooxml

热门文章

优秀文章