问题

我正在搜索用于解析XML(复杂配置和数据文件)的java库,我用Google搜索了一点,但找不到dom4j以外的其他(类似于他们在V2上工作的Seems).我已经看过公共配置,但不喜欢它,关于XML的其他apache项目似乎处于冬眠状态.我自己没有评估dom4j但只是想知道 – java是否有其他(好)开源xml解析库?以及您对dom4j的体验?

在@voo的答案之后,让我问另一个 – 我应该在类中使用java的built-in或任何像dom4j这样的第三方库.有什么好处?

  最佳答案

实际上,Java支持4种方法来解析框中的XML:

DOM Parser / Builder:将整个 XML 结构加载到内存中,您可以使用已知的 DOM 方法来处理它。 例:

 public static void parse() throws ParserConfigurationException, IOException, SAXException {
    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
    factory.setValidating(true);
    factory.setIgnoringElementContentWhitespace(true);
    DocumentBuilder builder = factory.newDocumentBuilder();
    File file = new File("test.xml");
    Document doc = builder.parse(file);
    // Do something with the document here.
}
 

SAX Parser:仅读取XML文档. Sax解析器运行文档并调用用户的回调方法.有文档,元素等的启动/结束方法.它们在org.xml.sax.ContentHandler中定义,有一个空辅助类DefaultHandler.

 public static void parse() throws ParserConfigurationException, SAXException {
    SAXParserFactory factory = SAXParserFactory.newInstance();
    factory.setValidating(true);
    SAXParser saxParser = factory.newSAXParser();
    File file = new File("test.xml");
    saxParser.parse(file, new ElementHandler());    // specify handler
}
 

StAX Reader / Writer:这适用于面向数据的接口.当它准备好就像光标/迭代器一样时,程序要求下一个元素.您也可以使用它创建文档. 改为:

 public static void parse() throws XMLStreamException, IOException {
    try (FileInputStream fis = new FileInputStream("test.xml")) {
        XMLInputFactory xmlInFact = XMLInputFactory.newInstance();
        XMLStreamReader reader = xmlInFact.createXMLStreamReader(fis);
        while(reader.hasNext()) {
            reader.next(); // do something here
        }
    }
}
 

写文件:

 public static void parse() throws XMLStreamException, IOException {
    try (FileOutputStream fos = new FileOutputStream("test.xml")){
        XMLOutputFactory xmlOutFact = XMLOutputFactory.newInstance();
        XMLStreamWriter writer = xmlOutFact.createXMLStreamWriter(fos);
        writer.writeStartDocument();
        writer.writeStartElement("test");
        // write stuff
        writer.writeEndElement();
    }
}
 

JAXB:读取XML文档的最新实现:是v2中Java 6的一部分.这允许我们从文档中序列化java对象.您使用一个类读取文档,该类实现对javax.xml.bind.Unmarshaller的接口(您从JAXBContext.newInstance获得一个类).上下文必须使用旧类初始化,但您只需指定根类,并且不必担心静态引用类. 您使用注释来指定哪些类应该是元素(@XmlRootElement),哪些字段是元素(@XmlElement)或属性(@XMLAttribute,多惊喜!)

 public static void parse() throws JAXBException, IOException {
    try (FileInputStream adrFile = new FileInputStream("test")) {
        JAXBContext ctx = JAXBContext.newInstance(RootElementClass.class);
        Unmarshaller um = ctx.createUnmarshaller();
        RootElementClass rootElement = (RootElementClass) um.unmarshal(adrFile);
    }
}
 

写文件:

 public static void parse(RootElementClass out) throws IOException, JAXBException {
    try (FileOutputStream adrFile = new FileOutputStream("test.xml")) {
        JAXBContext ctx = JAXBContext.newInstance(RootElementClass.class);
        Marshaller ma = ctx.createMarshaller();
        ma.marshal(out, adrFile);
    }
}
 

从一些旧的讲座幻灯片中无耻复制的例子; -)

编辑:关于“我应该使用哪个API?”

  相同标签的其他问题

javaxmlparsing