Dom4j解析xml文档
(一)、Dom4j解析xml文档
Dom4j是一个简单、灵活的开放源代码的库。Dom4j是由早期开发JDOM开发的。与JDOM不同的是,dom4j使用接口和抽象的人分离出来而后独立基类,虽然Dom4j的API相对要复杂一些,但它提供了比JDOM更好的灵活性。
Dom4j是一个非常优秀的Java XML API,具有性能优异、功能强大和极易使用的特点。现在很多软件采用的Dom4j,例如Hibernate,包括sun公司自己的JAXM也用了Dom4j。
使用Dom4j开发,需下载dom4j相应的jar文件。
(二)、DOM4j中,获得Document对象的方式有三种:
1.读取XML文件,获得document对象
SAXReader reader = new SAXReader();
Document document = reader.read(new File("input.xml"));
2.解析XML形式的文本,得到document对象.
String text = "<members></members>";
Document document = DocumentHelper.parseText(text);
3.主动创建document对象.
Document document = DocumentHelper.createDocument();
//创建根节点
Element root = document.addElement("members");
(三)、获取节点对象
1.获取文档的根节点.
Element root = document.getRootElement();
2.取得某个节点的子节点.
Element element=node.element(“书名");
3.取得节点的文字
String text=node.getText();
4.取得某节点下所有名为“member”的子节点,并进行遍历.
List nodes = rootElm.elements("member");
for (Iterator it = nodes.iterator(); it.hasNext();) {
Element elm = (Element) it.next();
}
5.对某节点下的所有子节点进行遍历.
for(Iterator it=root.elementIterator();it.hasNext();){
Element element = (Element) it.next();
// do something
}
6.在某节点下添加子节点.
Element ageElm = newMemberElm.addElement("age");
7.设置节点文字.
element.setText("29");
8.删除某节点.
//childElm是待删除的节点,parentElm是其父节点
parentElm.remove(childElm);
利用dom4j修改 xml 文档 举例如下public class Demo03 { /* * 1、解析xml文档,将xml文档转换Dom4j树 * 2、利用dom4j树提供的导航方法找到需要修改的节点 * 3、修改指定的节点,或者在指定的节点添加新的节点 * 4、写入到dom4j树document中,写入修改后的xml文件中 * */ public static void main(String[] args)throws Exception{ //获取读取器 SAXReader reader = new SAXReader(); //reader.setStripWhitespaceText(true); //忽略空白 Document doc = reader.read(new File("src\\bk.xml")); //获取根元素 Element root =doc.getRootElement(); Element address = DocumentHelper.createElement("address"); address.setText("保定"); Element secord = (Element) root.elements("book").get(1); List list = secord.elements(); list.add(2,address); OutputFormat format = new OutputFormat(" ",true,"UTF-8"); XMLWriter xw = new XMLWriter(new FileWriter("src\\bk.xml"),format); xw.write(doc); xw.close(); } }
(四)、节点对象属性
1.取得某节点下的某属性
Element root=document.getRootElement();
//属性名name
Attribute attribute=root.attribute("size");
2.取得属性的文字
String text=attribute.getText();
3.删除某属性
Attribute attribute=root.attribute("size");
root.remove(attribute);
3.遍历某节点的所有属性
Element root=document.getRootElement();
for(Iterator it=root.attributeIterator();it.hasNext();){
Attribute attribute = (Attribute) it.next();
String text=attribute.getText();
System.out.println(text);
}
4.设置某节点的属性和文字.
newMemberElm.addAttribute("name", "sitinspring");
5.设置属性的文字
Attribute attribute=root.attribute("name");
attribute.setText("sitinspring")
public static void main(String[] args) throws Exception { // 读取器 SAXReader reader = new SAXReader(); // 读取xml文档 解析xml文档 Document doc = reader.read(new File("src\\book.xml")); // 获取根据节点 Element root = doc.getRootElement(); System.out.println(root.getName()); parse(root); } // 解析元素 public static void parse(Element root) { parseAttr(root); for (Iterator<Element> it = root.elementIterator(); it.hasNext();) { Element entity = it.next(); // 判断是否只是文本 if (entity.isTextOnly()) { parseAttr(entity); System.out.println(entity.getText()); } else { parse(entity); } } } // 解析元素的属性 private static void parseAttr(Element root) { for (Iterator<Attribute> it = root.attributeIterator(); it.hasNext();) { Attribute entity = it.next(); System.out.println(entity.getName() + "--------------" + entity.getValue()); } }
(五)、将节点写入xml文件
1.文档中全为英文,不设置编码,直接写入的形式.
XMLWriter writer = new XMLWriter(new FileWriter("output.xml"));
writer.write(document);
writer.close();
2.文档中含有中文,设置编码格式写入的形式.
OutputFormat format = OutputFormat.createPrettyPrint();
// 指定XML编码
format.setEncoding("GBK");
XMLWriter writer = new XMLWriter(newFileWriter("output.xml"),format);
writer.write(document);
writer.close();