一、SAX解析xml简介
SAX是Simple API for Xml的简写,主要功能是用于对xml文档进行解析。由于该方式采用的是事件驱动(callback回调机制)解析方式,所以有速度快、占内存少的优点,当然这些优点也仅限于xml的读取操作,SAX是无法对读取的XML元素进行修改的。如果要修改节点元素则需要使用DOC方式进行将xml文件读取,它会将xml读取成document树结构对象,这样可用对节点元素进行编辑操作;DOC方式的缺点也比较明显:占内存大、解析速度较慢。
所以仅用于读取xml操作,使用SAX方式是比较好的方式。
//org.apache.tomcat.util.digester.Digester#parse(org.xml.sax.InputSource)
public class Digester extends DefaultHandler2 {
//读取解析xml
public Object parse(InputSource input) throws IOException, SAXException {
configure();
getXMLReader().parse(input);
return root;
}
//对每个xml标签进行解析,并执行于之对应的Rule规则列表
public void startElement(String namespaceURI, String localName, String qName, Attributes list)
throws SAXException {
boolean debug = log.isDebugEnabled();
// Parse system properties
list = updateAttributes(list);
// Save the body text accumulated for our surrounding element
bodyTexts.push(bodyText);
bodyText = new StringBuilder();
// the actual element name is either in localName or qName, depending
// on whether the parser is namespace aware
String name = localName;
if ((name == null) || (name.length() < 1)) {
name = qName;
}
// Compute the current matching rule
StringBuilder sb = new StringBuilder(match);
if (match.length() > 0) {
sb.append('/');
}
sb.append(name); //根据每次xml节点的名称拼接成匹配url
match = sb.toString();
// Fire "begin" events for all relevant rules(根据namespaceURI匹配获取的Rule规则列表,有顺序规则)
List<Rule> rules = getRules().match(namespaceURI, match);
matches.push(rules);
if ((rules != null) && (rules.size() > 0)) {
for (Rule value : rules) {
try {
Rule rule = value;
if (debug) {
log.debug(" Fire begin() for " + rule);
}
//依次执行begin方法
rule.begin(namespaceURI, name, list);
} catch (Exception e) {
log.error("Begin event threw exception", e);
throw createSAXException(e);
} catch (Error e) {
log.error("Begin event threw error", e);
throw e;
}
}
} else {
if (debug) {
log.debug(" No rules found matching '" + match + "'.");
}
}
}
}