XML介绍

敲代码的人 2019-07-15

293

XML: eXtensible Markup Language 可扩展标记语言 version="1.0"

可扩展:所有的标签都是自定义的
功能:数据的存储,配置文件和数据传输

XML和HTML的区别

html语法松散，xml语法严格
html做页面展示，xml做数据存储
html所有标签都是预定义的，xml所有标签都是自定义的

xml语法：

文档声明

必须写在XML文档的第一行
写法:<?xml version="1.0" ?>
属性：version：版本号固定值 1.0,

encoding:指定文档的码表。默认值为 iso-8859-1,

standalone：指定文档是否独立 yes 或 no

元素：xml文档中的标签

文档中必须有且只能有一个根元素
元素需要正确闭合。<body></body> <br/>
元素需要正确嵌套
元素名称要遵守：元素名称要遵守：元素名称要遵守：元素遵守:名称区分大小写,数字不能开头

文本:

转义字符：>
CDATA: 里边的数据会原样显示--- <![CDATA[ 数据内容 ]]>

属性:

属性值必须用引号引起来。单双引号都行

注释:

处理指令：现在基本不用

<?xml-stylesheet type="text/css" href="1.css"?>

<?xml version="1.0" encoding="UTF-8"?><!--声明  -->
<!-- books根标签 -->
<books>
  <!-- book元素 -->
  <!-- number属性 -->
  <book number="s001">
    <name>java</name>
    <price>35</price>
  </book>
  <book>
    <name>c++</name>
    <price>35</price>
    <![CDATA[ if(2>1){} ]]>
  </book>
</books>

XML约束:就是xml的书写规则

dtd约束:

内部dtd：在xml内部定义dtd
本地dtd文件：<!DOCTYPE students SYSTEM "student.dtd">
网络dtd文件：<!DOCTYPE students PUBLIC "名称空间" "student.dtd">

对标签和属性进行约束 ,这种dtd的方式不严谨

<!ELEMENT students (student*) >
<!ELEMENT student (name,age,sex)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
<!ELEMENT sex (#PCDATA)>
<!ATTLIST student number ID #REQUIRED>

<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE students SYSTEM  "student.dtd">


<students>
  <student number="s0001" >
    <name>zs</name>
    <age>abc</age>
    <sex>yao</sex>
  </student>
</student

schema约束：

编写根标签
引入实例名称空间 xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
引入名称空间 xsi:schemaLocation="http://www.itcast.cn/xml student.xsd"
引入默认的名称空间

<?xml version="1.0"?>
<!-- namespace给xml文档引用 -->
<!--xmlns:xsd="http://www.w3.org/2001/XMLSchema"
  固定写法,xsd:string解析是就能认出是string类型
  -->
<xsd:schema xmlns="http://www.langlihuge.cn/xml" 
        xmlns:xsd="http://www.w3.org/2001/XMLSchema"
        targetNamespace="http://www.langlihuge.cn/xml" elementFormDefault="qualified">
        <!-- 这个也是namespace给xml文档引用 -->
    <!-- 约束根标签students,别名 studentsType-->
    <xsd:element name="students" type="studentsType"/>
    <!-- 约束复杂标签,就是students -->
    <xsd:complexType name="studentsType">
      <!-- 序列,按顺序出现 -->
        <xsd:sequence>
          <!-- minOccurs最小0此,最大无限次 -->
            <xsd:element name="student" type="studentType" minOccurs="0" maxOccurs="unbounded"/>
        </xsd:sequence>
    </xsd:complexType>
    <!-- 对student约束 -->
    <xsd:complexType name="studentType">
      <!-- 序列,name,age,sex顺序出现 -->
        <xsd:sequence>
          <!-- 对三个简单的约束说明 -->
            <xsd:element name="name" type="xsd:string"/>
            <xsd:element name="age" type="ageType" />
            <xsd:element name="sex" type="sexType" />
        </xsd:sequence>
        <!-- 对属性的约束 -->
        <xsd:attribute name="number" type="numberType" use="required"/>
    </xsd:complexType>
    <!-- 对sex约束 -->
    <xsd:simpleType name="sexType">
      <!-- String类型,只有male,和female两种 -->
        <xsd:restriction base="xsd:string">
            <xsd:enumeration value="male"/>
            <xsd:enumeration value="female"/>
        </xsd:restriction>
    </xsd:simpleType>
    <!-- 对age标签的约束 -->
    <xsd:simpleType name="ageType">
      <!-- xsd:integer类型0-256之间 -->
        <xsd:restriction base="xsd:integer">
            <xsd:minInclusive value="0"/>
            <xsd:maxInclusive value="256"/>
        </xsd:restriction>
    </xsd:simpleType>
    <xsd:simpleType name="numberType">
      <!-- String类型,已lianglihuge_后面根四个数字 -->
        <xsd:restriction base="xsd:string">
            <xsd:pattern value="langlihuge_\d{4}"/>
        </xsd:restriction>
    </xsd:simpleType>
</xsd:schema>

xml文档

<?xml version="1.0" encoding="UTF-8" ?>
<students 
  xmlns="http://www.itheima.cn/xml"
  xsi:schemaLocation="http://www.langlihuge.cn/xml student.xsd"
  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
  <!-- 
  xmlns:langligehuc="http://www.itheima.cn/xml" 
  相当于取一个别名
  <langligehu:student number="itheima_1001">
    <name>asfd</name>
    <age>12</age>
    <sex>male</sex>
  </langligehu:student>
  -->
  <student number="itheima_1001">
    <name>asfd</name>
    <age>12</age>
    <sex>male</sex>
  </student>
</students>

XML解析:

如果xml作为配置文件：读取

如果xml作为传输文件：写，读

xml解析思想：

DOM：将文档加载进内存，形成一颗dom树(document对象)，将文档的各个组成部分封装为一些对象,Document,Element,Text,Attribute,Comment

优点：因为，在内存中会形成dom树，可以对dom树进行增删改查。

缺点：dom树非常占内存，解析速度慢。

SAX：逐行读取，基于事件驱动

优点：不占内存，速度快

缺点：只能读取，不能回写

XML常用解析器:

JAXP：sun公司提供的解析。支持dom和sax。

JDOM：

DOM4J：dom for java民间方式，但是是事实方式。非常好。支持dom

步骤:

导入jar包 dom4j.jar
创建解析器SAXReader reader = new SAXReader();
解析xml 获得document对象 Document document = reader.read(url);

<?xml version="1.0" encoding="UTF-8"?>
<书架> 
  <书 出版社="浪里虎哥"> 
    <书名>java</书名>  
    <作者>huge</作者>  
    <单价>10</单价>  
    <批发价>20</批发价> 
  </书>  
  <书> 
    <书名>C++</书名>  
    <作者>huge</作者>  
    <单价>10</单价> 
  </书> 
</书架

public class TestDom4j {
  @Test// 1、得到某个具体的节点内容:第2本书的书名--》葵花宝典
  public void test1() throws DocumentException{
     SAXReader reader = new SAXReader();//创建一个xml解析对象
       Document document = reader.read("src/Book.xml");//把xml文档加载到document对象中
       Element root = document.getRootElement();
      /* Element bookNode = root.element("书");
       System.out.println(bookNode.getName());*/
       List list = root.elements();//得到当前节点的所有子节点
       Element secondBook = (Element) list.get(1);//得到第二本书对象
       String name = secondBook.element("书名").getText();//得到当前节点的文本内容
       System.out.println(name);
  }
  
  @Test // 2、遍历所有元素节点
  public void test2() throws DocumentException{
    SAXReader reader = new SAXReader();//创建一个xml解析对象
       Document document = reader.read("src/Book.xml");//把xml文档加载到document对象中
       Element root = document.getRootElement();
       treeWalk(root);
  }


  private void treeWalk(Element ele) {
    System.out.println(ele.getName());//输出当前节点的名子
    for (int i = 0; i < ele.nodeCount(); i++) {//ele.nodeCount()得到当前节点的所有子节点的数量
      Node node = ele.node(i);//取出下标为i的节点 
      if(node instanceof Element){//判断当前节点是否为标签
        treeWalk((Element)node);//把node强转为标签(Element)
      }else{
        System.out.println(node.getText());
      }
    }
  }

XPATH：专门用于查询

定义了一种规则。

使用的方法：selectSingleNode(),selectNodes():

使用步骤：

注意：要导包 jaxen-1.1-beta-6.jar
创建解析器SAXReader reader = new SAXReader();
解析xml 获得document对象 ,Document document = reader.read(url);

public class TestXPath {
  @Test
  public void test() throws Exception{
    SAXReader read = new SAXReader();
    Document document = read.read("src/Book.xml");
    Node node = document.selectSingleNode("/书架/书[2]/书名");
    System.out.println(node.getText());
  }
  
  @Test
  public void test2() throws Exception{
    SAXReader read = new SAXReader();
    Document document = read.read("src/Book.xml");
    List list = document.selectNodes("//*");
    for (int i = 0; i < list.size(); i++) {
      Node node = (Node)list.get(i);
      System.out.println(node.getName()+"\t"+node.getText());
    }
  }
}

XPath：

// nodename 选取此节点。

// / 从根节点选取。

// // 从匹配选择的当前节点选择文档中的节点，而不考虑它们的位置。

// .. 选取当前节点的父节点。

// @ 选取属性。

// [@属性名] 属性过滤

// [标签名] 子元素过滤

数据库

文章转载自敲代码的人，如果涉嫌侵权，请发送邮件至：contact@modb.pro进行举报，并提供相关证据，一经查实，墨天轮将立刻删除相关内容。

XML介绍

评论