当前位置: 首页 > news >正文

鸿蒙开发——使用ArkTs处理XML文本

1、概 述

XML(可扩展标记语言)是一种用于描述数据的标记语言,旨在提供一种通用的方式来传输和存储数据,特别是Web应用程序中经常使用的数据。XML并不预定义标记。因此,XML更加灵活,并且可以适用于广泛的应用领域。

XML文档由元素(element)、属性(attribute)和内容(content)组成。

    • 内容则是元素包含的数据或子元素。

    • 属性提供了有关元素的其他信息。

    • 元素指的是标记对,包含文本、属性或其他元素。

XML还可以通过使用XML Schema或DTD(文档类型定义)来定义文档结构。这些机制允许开发人员创建自定义规则以验证XML文档是否符合其预期的格式。

XML还支持命名空间、实体引用、注释、处理指令等特性,使其能够灵活地适应各种数据需求。

语言基础类库提供了XML相关的基础能力,包括:XML的生成、XML的解析和XML的转换。

2、生成XML

一个生成XML的示例如下(关注 9 ~ 41行,genXml方法):

import { xml, util } from '@kit.ArkTS';@Entry@Component@Previewstruct Index {  @State result: string = '';  genXml() {    // 方式1:基于Arraybuffer构造XmlSerializer对象    let arrayBuffer: ArrayBuffer = new ArrayBuffer(2048); // 创建一个2048字节的缓冲区    let thatSer: xml.XmlSerializer = new xml.XmlSerializer(arrayBuffer); // 基于Arraybuffer构造XmlSerializer对象    // 方式2:基于DataView构造XmlSerializer对象    // let arrayBuffer: ArrayBuffer = new ArrayBuffer(2048);    // let dataView: DataView = new DataView(arrayBuffer);    // let thatSer: xml.XmlSerializer = new xml.XmlSerializer(dataView);    thatSer.setDeclaration(); // 写入xml的声明    thatSer.startElement('bookstore'); // 写入元素开始标记    thatSer.startElement('book'); // 嵌套元素开始标记    thatSer.setAttributes('category', 'COOKING'); // 写入属性及属性值    thatSer.startElement('title');    thatSer.setAttributes('lang', 'en');    thatSer.setText('Everyday'); // 写入标签值    thatSer.endElement(); // 写入结束标记    thatSer.startElement('author');    thatSer.setText('Giana');    thatSer.endElement();    thatSer.startElement('year');    thatSer.setText('2005');    thatSer.endElement();    thatSer.endElement();    thatSer.endElement();    let view: Uint8Array = new Uint8Array(arrayBuffer); // 使用Uint8Array读取arrayBuffer的数据    let textDecoder: util.TextDecoder = util.TextDecoder.create(); // 调用util模块的TextDecoder类    let res: string = textDecoder.decodeToString(view); // 对view解码    // res输出结果    this.result = res;  }  build() {    Column() {      Row() {        Button('生成XML')          .onClick(() => {            this.genXml();          })          .width('100%')      }      .width('100%')      Row() {        Text(this.result)          .width('100%')          .padding(10)          .borderColor(Color.Gray)          .borderWidth(1)      }.width('100%')    }    .height('100%')  }}

效果如下:

图片

3、解析XML

对于XML的解析,一般包括

  1. 解析XML标签和标签值;

  2. 解析XML属性和属性值

  3. 解析XML事件类型和元素深度。

XML模块提供XmlPullParser类对XML文件解析,输入为含有XML文本的ArrayBuffer或DataView,输出为解析得到的信息。

下面分别针对这三种情况做示例讨论。

👉🏻 解析标签与标签内的值

一个解析XML标签和标签值的Demo如下(关注 9 ~ 36行,parseXML方法):​​​​​​​

import { xml, util } from '@kit.ArkTS';@Entry@Component@Previewstruct Index {  @State result: string = '';  parseXml() {  // xml案例    let strXml: string =      '<?xml version="1.0" encoding="utf-8"?>' +        '<note importance="high" logged="true">' +        '<title>Play</title>' +        '<lens>Work</lens>' +        '</note>';    let textEncoder: util.TextEncoder = new util.TextEncoder();    let arrBuffer: Uint8Array = textEncoder.encodeInto(strXml); // 对数据编码,防止包含中文字符乱码    // 方式1:基于ArrayBuffer构造XmlPullParser对象    let that: xml.XmlPullParser = new xml.XmlPullParser(arrBuffer.buffer as object as ArrayBuffer, 'UTF-8');    // 方式2:基于DataView构造XmlPullParser对象    // let dataView: DataView = new DataView(arrBuffer.buffer as object as ArrayBuffer);    // let that: xml.XmlPullParser = new xml.XmlPullParser(dataView, 'UTF-8');    let str: string = '';    // 自定义回调函数,本例直接打印出标签及标签值。    const  func = (name: string, value: string): boolean => {      str = name + value + '\n';      this.result += str;      return true; //true:继续解析 false:停止解析    }    let options: xml.ParseOptions = {supportDoctype:true, ignoreNameSpace:true, tagValueCallbackFunction:func};    that.parse(options);  }  build() {    Column() {      Row() {        Button('解析XML')          .onClick(() => {            this.parseXml();          })          .width('100%')      }      .width('100%')      Row() {        Text(this.result)          .width('100%')          .padding(10)          .borderColor(Color.Gray)          .borderWidth(1)      }.width('100%')    }    .height('100%')  }}

效果如下:

图片

👉🏻 解析XML属性与属性值

一个解析XML属性和属性值的Demo如下(关注 9 ~ 30行,parseXML方法):​​​​​​​

import { xml, util } from '@kit.ArkTS';@Entry@Component@Previewstruct Index {  @State result: string = '';  parseXml() {    let strXml: string =      '<?xml version="1.0" encoding="utf-8"?>' +        '<note importance="high" logged="true">' +        '    <title>Play</title>' +        '    <title>Happy</title>' +        '    <lens>Work</lens>' +        '</note>';    let textEncoder: util.TextEncoder = new util.TextEncoder();    let arrBuffer: Uint8Array = textEncoder.encodeInto(strXml); // 对数据编码,防止包含中文字符乱码    let that: xml.XmlPullParser = new xml.XmlPullParser(arrBuffer.buffer as object as ArrayBuffer, 'UTF-8');    let str: string = '';    const func = (name: string, value: string): boolean => {      str += name + ' ' + value + ' \n';      return true; // true:继续解析 false:停止解析    }    let options: xml.ParseOptions = {supportDoctype:true, ignoreNameSpace:true, attributeValueCallbackFunction:func};    that.parse(options);    this.result = str; // 一次打印出所有的属性及其值  }  build() {    Column() {      Row() {        Button('解析XML')          .onClick(() => {            this.parseXml();          })          .width('100%')      }      .width('100%')      Row() {        Text(this.result)          .width('100%')          .padding(10)          .borderColor(Color.Gray)          .borderWidth(1)      }.width('100%')    }    .height('100%')  }}

效果如下:

图片

👉🏻 解析XML事件类型和元素深度

一个解析XML事件类型和元素深度的Demo如下(关注 9 ~ 30行,parseXML方法):​​​​​​​

import { xml, util } from '@kit.ArkTS';@Entry@Component@Previewstruct Index {  @State result: string = '';  parseXml() {    let strXml: string =      '<?xml version="1.0" encoding="utf-8"?>' +        '<note importance="high" logged="true">' +        '<title>Play</title>' +        '</note>';    let textEncoder: util.TextEncoder = new util.TextEncoder();    let arrBuffer: Uint8Array = textEncoder.encodeInto(strXml); // 对数据编码,防止包含中文字符乱码    let that: xml.XmlPullParser = new xml.XmlPullParser(arrBuffer.buffer as object as ArrayBuffer, 'UTF-8');    let str: string  = '';    const func = (name: xml.EventType, value: xml.ParseInfo): boolean => {      str = name + ' ' + value.getDepth() + '\n'; // getDepth 获取元素的当前深度      this.result += str;      return true; //true:继续解析 false:停止解析    }    let options: xml.ParseOptions = {supportDoctype:true, ignoreNameSpace:true, tokenValueCallbackFunction:func};    that.parse(options);  }  build() {    Column() {      Row() {        Button('解析XML')          .onClick(() => {            this.parseXml();          })          .width('100%')      }      .width('100%')      Row() {        Text(this.result)          .width('100%')          .padding(10)          .borderColor(Color.Gray)          .borderWidth(1)      }.width('100%')    }    .height('100%')  }}

效果如下:

图片

其中对输出结果解释如下:​​​​​​​

 0 0 // 0:<?xml version="1.0" encoding="utf-8"?> 对应事件类型        START_DOCUMENT值为0  0:起始深度为0 2 1 // 2:<note importance="high" logged="true"> 对应事件类型START_TAG值为2       1:深度为1 2 2 // 2:<title>对应事件类型START_TAG值为2                                       2:深度为2 4 2 // 4:Play对应事件类型TEXT值为4                                               2:深度为2 3 2 // 3:</title>对应事件类型END_TAG值为3                                        2:深度为2 3 1 // 3:</note>对应事件类型END_TAG值为3                                         1:深度为1(与<note对应>) 1 0 // 1:对应事件类型END_DOCUMENT值为1                                           0:深度为0

【 解析选项参数 】

通过上面三个例子,我们可以观察到,核心都涉及到xml.ParseOptions选项参数。通过这个参数,我们可以设置对应的回调函数和一些解析行为。ParseOptions参数总结如下:

名称类型说明
supportDoctypeboolean是否解析文档类型,默认false,表示不解析。
ignoreNameSpaceboolean是否忽略命名空间,默认false,表示不忽略。
tagValueCallbackFunction(name: string, value: string) => boolean解析开始标签、标签值和结束标签,默认undefined,表示不解析。
attributeValueCallbackFunction(name: string, value: string) => boolean解析属性和属性值,默认undefined,表示不解析。
tokenValueCallbackFunction(eventType: EventType, value: ParseInfo) => boolean解析元素事件类型(EventType)和ParseInfo属性,默认undefined,表示不解析。

其中EventType是事件类型枚举,定义如下:

名称说明
START_DOCUMENT0启动文件事件。
END_DOCUMENT1结束文件事件。
START_TAG2启动标签事件。
END_TAG3结束标签事件。
TEXT4文本事件。
CDSECT5CDATA事件。
COMMENT6XML注释事件。
DOCDECL7XML文档类型声明事件。
INSTRUCTION8XML处理指令声明事件。
ENTITY_REFERENCE9实体引用事件。
WHITESPACE10空白事件。

4、转换XML为JSON对象

将XML文本转换为JSON对象可以更轻松地处理和操作数据,并且更适合在JS应用程序中使用。

语言基础类库提供ConvertXML类将XML文本转换为JSON对象,输入为待转换的XML字符串及转换选项,输出为转换后的JSON对象。

一个转换示例如下:​​​​​​​

import { convertxml } from '@kit.ArkTS';@Entry@Component@Previewstruct Index {  @State result: string = '';  convertXML() {    let xml: string =      '<?xml version="1.0" encoding="utf-8"?>' +        '<note importance="high" logged="true">' +        '    <title>Happy</title>' +        '    <todo>Work</todo>' +        '    <todo>Play</todo>' +        '</note>';    let options: convertxml.ConvertOptions = {      // trim: false 转换后是否删除文本前后的空格,否      // declarationKey: "_declaration" 转换后文件声明使用_declaration来标识      // instructionKey: "_instruction" 转换后指令使用_instruction标识      // attributesKey: "_attributes" 转换后属性使用_attributes标识      // textKey: "_text" 转换后标签值使用_text标识      // cdataKey: "_cdata" 转换后未解析数据使用_cdata标识      // docTypeKey: "_doctype" 转换后文档类型使用_doctype标识      // commentKey: "_comment" 转换后注释使用_comment标识      // parentKey: "_parent" 转换后父类使用_parent标识      // typeKey: "_type" 转换后元素类型使用_type标识      // nameKey: "_name" 转换后标签名称使用_name标识      // elementsKey: "_elements" 转换后元素使用_elements标识      trim: false,      declarationKey: "_declaration",      instructionKey: "_instruction",      attributesKey: "_attributes",      textKey: "_text",      cdataKey: "_cdata",      doctypeKey: "_doctype",      commentKey: "_comment",      parentKey: "_parent",      typeKey: "_type",      nameKey: "_name",      elementsKey: "_elements"    }    let conv: convertxml.ConvertXML = new convertxml.ConvertXML();    let result: object = conv.convertToJSObject(xml, options);    let strRes: string = JSON.stringify(result); // 将js对象转换为json字符串,用于显式输出    console.info(strRes);    this.result = strRes;  }  build() {    Column() {      Row() {        Button('解析XML')          .onClick(() => {            this.convertXML();          })          .width('100%')      }      .width('100%')      Row() {        Text(this.result)          .width('100%')          .padding(10)          .borderColor(Color.Gray)          .borderWidth(1)      }.width('100%')    }    .height('100%')  }}

效果如下:

图片

http://www.lryc.cn/news/498134.html

相关文章:

  • 【Linux】文件查找 find grep
  • Go学习笔记之运算符号
  • npm : 无法加载文件 D:\nodejs\npm.ps1,因为在此系统上禁止运行脚本
  • YOLOv8-ultralytics-8.2.103部分代码阅读笔记-torch_utils.py
  • Java中的数据存储结构解析与应用
  • 【链表】力扣 141. 环形链表
  • Hbase整合Mapreduce案例2 hbase数据下载至hdfs中——wordcount
  • diff算法
  • 最新AI问答创作运营系统(SparkAi系统),GPT-4.0/GPT-4o多模态模型+联网搜索提问+问答分析+AI绘画+管理后台系统
  • docker应用
  • COCO数据集理解
  • C# 向上取整多种实现方法
  • Elastic Cloud Serverless:深入探讨大规模自动扩展和性能压力测试
  • 新一代零样本无训练目标检测
  • es 3期 第13节-多条件组合查询实战运用
  • 全局token验证
  • 实时美颜技术详解:美颜SDK与直播APP开发实践
  • 电子应用设计方案-41:智能微波炉系统方案设计
  • P5736 【深基7.例2】质数筛
  • 数据结构初阶1 时间复杂度和空间复杂度
  • E130 PHP+MYSQL+动漫门户网站的设计与实现 视频网站系统 在线点播视频 源码 配置 文档 全套资料
  • OSCP - Proving Grounds - Fanatastic
  • ArcMap 分享统计点要素、路网、降雨量等功能操作
  • 概率论——假设检验
  • 爬虫项目练手
  • C程序设计:解决Fibonacci.数列问题
  • 35页PDF | 元数据与数据血缘落地实施(限免下载)
  • Lua元表和元方法的使用
  • 基于Pyhton的人脸识别(Python 3.12+face_recognition库)
  • Spring Boot+Netty