当前位置: 首页 > article >正文

Lucene(8_2_0)核心API学习 之 TokenStream(一)

一、继承

org.apache.lucene.analysis.TokenStream  entends org.apache.lucene.util.AttributeSource

二、详情

  1. TokenStream是一个抽象类,是一系列Token的枚举,这里的Token有两个来源,一是Document的Fields,一是查询语句Query;
  2. 这是一个抽象类,有两个具体子类:

Tokenizer,分词器,输入为Reader;

TokenFilter,过滤器,输入为TokenStream;

用法:一般先用分词器分词,然后用过滤器过滤,这样可以缩小搜索范围,提高效率;

      3. TokenStream继承于AttributeSource,AttributeSource提供给TokenStream访问所有Token属性Attributes的方法。注意每一个AttributeImpl(Attribute的实现类)只有一个实例(单例模式)被创造,然后被所有的tokens重复使用。这样做是为了减少创建对象的消耗,同时允许对AttributeImpl引用的本地缓存。看incrementToken()可以获得更多详情。

三、TokenStream工作流程的核心API

  1. 实例化(Instantiation):实例化一个TokenStream或TokenFilter需要从AttributeSource添加相应的属性;
  2. 状态重置(reset):消费者在使用token前一定要先将状态reset(),因为每一个属性是单例的,被所有token使用;
  3. 查询属性并存储在本地:消费者从stream流中检索属性,并在本地存储指向这些属性的引用;
  4. 调用incrementToken():消费者不断调用incrementToken,获取下一个Token,直到返回错误;
  5. end():消费者调用end()表示token已经遍历完了,可以执行一些遍历结束时的操作;
  6. close():释放相关资源;

        我的理解:把Token当做建立索引时lucene可以处理的最小单元,而TokenStream是一个存储了一系列Token的流,当你需要使用时,一个一个从流中取出Token来处理。

四、进一步解释

  • 为了确保消费者和过滤器知道哪些属性是可用的,这些属性必须在实例化时被添加进去。过滤器和消费者不小在incrementToken()中检查这些属性的可用性;
  • 应为TokenStream的API是基于装饰者模式的,因此所有的非抽象子类必须是final,或者至少有一个final修饰的incrementToken()的实现方法!
http://www.lryc.cn/news/2419282.html

相关文章:

  • Javafx程序开发-如何制作exe程序及制作安装包
  • arp病毒查杀:手动查杀ARP病毒
  • 朴素贝叶斯法(Naive Bayes,NB)(结合例子推公式,通俗易懂)
  • 高等数学:极限与连续
  • python docx页面设置_如何在pythondocx中将页面大小更改为A4
  • LoadRunner常用的C语言原生函数
  • eXtreamDb安装启动篇
  • 硬件工程师实用工具网站
  • 国产电脑系统中,哪一款在安全防护功能上体现了对用户的关怀?
  • 稻城亚丁 旅游主题网页设计 html源码
  • 尝试Ping百度域名后的思考
  • 聚富网助力股民摆脱经济压力,实现财富自由
  • 论文修改技巧与步骤 快码论文
  • Android Recovery具体工作原理
  • 常用网页广告代码全集
  • BT没死!305个国外BT资源聚合站点大全
  • boost linux 串口,boost 串口编程 | 求索阁
  • WebLogic JNDI 编程
  • Response.Cookies 和 Request.Cookies
  • Ubuntu下使用Wine安装QQ
  • Java中static作用及用法详解
  • java httpclient4_httpclient4使用说明
  • componentsJoinedByString和componentsSeparatedByString的使用
  • PHP中用header(Location: test.php)进行跳转时应注意的问题
  • Linux服务器防御最全教程
  • 杀毒软件 对应的进程名称
  • 龙将加速浏览器_《看门狗:军团》即将开启预载,迅游加速器支持下载和联机加速 18183手机游戏网...
  • VC 界面编程总结
  • 交换机基础配置-新版(4)
  • 没事也研究一下外挂--C#简单游戏外挂制作(以Warcraft Ⅲ为例)