当前位置: 首页 > news >正文

【王树森搜索引擎技术】概要01:搜索引擎的基本概念

1. 基本名词

  • query:查询词
  • SUG:搜索建议
  • 文档:搜索结果
  • 标签/筛选项
    在这里插入图片描述
  • 文档单列曝光
    在这里插入图片描述
  • 文档双列曝光
    在这里插入图片描述

2. 曝光与点击

  • 曝光:用户在搜索结果页上看到文档,就算曝光
  • 文档点击:在曝光后,用户点击文档,进入文档的详细页
  • 文档点击率:文档点积总次数/文档曝光总次数
  • 查询词点击:用户点击搜索结果页上的任意一篇文档,就算查询词点击。无论点击了多少次,只要点击了,就算查询词点击
  • 查询词点击率(有点比):查询词点击总次数/搜索总次数
  • 查询词首屏点击:用户点击搜索结果页首屏的任意一篇文档,就算”查询词首屏点击“
  • 查询词首屏点击率(首屏有点比):查询词首屏点击总次数/搜索总次数
  • 首屏点击的定义更严格,所以查询词首屏点击率比查询词点击率更小
  • 它们很相似,都能反应用户能否很好地找到所需的文档
    在这里插入图片描述
  • 文档点击率:10%左右,通常很小
  • 查询词点击率(有点比):70%左右
  • 查询词首屏点击率(首屏有点比):60%左右
  • 有点比的重要性高于文档点击率

3. 垂搜 vs 通搜

  • 垂直搜索(垂搜):针对某一个行业的搜索引擎。比如电商搜索,学术搜素,本地生活搜索等
  • 垂直搜索的文档普遍是结构化的,容易根据文档属性标签做搜索筛选。比如电商可以限定卖家和价格,学术可以限定作者,期刊,年份等
  • 垂直搜索用户的意图明确
  • 通用搜索(通搜):覆盖面广,不限于一个领域。例如百度,必应,抖音。
  • 文档来源广,覆盖面大。例如网页,视频,商品等
  • 没有结构化,检索难度大
  • 用户使用通搜的目的各不相同,较难判断用户意图
  • 课程主要研究通用搜索
http://www.lryc.cn/news/522801.html

相关文章:

  • 《Java核心技术II》可中断套接字
  • 基于 Python 的深度学习的车俩特征分析系统,附源码
  • C#读写ini配置文件保存设置参数
  • SwanLab环境变量列表
  • 深度学习入门-CNN
  • 微服务网关,如何选择?
  • SpringBoot集成Mqtt服务实现消费发布和接收消费
  • 在Mac mini上实现本地话部署AI和知识库
  • 一个方法被多个线程同时调用,确保同样参数的调用只能有一个线程执行,不同参数的调用则可以多个线程同时执行
  • 3. MySQL事务并发的问题与解决方法
  • 25/1/15 嵌入式笔记 初学STM32F108
  • MySQL的不同SQL模式导致行为不同?
  • Flink 使用 Kafka 作为数据源时遇到了偏移量提交失败的问题
  • 【日志篇】(7.6) ❀ 01. 在macOS下刷新FortiAnalyzer固件 ❀ FortiAnalyzer 日志分析
  • LSA更新、撤销
  • DevUI 2024 年度运营报告:开源生态的成长足迹与未来蓝图
  • centos 7 Mysql服务
  • React 表单处理与网络请求封装详解[特殊字符][特殊字符]
  • C++ 的 CTAD 与推断指示(Deduction Guides)
  • 【Rust自学】13.2. 闭包 Pt.2:闭包的类型推断和标注
  • 如何将原来使用cmakelist编译的qt工程转换为可使用Visual Studio编译的项目
  • 微软确认Win10停更不碍Microsoft 365使用!未来是否更新成谜
  • Ubuntu、Windows系统网络设置(ping通内外网)
  • 华为OD机试E卷 ---最大值
  • UllnnovationHub,一个开源的WPF控件库
  • Fabric区块链网络搭建:保姆级图文详解
  • Kubernetes (K8s) 权限管理指南
  • IM聊天学习资源
  • 计算机视觉模型的未来:视觉语言模型
  • 【JAVA 基础 第(19)课】Hashtable 类用法和注意细节,是Map接口的实现类