当前位置: 首页 > news >正文

优化记录 -- 记一次搜索引擎(SOLR)优化

业务场景

某服务根据用户相关信息,使用搜索引擎进行数据检索

软件配置

solr 1台:32c 64g 数据10gb左右,版本 7.5.5
应用服务器1台:16c 64g
应用程序 3节点

问题产生现象

1、因业务系统因处理能不足,对业务系统硬件平台进行升级,升级变更为 16c64g —> 32c64g 增加 16c
2、业务系统升级,处理能力增加,对原搜索引擎服务器的qps有所提升,原qps 1500 提升至 2600左右
3、搜索引擎负载发生极大变化,从原始负载60左右,提升至85左右,远超预期

分析问题

应用层:

链接数未提升,仅提升qps,应该不会对solr 造成过大的影响

SOLR 层

分析缓存

检查os 剩余内存

使用 htop 观测剩余内存还有将近30g,因此决定调整 solr 相关缓存配置
在这里插入图片描述

分析 SOLR 线程栈

1、使用 jstack pid >pid.jstack 导出solr 线程运行情况
2、通过 IBM JCA469.jar 分析工具,检查线程锁
在这里插入图片描述
发现500+线程等待log锁
在这里插入图片描述
检查 solr 相关日志配置
发现 solr 7.5.5 使用 log4j2日志框架,且使用同步日志输出模式
在这里插入图片描述

调整方案

增加SOLR缓存,提升缓存命中率

原始配置

  <filterCache class="solr.FastLRUCache"maxRamMB="2048"autowarmCount="150000"/><queryResultCache class="solr.LRUCache"size="65536"initialSize="65536"autowarmCount="0"/><documentCache class="solr.LRUCache"size="65536"initialSize="65536"autowarmCount="0"/>

更新后配置

  <filterCache class="solr.FastLRUCache"maxRamMB="2048"autowarmCount="150000"/><queryResultCache class="solr.LRUCache"size="131070"initialSize="131070"autowarmCount="0"/><documentCache class="solr.LRUCache"size="131070"initialSize="131070"autowarmCount="0"/>

增加JVM 内存

Xmx16g ---> Xmx24g

使用全局异步日志打印日志输出

在 solr.in.sh 添加JVM启动参数

-Dlog4j2.contextSelector=org.apache.logging.log4j.core.async.AsyncLoggerContextSelector

调整后效果如下

os 负载情况

调整前
在这里插入图片描述
调整后
在这里插入图片描述

线程锁情况

在这里插入图片描述
调整后
在这里插入图片描述

http://www.lryc.cn/news/239886.html

相关文章:

  • 电力感知边缘计算网关产品设计方案-网关系统通信架构方案
  • RabbitMQ消息的可靠性
  • Opengl 纹理(知识点)
  • Centos 7 安装yum(针对python卸载yum出错)
  • substr()与substring()的区别
  • MacOS 成为恶意软件活动的目标
  • 从0开始学习JavaScript--JavaScript生成器
  • householder进行矩阵QR分解
  • 利用叉积计算向量的旋向及折线段的拐向
  • Vmware 扩展硬盘空间后的操作-Ubuntu
  • Rust错误处理:Result
  • 1410.HTML 实体解析器
  • Python通过串口收发文件
  • [crash] cxa_pure_virtual 崩溃分析与原理
  • 2023年学习Go语言是否值得?探索Go语言的魅力
  • 【C++11】=default与=delete关键字使用详解
  • [开源]Web端的P2P文件传输工具,简单安全高效的P2P文件传输服务
  • 边缘计算多角色智能计量插座 x 资产显示标签:实现资产追踪与能耗管理的无缝结合
  • chromium证书校验流程SM2WithSM3(C++源码说明)
  • 3分钟使用 WebSocket 搭建属于自己的聊天室(WebSocket 原理、应用解析)
  • Jina AI 的 8K 向量模型上线 AWS Marketplace,支持本地部署!
  • ubuntu上查看各个进程的实时CPUMEM占用的办法
  • 电大搜题——打开学习之门的最佳选择
  • [论文笔记] Scaling Laws for Neural Language Models
  • 【每日OJ —— 622. 设计循环队列】
  • 【Vue】生命周期一文详解
  • JVM垃圾回收相关算法
  • crontab 无法激活、启动 pyenv failed to activate virtualenv
  • 系列八、key是弱引用,gc垃圾回收时会影响ThreadLocal正常工作吗
  • pytorch中.to(device) 和.cuda()的区别