当前位置: 首页 > news >正文

【C++算法】76.优先级队列_前 K 个高频单词

文章目录

    • 题目链接:
    • 题目描述:
    • 解法
    • C++ 算法代码:


题目链接:

692. 前 K 个高频单词


题目描述:

b49ba5a292da152e1da47abd59fc25ed


解法

利用堆来解决TopK问题

  1. 预处理一下原始的字符串数组,用一个哈希表统计一下每一个单词出现的频次。
  2. 创建一个大小为k的堆
    1. 频次:小根堆
    2. 字典序(频次相同的时候):大根堆
  3. 循环
    1. 让元素依次进堆
    2. 判断
  4. 提取结果

C++ 算法代码:

class Solution 
{// 定义类型别名,PSI表示<单词, 频次>对typedef pair<string, int> PSI;// 自定义比较器,用于优先队列中元素的排序struct cmp{bool operator()(const PSI& a, const PSI& b){// 如果两个单词出现频次相同if(a.second == b.second) {// 按字典序排列,较小的单词优先级较低// 注意:因为我们需要较大的字典序在堆顶,所以用< return a.first < b.first;}// 按频次排列,较大的频次优先级较低// 注意:这里使用>而不是<,是为了创建一个小根堆// 这样频次较小的元素会在堆顶return a.second > b.second;}};public:vector<string> topKFrequent(vector<string>& words, int k) {// 1. 统计每个单词的出现频次unordered_map<string, int> hash;for(auto& s : words) hash[s]++;// 2. 创建一个大小为k的小根堆// 这里的小根堆是按照我们自定义的比较器排序的// 频次低的在堆顶,频次相同则字典序大的在堆顶priority_queue<PSI, vector<PSI>, cmp> heap;// 3. 实现TopK的核心逻辑for(auto& psi : hash){heap.push(psi);  // 将当前单词及其频次加入堆// 如果堆大小超过k,弹出堆顶(频次最小的元素)// 这样堆始终保持k个频次最高的元素if(heap.size() > k) heap.pop();}// 4. 提取最终结果vector<string> ret(k);// 注意反向填充结果数组// 因为堆中的元素是按频次从小到大、频次相同则按字典序从大到小排列的// 我们需要从堆顶依次取出元素,反向填充到结果数组中// 这样最终结果就是按频次从大到小、频次相同则按字典序从小到大排列for(int i = k - 1; i >= 0; i--){ret[i] = heap.top().first;  // 取出堆顶元素(单词)heap.pop();                  // 弹出堆顶}return ret;  // 返回结果数组}
};
http://www.lryc.cn/news/603896.html

相关文章:

  • 【车联网kafka】Kafka核心架构与实战经验(第一篇)
  • 13、select_points_object_model_3d解析
  • 【2025年7月29日】TrollStore巨魔商店恢复在线安装
  • 通缩漩涡中的测量突围:新启航如何以国产 3D 白光干涉仪劈开半导体成本困局?
  • 磁悬浮转子同频振动:自适应陷波器设计与稳定性深度解析(附MATLAB代码)
  • 开源数据库PostgreSQL专家技术
  • AI药师助手 + 药品图谱系统完整操作分析(python版)
  • 基于AI代码疫苗技术的开源软件供应链安全治理
  • 出现错误,Microsoft store初始化失败。请尝试刷新或稍后返回。
  • 多模态融合 + 动态记忆机制,突破模态壁垒,超火研究方向
  • Xilinx高性能低延时PCIe-DMA控制器IP,SGDMA,QDMA,RDMA,CDMA,V4L2驱动,视频采集、AD采集
  • C#基础篇 - 正则表达式入门
  • 在Word和WPS文字中让文字无极限缩放,用键盘更高效
  • C51 中断
  • Python批量生成N天前的多word个文件,并根据excel统计数据,修改word模板,合并多个word文件
  • 理解“无界队列”与“有界队列”及其适用场景
  • git使用lfs解决大文件上传限制
  • 2411.按位或最大的最小子数组长度
  • gTest测试框架的安装与配置
  • 三、Linux用户与权限管理详解
  • 【目标检测】小样本度量学习
  • 量子计算革命:重新定义计算的边界与未来
  • DNS污染与劫持
  • Python爬虫02_Requests实战网页采集器
  • MoR vs MoE架构对比:更少参数、更快推理的大模型新选择
  • Ubuntu20.04子系统
  • Oracle发布MCP Server,自然语言交互说“人话”
  • AUTOSAR Mcal Gpt - 模块介绍
  • LeetCode|Day29|1009. 十进制整数的反码|Python刷题笔记
  • Jenkins 详解