当前位置: 首页 > news >正文

力扣日记10.31-【栈与队列篇】前 K 个高频元素

力扣日记:【栈与队列篇】前 K 个高频元素

日期:2023.10.31
参考:代码随想录、力扣

347. 前 K 个高频元素

题目描述

难度:中等

给你一个整数数组 nums 和一个整数 k ,请你返回其中出现频率前 k 高的元素。你可以按 任意顺序 返回答案。

示例 1:

输入: nums = [1,1,1,2,2,3], k = 2
输出: [1,2]

示例 2:

输入: nums = [1], k = 1
输出: [1]

提示:

  • 1 <= nums.length <= 105
  • k 的取值范围是 [1, 数组中不相同的元素的个数]
  • 题目数据保证答案唯一,换句话说,数组中前 k 个高频元素的集合是唯一的

进阶:你所设计算法的时间复杂度 必须 优于 O(n log n) ,其中 n 是数组大小。

题解

class Solution {
#define SOLUTION 2
public:vector<int> topKFrequent(vector<int>& nums, int k) {
#if SOLUTION == 1// 时间复杂度: O(n) + O(n) + O(nlogn) + O(k) = O(nlogn)// 空间复杂度: O(n+n)unordered_map<int, int> cnt;for (const auto& n: nums) {cnt[n]++;}// 将哈希表的内容复制到 vector// 使用迭代器范围构造函数(iterator range constructor)创建 sortedVector// 这个构造函数接受两个迭代器,它会遍历 cnt 中的元素,然后复制它们到 sortedVector 中vector<pair<int, int>> sortedVector(cnt.begin(), cnt.end());// 按第二个值的大小对 vector 进行排序(从大到小)sort(sortedVector.begin(), sortedVector.end(), [](const pair<int, int>& a, const pair<int, int>& b) { // 匿名函数作为比较器参数return a.second > b.second; // 前者大于后者时返回true,表示前者应该在后者前面(大在前、小在后)});// 取前k个元素int count = 0;vector<int> result;for (const auto& pair : sortedVector) {result.push_back(pair.first);count++;if (count >= k) break;}return result;}
#elif SOLUTION == 2// unordered_map + 小顶堆// O(nlogk), O(n+k)// 之所以用堆,是因为没必要对n个元素都进行排序,只需要维护前k个元素即可// 1. 首先用map遍历一遍数组,确定每个数出现的频率unordered_map<int, int> cnt;for (const auto& n: nums) {cnt[n]++;}// 2. 使用小顶堆遍历map,维护出现频率最高的前k个元素// 小顶堆:本质是一个二叉树,每个父结点的值小于子结点,即根结点的值是最小的,值从小到大排列// 关于为什么用小顶堆而不是用大顶堆:/*如果是大顶堆的话,由于其仅维护k个元素,每次push进元素时都需要pop掉根结点元素而根结点是值最大的元素,这样的话会导致最后大顶堆中都是出现频率最低的前k个元素所以要用小顶堆,每次pop元素弹出值最小的元素,维护出现频率最高的前k个元素*/// 小顶堆通过优先级队列实现priority_queue<pair<int, int>, vector<pair<int, int>>, mycomparison> pri_que;// 用固定大小为k的小顶堆,扫面所有频率的数值for (unordered_map<int, int>::iterator it = cnt.begin(); it != cnt.end(); it++) {pri_que.push(*it); // 把it指向的<key,value>放进队列if (pri_que.size() > k) { // 如果堆的大小大于了K,则队列弹出,保证堆的大小一直为kpri_que.pop();}}// 3. 找出前K个高频元素,因为小顶堆先弹出的是最小的,所以倒序来输出到数组vector<int> result(k);for (int i = k - 1; i >= 0; i--) {result[i] = pri_que.top().first;pri_que.pop();}return result;}// 小顶堆class mycomparison {public:bool operator()(const pair<int, int>& lhs, const pair<int, int>& rhs) {return lhs.second > rhs.second; // 为什么是>(大的在前,小的在后???)}};
#endif
};

复杂度

  • 哈希map + 快排:
    • 时间复杂度:O(nlogn)
    • 空间复杂度:O(n)
  • 哈希map + 小顶堆
    • 时间复杂度:O(nlogk)
    • 空间复杂度:O(n)

思路总结

  • 解法1:哈希map + 快排
    • 哈希map不能直接排序,要转换为vector才能进行排序
      • 1.将哈希表的内容复制到 vector
      • 2.使用迭代器范围构造函数(iterator range constructor)创建 sortedVector
        • 这个构造函数接受两个迭代器,它会遍历 cnt 中的元素,然后复制它们到 sortedVector 中
        • vector<pair<int, int>> sortedVector(cnt.begin(), cnt.end());
      • 3.按第二个值的大小对 vector 进行排序(从大到小)
      sort(sortedVector.begin(), sortedVector.end(), [](const pair<int, int>& a, const pair<int, int>& b) { // 匿名函数作为比较器参数return a.second > b.second; // 前者大于后者时返回true,表示前者应该在后者前面(大在前、小在后)});
      
  • 解法2:哈希map + 小顶堆
    • 之所以用小顶堆而不用快排,是因为没必要对n个元素都进行排序,只需要维护前k个元素即可(快排需要对n个元素进行排序,O(nlogn),小顶堆每次pop和push一个元素只需要logk,即对所有元素的总时间复杂度为O(nlogk)
    • 思路步骤:
    • 1.首先用map遍历一遍数组,确定每个数出现的频率
    • 2.使用小顶堆遍历map,维护出现频率最高的前k个元素
      • 小顶堆:本质是一个二叉树,每个父结点的值小于子结点,即根结点的值是最小的,值从小到大排列
      • 关于为什么用小顶堆而不是用大顶堆:
        如果是大顶堆的话,由于仅维护k个元素,每次push进元素时都需要pop掉根结点元素
        而根结点是值最大的元素,这样的话会导致最后大顶堆中都是出现频率最低的前k个元素
        所以要用小顶堆,每次pop元素弹出值最小的元素,维护出现频率最高的前k个元素
      • 小顶堆通过优先级队列实现:其中比较器设置为"左值>右值"(可能与优先级队列的底层实现有关)—— 注意这与快排cmp是相反的,快排cmp“左值>右值"是从大到小降序排列,而优先级队列"左值>右值"是小顶堆(根小子大)
    • 3.找出前K个高频元素,因为小顶堆先弹出的是最小的(取first即元素的键),所以倒序来输出到数组
  • 学会小顶堆的实现以及小顶堆遍历的写法:
// 小顶堆实现
class mycomparison {
public:bool operator()(const pair<int, int>& lhs, const pair<int, int>& rhs) {return lhs.second > rhs.second;}
};
// 优先级队列定义与遍历
priority_queue<pair<int, int>, vector<pair<int, int>>, mycomparison> pri_que;
// 参数1:优先级队列的元素类型,参数2:优先级队列自身类型,参数3:优先级队列的比较器(决定是小顶堆还是大顶堆)
for (unordered_map<int, int>::iterator it = cnt.begin(); it != cnt.end(); it++) {pri_que.push(*it); // 把it指向的<key,value>放进队列if (pri_que.size() > k) { // 如果堆的大小大于了K,则队列弹出,保证堆的大小一直为kpri_que.pop();}
}
http://www.lryc.cn/news/213412.html

相关文章:

  • TensorFlow案例学习:简单的音频识别
  • css小程序踩坑记录
  • Android sqlite分页上传离线订单后删除
  • Flask基本教程以及Jinjia2模板引擎简介
  • Django实战项目-学习任务系统-兑换物品管理
  • jmeter和postman你选哪个做接口测试?
  • mac版本 Adobe总是弹窗提示验证问题如何解决
  • 钡铼技术ARM工控机在机器人控制领域的应用
  • HTML+CSS+JS实现计算器
  • Git工作原理和常见问题处理方案
  • C++-实现一个简单的菜单程序
  • Git更新 fork 的仓库
  • chorme安装esay scholar及chrome 无法从该网站添加应用、扩展程序和用户脚本解决方案
  • 数据库-扩展语句,约束方式
  • 精密数据工匠:探索 Netty ChannelHandler 的奥秘
  • Python四种基本结构的操作
  • Eureka:com.netflix.discovery.TimedSupervisorTask - task supervisor timed out
  • 1.spark standalone环境安装
  • 【问题解决】 avue dicUrl 动态参数加载字典数据(已解决)
  • ​学习一下,什么是预包装食品?​
  • 从零开始学习搭建量化平台笔记
  • 【whisper】在python中调用whisper提取字幕或翻译字幕到文本
  • git diff对比差异时指定或排除特定的文件和目录
  • 数据结构介绍与时间、空间复杂度
  • (c语言进阶)字符串函数、字符分类函数和字符转换函数
  • 解决MySQL大版本升级导致.Net(C#)程序连接报错问题
  • Java 将对象List转为csv文件并上传远程文件服务器实现方案
  • 分享8个分布式Kafka的使用场景
  • 【再见了暗恋对象 朋友们看完之后的一些感悟】
  • JSON和Protobuf序列化