当前位置: 首页 > news >正文

字节终面,一道Linux题难住我了

以下是一道难道系数中高并且高频出现的linux面试题,题目具体要求如下:

linux面试题:

某文件有多列数据,空格隔开,统计第n列单词,打印出现频率最高的5个单词。

解答这道面试题需要用到3个linux命令,分别是awksortuniq

命令1:awk

接下来我们一起复习awk命令的基本语法

awk命令:awk是对文本进行格式化处理的工具,适合做比较复杂的格式话处理

awk命令格式

 命令格式说明:

  • options需要替换成相应的参数;

  • Pattern[Action] 模式以及相应的动作

  • file1,file2,......待格式化处理的文件

命令的必填项如下:

awk '{Action}' file1,file2,......

也就是说,命令中一定要含有Action和file

awk可以将1个或多个文件按照一定的模式匹配出目标结果信息,然后再做动作Action,做什么动作呢?比较常见的就是打印。

1、Action

最常用的是print,默认以空白字符分隔

$0代表整行;$1代表第1段;$2代表第2段;依次类推;$NF代表最后一个字段,多个段落间用逗号分隔符分隔。

2、options参数

默认以空格作为分隔符展示结果信息,可以通过-F选项来指定分隔符

3、awk变量

FS 表示输入字段分隔符,默认是空格字符,一般需要加-v

OFS 表示输出字段分隔符,默认是空格字符,一般需要加-v

NF 表示分隔后的字段数量

NR 表示当前行的行号

awk变量如何用呢?用在awk语法的模式Pattern这部分。

Pattern模式

模式就是条件,也就是说,符合过滤条件的行,awk才会进行格式化处理。

Pattern模式可选性

如果要做高级过滤处理,需要使用Pattern模式

 

 命令2:sort

sort是linux的排序命令

sort将文件的每一行作为一个单位,互相比较,比较原则是从首个字符向后,依次按ASCII码值进行比较,最后将它们按升序输出

  • -r   reverse 反向排序
  • -n   number 按照数字进行排序,默认数字会被当做字符串进行比较

 

 

 

命令3:uniq

接下来我们一起复习uniq命令的基本语法。

uniq是linux的去重命令

uniq用于去除有序文件中的重复(相邻、连续的)行并将结果进行标准输出。

uniq经常和sort结合,为了使uniq起作用,所有的重复行必须是相邻的

  • -c 显示行出现的次数   

 

 

 

         

说明:不连续内容先排序然后再去重

 

 

 

 面试题解析   

linux面试题:

某文件有多列数据,空格隔开,统计第n列单词,打印出现频率最高的5个单词。

假设,某文件名为a.log

假设,第n列为第3列

解题思路如下:

1,格式化输出文件第3列

2,对格式化后文件进行排序,然后去重

 

3,对排序去重后文件进行倒序排序,并统计出现频率最高的5个单词

 

其他类似的词频统计题 就可以套用咱们这个linux命令。 

软件测试面试题合集

我们进阶学习自动化测试必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有字节大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。

这份文档,对于想从事【软件测试】的朋友来说应该是最全面最完整的备战仓库,这个仓库也陪伴我走过了最艰难的路程,希望也能帮助到你!点击下方小卡片均可以分享。 

 

 

 

 

 

 

 

 

 

http://www.lryc.cn/news/14369.html

相关文章:

  • 三、NetworkX工具包实战2——可视化【CS224W】(Datawhale组队学习)
  • 【MySQL】MySQL 架构
  • Python日期时间模块
  • 学以致用——植物信息录入1.0(selenium+pandas+os+tkinter)
  • 什么是压敏电阻
  • Leetcode.901 股票价格跨度
  • vue入门(四)组件基础,$emits简单用法
  • VBA提高篇_27 OptionBOX_CheckBox_Frame_Image_VBA附加控件
  • STM32开发(11)----CubeMX配置独立看门狗(IWDG)
  • 医疗方案 | 星辰天合入选“2022智慧新医信优秀解决方案”
  • 【系统服务实战】tomcat服务的安装实战
  • 【图文详解】Unity存储游戏数据的几种方法
  • SESAM 安装教程
  • 语言文件操作
  • Java面试题--熔断和降级的区别
  • 阅读笔记5——深度可分离卷积
  • Microsoft Dynamics 365:导入License到服务层,通过Business Central Administration Shell
  • centos6.10安装FastDfs出错的问题
  • 基础组件之内存池
  • 前端面试题--了解并简单介绍一下typescript
  • 【pytorch】ModuleList 与 ModuleDict
  • Hive窗口函数语法规则、窗口聚合函数、窗口表达式、窗口排序函数 - ROW NUMBER 、口排序函数 - NTILE、窗口分析函数
  • Go设计模式之函数选项模式
  • ClickHouse 数据类型、函数大小写敏感性
  • nodejs基于vue 网上商城购物系统
  • 掌握MySQL分库分表(一)数据库性能优化思路、分库分表优缺点
  • 何为小亚细亚?
  • 【mircopython】ESP32配置与烧录版本
  • Yaml:通过extrac进行传参,关联---接口关联封装(基于一个独立YAML的文件)
  • vue - vue中对Vant日历组件(calendar)的二次封装