当前位置: 首页 > news >正文

【linux】文件与目录命令 - uniq

文章目录

        • 1. 基本用法
        • 2. 常用参数
        • 3. 用法举例
        • 4. 注意事项

uniq 命令用于过滤文本文件中相邻的重复行,并支持统计重复次数或仅保留唯一行。它通常与 sort 命令配合使用,因为 uniq 只识别相邻的重复行。

1. 基本用法
  • 语法:

    uniq [选项] [输入文件] [输出文件]
    
  • 功能:

    • 从文本中去除相邻的重复行。
    • 统计重复行的次数或保留唯一行。
  • 此命令是否系统自带:此命令是系统默认自带的,无需额外安装。


2. 常用参数
  • 基本功能:
    • -c:在每行前显示重复的次数。
    • -d:仅显示重复的行。
    • -u:仅显示不重复的行。
  • 输出控制:
    • -i:忽略大小写比较。
    • -f N:忽略每行的前 N 个字段(以空格分隔)。
    • -s N:忽略每行的前 N 个字符。
    • -z:用空字符而不是换行符分隔行(适用于某些特殊文件)。
  • 辅助选项:
    • --help:显示帮助信息。
    • --version:显示命令版本信息。

3. 用法举例
  • 去除重复行
    从文件中删除相邻的重复行:

    uniq file.txt
    
  • 统计重复行的次数
    在每行前添加重复次数:

    uniq -c file.txt
    
  • 仅显示重复的行

    uniq -d file.txt
    
  • 仅显示不重复的行

    uniq -u file.txt
    
  • 忽略大小写
    忽略大小写,删除重复行:

    uniq -i file.txt
    
  • 结合 sort 使用
    对非相邻重复行去重:

    sort file.txt | uniq
    
  • 忽略字段或字符
    忽略每行前 2 个字段进行比较:

    uniq -f 2 file.txt
    

    忽略每行前 3 个字符进行比较:

    uniq -s 3 file.txt
    
  • 输出到文件
    去重后将结果输出到新文件:

    uniq file.txt output.txt
    

4. 注意事项
  • uniq 只处理相邻的重复行,因此文件需要先用 sort 排序以确保重复行相邻。
  • -c-d 参数通常结合 sort 使用,以便统计所有重复行。
  • 忽略字段或字符时,必须正确理解分隔方式,默认以空格为字段分隔符。
  • 如果文件中存在空字符行,使用 -z 参数以适应特殊需求。
http://www.lryc.cn/news/546570.html

相关文章:

  • 零信任沙箱:为网络安全筑牢“隔离墙”
  • 【金融量化】Ptrade中交易环境支持的业务类型
  • 【Java---数据结构】链表 LinkedList
  • 紧跟 Web3 热潮,RuleOS 如何成为行业新宠?
  • CC++的内存管理
  • Spark核心之02:RDD、算子分类、常用算子
  • 【Resis实战分析】Redis问题导致页面timeout知识点分析
  • 单一职责原则(设计模式)
  • 生理信号概念
  • 安卓内存泄露之DMA-BUF异常增长:Android Studio镜像引起DMA内存泄露
  • android13打基础: 控件checkbox
  • AI应用测试:遇到类ChatGPT的流式接口要如何压测?
  • React面试葵花宝典之二
  • 在日常生活、工作中deepseek能帮我们解决哪些问题
  • 【Java】IO流
  • HTML第三节
  • Visual Studio 2022安装问题解决,提示无法安装Microsoft.VisualStudio.Community.Msi
  • 【代码分享】基于IRM和RRT*的无人机路径规划方法详解与Matlab实现
  • MybatisPlus从入门到精通
  • el-table input textarea 文本域 自适应高度,切换分页滚动失效处理办法
  • 基于Windows11的DockerDesktop安装和布署方法简介
  • ffmpeg源码编译支持cuda
  • 动漫短剧开发公司,短剧小程序搭建快速上线
  • 《2025软件测试工程师面试》接口测试篇
  • 嵌入式学习第二十三天--网络及TCP
  • Elasticsearch:解锁深度匹配,运用Elasticsearch DSL构建闪电般的高效模糊搜索体验
  • SQLAlchemy系列教程:基本数据类型及自定义类型
  • 【Wireshark 02】抓包过滤方法
  • ES怎么查询大于10000条数据
  • 《几何原本》命题I.8