当前位置: 首页 > article >正文

Linux 操作文本文件列数据的常用命令

文章目录

  • Linux 操作文本文件列数据的常用命令
    • 基本列处理命令
    • 高级列处理
    • 列数据转换和排序
    • 列数据统计和分析

Linux 操作文本文件列数据的常用命令

Linux 提供了多种强大的命令来处理文本文件中的列数据,以下是一些最常用的命令和工具:

基本列处理命令

  1. cut - 提取文件的列

    cut -f 1,3 file.txt      # 提取第1和第3列(制表符分隔)
    cut -d',' -f 2 file.csv  # 提取逗号分隔文件的第2列
    
  2. awk - 强大的文本处理工具

    awk '{print $2}' file.txt          # 打印第2列(默认空格分隔)
    awk -F',' '{print $1,$3}' file.csv # 打印逗号分隔文件的第1和第3列
    
  3. paste - 合并文件的列

    paste file1.txt file2.txt  # 水平合并两个文件
    

高级列处理

  1. column - 格式化列输出

    column -t file.txt  # 以表格形式显示列数据
    
  2. datamash - 数据统计和操作

    datamash groupby 1 sum 2 < file.txt  # 按第1列分组并求第2列的和
    
  3. csvkit工具集(需安装) - 专门处理CSV文件

    csvcut -c 1,3 file.csv    # 提取CSV文件的第1和第3列
    csvstat file.csv          # 显示CSV文件的统计信息
    

列数据转换和排序

  1. sort - 按列排序

    sort -k2 file.txt      # 按第2列排序
    sort -t',' -k3n file.csv # 按逗号分隔的第3列数值排序
    
  2. join - 基于共同列合并文件

    join -j1 file1.txt file2.txt  # 基于第1列合并两个文件
    
  3. tr - 字符转换(常用于列数据)

    cut -f1 file.txt | tr 'a-z' 'A-Z'  # 提取第1列并转为大写
    

列数据统计和分析

  1. uniq - 统计列中唯一值

    cut -f1 file.txt | sort | uniq -c  # 统计第1列各值的出现次数
    
  2. wc - 统计列数/行数

    wc -l file.txt  # 统计行数
    
  3. grep - 基于列的过滤

    awk '{print $2}' file.txt | grep 'pattern'  # 在第2列中搜索模式
    

这些命令可以单独使用,也可以通过管道组合使用,形成强大的文本处理流水线。

http://www.lryc.cn/news/2386453.html

相关文章:

  • IP、子网掩码、默认网关、DNS
  • 华为OD机试真题——字符串加密 (2025B卷:100分)Java/python/JavaScript/C/C++/GO最佳实现
  • 角度回归——八参数检测四边形Gliding Vertex
  • JVM 高质量面试题
  • AI助力,制作视频裁剪软件
  • SQL注入基础
  • 使用 A2A Python SDK 实现 CurrencyAgent
  • qt浏览文件支持惯性
  • Python类的力量:第六篇:设计模式——Python面向对象编程的“架构蓝图”
  • [实战]用户系统-2-完善登录和校验以及VIP
  • 负载均衡笔记
  • 印度语言指令驱动的无人机导航!UAV-VLN:端到端视觉语言导航助力无人机自主飞行
  • mysql都有哪些锁?
  • 解锁未来AI:使用DACA模式和Agentic技术提高开发效率
  • HarmonyOS NEXT 使用 relationalStore 实现数据库操作
  • R语言学习--Day04--数据分析技巧
  • SRS流媒体服务器之RTC播放环境搭建
  • Android 性能优化入门(三)—— ANR 问题分析
  • 用HTML5实现实时ASCII艺术摄像头
  • 鸿蒙Flutter实战:22-混合开发详解-2-Har包模式引入
  • 游戏引擎学习第302天:使用精灵边界进行排序
  • SpringBoot+MyBatis
  • wireshark: Display Filter Reference
  • Java基础 Day19
  • VMware+Windows 11 跳过安装阶段微软账号登录
  • HarmonyOS开发-应用间跳转
  • 网工每日一练
  • 使用 Navicat 17 for PostgreSQL 时,请问哪个版本支持 PostgreSQL 的 20150623 版本?还是每个版本都支持?
  • 校园二手交易系统
  • 基于pycharm,python,flask,sklearn,orm,mysql,在线深度学习sql语句检测系统