当前位置: 首页 > article >正文

【JAVA】中文我该怎么排序?


📘 Java 中文排序教学文档(基于 Collator)


🧠 目录

  1. 概述
  2. Java 中字符串排序的默认行为
  3. 为什么需要 Collator
  4. 使用 Collator 进行中文排序
  5. 升序 vs 降序排序
  6. 自定义对象字段排序
  7. 多字段排序示例
  8. 总结对比表
  9. 附录:完整代码示例

1. 📌 概述

Java 的 List.sort() 方法通过传入一个比较器(Comparator),决定集合中元素的排列顺序。但 Java 默认的字符串比较并不能正确排序中文(尤其是按拼音顺序),这就需要使用 Collator 来实现符合中文语义的排序方式。


2. 🔍 Java 中字符串排序的默认行为

Java 默认使用 Unicode 编码值 进行字符串比较:

List<String> list = Arrays.asList("张三", "李四", "王五");
Collections.sort(list); // 默认排序方式

此时的排序结果可能是乱码或者无意义的顺序,因为它只是按字符的 Unicode 值排列。


3. ❓ 为什么需要 Collator

java.text.Collator 是 Java 提供的 本地化字符串比较工具类,支持中文、日文、韩文等语言规则的比较。

使用 Collator 可以实现:

  • 按拼音排序(中文首字母)
  • 支持不同 Locale(本地语言规则)

4. ✅ 使用 Collator 进行中文排序

基本示例:

import java.text.Collator;
import java.util.*;public class ChineseSortExample {public static void main(String[] args) {List<String> names = Arrays.asList("张三", "李四", "王五");Collator collator = Collator.getInstance(Locale.CHINA);names.sort(collator); // 升序:拼音 A → ZSystem.out.println(names);}
}

5. 🔼 升序 vs 🔽 降序排序

升序(拼音从 A → Z):

list.sort((a, b) -> Collator.getInstance(Locale.CHINA).compare(a, b));

降序(拼音从 Z → A):

list.sort((a, b) -> Collator.getInstance(Locale.CHINA).compare(b, a));

记忆技巧compare(a, b) 表示“a 和 b 谁更小”,如果返回负数表示 a 更小,应该排前面;若返回正数表示 a 更大,应该排后面。


6. 🧾 自定义对象字段排序(按对象中的中文字段)

如果你有如下对象:

class Person {private String name;public String getName() { return name; }
}

你可以按 name 字段排序:

升序:

list.sort((o1, o2) ->Collator.getInstance(Locale.CHINA).compare(o1.getName(), o2.getName()));

降序:

list.sort((o1, o2) ->Collator.getInstance(Locale.CHINA).compare(o2.getName(), o1.getName()));

7. 🌈 多字段排序示例

如果你想先按姓名拼音降序,再按时间升序,可以这样写:

list.sort((o1, o2) -> {Collator collator = Collator.getInstance(Locale.CHINA);int nameCompare = collator.compare(o2.getName(), o1.getName()); // 姓名降序if (nameCompare != 0) return nameCompare;return o1.getCreateTime().compareTo(o2.getCreateTime()); // 时间升序
});

8. 📊 总结对比表

方式写法效果
默认排序Collections.sort(list)按 Unicode 排序,中文不正确
拼音升序compare(a, b)拼音 A → Z
拼音降序compare(b, a)拼音 Z → A
对象字段升序compare(o1.getField(), o2.getField())自定义字段排序
对象字段降序compare(o2.getField(), o1.getField())字段降序
多字段组合使用 if (result != 0) 判断后继续比较第二字段多条件排序

9. 🧪 附录:完整中文排序对象示例

import java.text.Collator;
import java.util.*;class User {private String commitUser;private Date commitTime;public User(String commitUser, Date commitTime) {this.commitUser = commitUser;this.commitTime = commitTime;}public String getCommitUser() { return commitUser; }public Date getCommitTime() { return commitTime; }@Overridepublic String toString() {return commitUser + " - " + commitTime;}
}public class ChineseSort {public static void main(String[] args) {List<User> users = new ArrayList<>();users.add(new User("李四", new Date(100000)));users.add(new User("王五", new Date(50000)));users.add(new User("陈七", new Date(150000)));users.sort((o1, o2) -> {Collator collator = Collator.getInstance(Locale.CHINA);int nameCmp = collator.compare(o2.getCommitUser(), o1.getCommitUser()); // 名字降序if (nameCmp != 0) return nameCmp;return o1.getCommitTime().compareTo(o2.getCommitTime()); // 时间升序});users.forEach(System.out::println);}
}
http://www.lryc.cn/news/2386516.html

相关文章:

  • 《C 语言字符串操作从入门到实战(下篇):strncpy/strncat/strstr 等函数原理与实现》
  • 百度飞桨PaddleOCR 3.0开源发布 OCR精度跃升13%
  • Xilinx 7Series\UltraScale 在线升级FLASH STARTUPE2和STARTUPE3使用
  • 数字孪生驱动的离散制造智能升级:架构设计与工程实践
  • 9.4在 VS Code 中配置 Maven
  • mmaction2——tools文件夹下
  • 新能源汽车充电桩资源如何利用资源高效配置?
  • python 程序实现了毫米波大规模MIMO系统中的信道估计对比实验
  • NTFS0x90属性和0xa0属性和0xb0属性的一一对应关系是index_entry中的index_node中VCN和runlist和bitmap
  • PDF 编辑批量拆分合并OCR 识别
  • LeetCode --- 450周赛
  • SpringBoot中消息转换器的选择
  • (初级)前端初学者入门指南:HTML5与CSS3核心知识详解
  • 基于点标注的弱监督目标检测方法研究
  • 【RichTextEditor】 【分析2】RichTextEditor设置文字内容背景色
  • 超越OpenAI CodeX的软件工程智能体:Jules
  • Qt实战教程:设计并实现一个结构清晰、功能完整的桌面应用
  • 轻量化MEC终端 特点
  • NIST提出新型安全指标:识别潜在被利用漏洞
  • List介绍
  • 正则表达式全解:一文学会正则表达式【附在线正则表达式练习网站】
  • Nginx-详解(二)
  • 解决 IntelliJ IDEA 配置文件中文被转义问题
  • MCP、MCPHub、A2A、AG-UI概述
  • 计算机视觉与深度学习 | Python实现CEEMDAN-ISOS-VMD-GRU-ARIMA时间序列预测(完整源码和数据)
  • [Linux]磁盘分区及swap交换空间
  • JAVA面向对象——对象和类的基本语法
  • Linux常见指令合集+知识点
  • nginx 基于IP和用户的访问
  • 【Linux】系统程序−进度条