«

linux 删除文件相同的行(去重,去除重复行)

时间:2024-2-22 14:11     作者:韩俊     分类: Linux


linux 删除文件相同的行(去重,去除重复行)。

1. 使用 vi 命令

基于 vi 工具,先用 sort 进行排序,然后使用正则表达式匹配重复的行,最后删除重复的行。

:sort
:g/^\(.*\)$\n^\1$/d

解析:

g:全局匹配
^\(.*\)$:匹配一行任意内容,并将匹配到的内容存放于匹配分组\1中
\n^\1$:匹配与第一行相同的内容
d:删除重复项

2. 使用 linux shell 命令

基于 linux shell 命令,先用 sort 进行排序,然后使用 uniq 命令删除重复行。

sort old_file | uniq > new_file

解析:

old_file:原始文件
new_file:去除重复行之后的文件
|:管道操作符,将上一个命令的结果当作下一个命令的输入
>:重定向符,发送上一个命令的输出到某个文件中

注意:上述两种方法都需要先进行排序,再删除重复行。

标签: linux

热门推荐