shell的正则表达式1
shell的正则表达式
sort命令
sort命令:以行位单位对文件内容进行排序,也可以根据不同的数据类型来排序比较原则是从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出。
- 语法格式:
sort [选项] 参数
cat file | sort 选项
常用选项:
-n | 按照数字大小进行排序 |
---|---|
-r | 反向排序 |
-u | 等同于uniq,表示相同的数据只显示一行 |
-t | 指定字段分隔符,默认使用[Tab]键分隔 |
-k | 指定排序字段 |
-o | <输出文件>:将排序后的结果转存至指定文件 |
-f | 忽略大小写,会将小写字母都转换为大写字母来进行比较 |
-b | 忽略每行前面的空格 |
-n
-r
-u
-t 、-k
-o
uniq命令
- uniq命令:用于报告或者忽略文件中连续的重复行,常与sort命令结合使用
- 语法格式:
uniq [选项] 参数
cat file | uniq 选项
常用选项:
-c | 进行计数,并删除文件中重复出现的行 |
---|---|
-d | 仅显示连续的重复行 |
-u | 仅显示出现一次的行 |
tr 命令
- tr 命令:常用来对来自标准输入的字符进行替换、压缩和删除
- 语法格式:
tr [选项] [参数]
echo ysj | tr 'ysj' 'YSJ'
YSJ
echo ysj | tr 'a-z' 'A-Z'
YSJ
echo '192.168.17.20' | tr '.' ' '
192 168 17 20
常用选项;
-c | 保留字符集1的字符,其他的字符(包括换行符\n)用字符集2替换 |
---|---|
-d | 删除所有属于字符集1 的字符 |
-s | 将重复出现的字符串压缩为一个字符;用字符集2替换字符集1 |
-t | 字符集2替换字符集1,不加选项同结果 |
-c
-d
-s
删除Windows文件造成的’^M’字符
cat abc.txt | tr -s "\r" "\n" > new_file
或
cat abc.txt | tr -d "\r" > new_file
Linux中遇到换行符(“\n”)会进行回车+换行的操作,回车符反而只会作为控制字符(“^M”)显示,不发生回车的操作;而Windows中要回车符+换行符(“\r” “\n”)才会进行回车+换行的操作,缺少一个控制符或者顺序不对都不能正确的另起一行。
cut命令
cut命令:显示行中的指定部分,删除文件中指定字段(提取字符时每个下标从1开始)
- 语法格式:
cut 参数
cat file | cut 选项
-f | 通过指定哪个字段进行提取。cut命令使用“TAB”作为默认的字段分隔符。 |
---|---|
-d | “TAB”是默认的分隔符,使用此选项可以更改为其他的分隔符 |
–complement | 此选项用于排除所指定的字段 |
–output-delimiter | 更改输出内容的分隔符 |
split命令
- split命令:Linux下将一个大的文件拆分成若干小文件
- 语法格式:
split 选项 参数 原始文件 拆分后文件名前缀
-l | 以行数拆分 |
---|---|
-b | 以大小拆分 |
paste命令
- paste命令:用于合并文件的列
- 语法格式:
paste [-s] [-d<间隔字符>] 文件 . . .
常用选项:
-d<间隔字符> | 用指定的间隔字符取代制表符 |
---|---|
-s | 把多行内容合并为一行进行显示 |
eval命令
命令字前加上eval时,shell会在执行命令之前扫描它两次。eval命令将首先会先扫描命令行进行所有的置换,然后再执行该命令。该命令适用于那些一次扫描无法实现其功能的变量。该命令对变量进行两次扫描。
eval 在执行命令前会把命令中 $XXXX转换成相对应的值后在执行命令