通配符和正则表达式

通配符和正则表达式

通配符

由shell解析,并且一般用于匹配文件名,实际上就是shell解释器去解析的特殊符号。多用于find,ls , cp等命令。

通配符是由shell处理的, 它只会出现在 命令的“参数”里(它不用在命令名称里, 也不用在操作符上)。当shell在“参数”中遇到了通配符时,shell会将其当作路径或文件名去在磁盘上搜寻可能的匹配:若符合要求的匹配存在,则进行代换(路径扩展);否则就将该通配符作为一个普通字符传递给“命令”,然后再由命令进行处理。总之,通配符 实际上就是一种shell实现的路径扩展功能。在 通配符被处理后, shell会先完成该命令的重组,然后再继续处理重组后的命令,直至执行该命令。

shell常见通配符:

字符 含义 实例
* 匹配 0 或多个字符 a*b a与b之间可以有任意长度的任意字符, 也可以一个也没有, 如aabcb, axyzb, a012b, ab。
? 匹配任意一个字符 a?b a与b之间必须也只能有一个字符, 可以是任意字符, 如aab, abb, acb, a0b。
[list] 匹配 list 中的任意单一字符注:备注记录几个特殊单一符号表示。 a[xyz]b a与b之间必须也只能有一个字符, 但只能是 x 或 y 或 z, 如: axb, ayb, azb。a[[:upper:]]b a与b之间有且只能有一个大写字符,如aSb,aQb等。
[!list] 或[^list] 匹配 除list 中的任意单一字符 a[^0-9]b, a与b之间必须也只能有一个字符, 但不能是阿拉伯数字, 如axb, aab, a-b。
[c1-c2] 匹配 c1-c2 中的任意单一字符 如:[0-9] [a-z] a[0-9]b 0与9之间必须也只能有一个字符 如a0b, a1b… a9b。

备注:几种常见特殊的符号表示:

1
2
> ` ``[[:upper:]]:所有大写字母`` ``[[:lower:]]:所有小写字母`` ``[[:alpha:]]:所有字母`` ``[[:digit:]]:所有数字`` ``[[:alnum:]]:所有的字母和数字`` ``[[:space:]]:所有空白字符`` ``[[:punct:]]:所有标点符号`
>

综合例子应用:

1:显示/var目录下所有以l开头,以一个小写字母结尾,且中间出现一位任意字符的文件或目录;

ls -d /var/l?[[:lower:]]

2:显示/etc目录下,以任意一位数字开头,且以非数字结尾的文件或目录;

ls -d /etc/[0-9]*[^0-9]

3:复制/etc目录下,所有以.conf结尾,且以m,n,r,p开头的文件或目录至/tmp/conf.d/目录下;

cp -r /etc/[mnrp]*.conf /tmp/conf.d/

正则表达式

用在字符串处理上面的一项表达式,主要用于文本内容中的字符串搜索和替换的。多用于sed, awk,grep等工具。

区别

  1. 用途不同

    1
    通配符用于通配文件名,正则表达式用于匹配文本内容
  2. 使用地点不同

    1
    2
    通配符通常只能用于shell,被shell自解释。
    正则表达式需要被正则引擎解析,需要用于支持正则表达式的代码或命令中。

通配符和正则表达式的区别

对于通配符(* , ?),不存在匹配前一个字符的情况,所以和?表示匹配当前的字符,而正则表达式(./\/?/+)里面的*,?,+表示匹配前一个字符,. 表示匹配任意一个字符。