14. [^ ] 跟[! ]差在哪? (wildcard)


这个题目说穿了, 就是要探讨Wildcard与Regular Expression的差别的。 这也是很多初学shell的朋友很容易混淆的地方。

首先,让我们回到十三问之第2问, 再一次将我们提到的command line format 温习一次:

  1. command_name options arguments

同时,也再来理解一下,我在第5章所提到的变量替换的特性:

  1. 先替换,再重组 command line!

有了这个两个基础后,再让我们来看Wildcard是什么回事吧。

Part-I Wildcard (通配符)


首先,

  1. `Wildcard` 也是属于 `command line` 的处理工序,作用于 `arguments` 里的 `path` 之上。

没错,它不用在command_name,也不用在options上。 而且,若argument不是path的话,那也与wildcard无关。

换句更为精确的定义来讲,

  1. `wildcard`是一种命令行的路径扩展(path expansion)功能。

提到这个扩展,那就不要忘了 command line的“重组”特性了!

是的,这与变量替换(variable subtitution)及 命令替换(command substitution)的重组特性是一样的。

也就是在wildcard进行扩展后, 命令行会先完成重组,才会交给shell来处理。

了解了wildcard的扩展与重组特性后, 接下来,让我们了解一些常见的wildcard吧。

wildcard 功能
* 匹配0个或多个字符
? 匹配任意单一字符
[list] 匹配list中任意单一字符
[!list] 匹配不在list中任意单一字符
{string1,string2,…} 匹配string1或者stsring2或者(…)中其一字符串

Note: list 中可以指定单个字符,如abcd, 也可以指定ASCII字符的起止范围,如 a-d。 即[abcd] 与 [a-d] 是等价的,称为一个自定义的字符类。

例如:

  1. a*b # a 与 b 之间可以有任意个字符(0个或多个),如aabcb, axyzb, a012b,ab等。
  2. a?b # a 与 b 之间只能有一个字符,但该字符可以任意字符,如 aab, abb, acb, azb等。
  3. a[xyz]b # a 与 b 之间只能有一个字符,但这个字符只能是x或者y或者z,如:axb, ayb, azb这三个。
  4. a[!0-9]b# a 与 b 之间只能有一个字符,但这个字符不能是阿拉伯数字,如aab,ayb,a-b等。
  5. a{abc,xyz,123}b # a 与 b之间只能是abc或者xyz或者123这三个字串之一,扩展后是aabcb,axyzb,a123b。
  1. [! ] 中的! 只有放在第一位时,才有取反的功效。 eg: [!a]* 表示当前目录下不以a开头的路径名称; /tmp/[a\!]*表示/tmp目录下所有以a 或者 ! 开头的路径名称;

    思考:为何!前面要加\呢?提示是十三问之4.

  2. [ - ]-左右两边均有字符时,才表示一个范围,否则,仅作-(减号)字符来处理。 举例: /tmp/*[-z]/[a-zA-Z]* 表示/tmp 目录下所有以z或者-结尾的子目录中, 以英文字母(不分大小写)开头的目录名称。

  3. 以*或?开头的wildcard不能匹配隐藏文件(即以.开头的文件名)。 eg: *.txt并不能匹配.txt但能匹配1.txt这样的路径名。 但1*txt及1?txt均可匹配1.txt这样的路径名。

基本上,要掌握wildcard并不难, 只要多加练习,再勤于思考,就能灵活运用了。

再次提醒:

  1. 别忘了wildcard"扩展" + "重组" 这个重要特性,而且只作用在 argumentpath上。

比方说, 假如当前目录下有: a.txt b.txt c.txt 1.txt 2.txt 3.txt 这几个文件。

当我们在命令行中执行ls -l [0-9].txt的命令行时, 因为wildcard处于argument的位置上,

于是根据匹配的路径,扩展为: 1.txt 2.txt 3.txt, 在重组出ls -l 1.txt 2.txt 3.txt 这样的命令行。

因此,你在命令行上敲 ls -l [0-9].txtls -l 1.txt 2.txt 3.txt 输出的结果是一样, 原因就是在于此。