1.1通配符(wildcard)说明
shell是一个命令解释器,它是内核的外壳,用于完成操作系统使用者与内核的沟通,因此,通配符实际上就是一个shell解释器去解析的符号,它的特殊涵义是由shell这个命令解释器赋予的。
1.2通配符使用说明
* 任意长度的任意字符。
? 任意的单个字符(必须有一个字符)。
[ ] 指定范围内的单个字符。
[0-9] 0到9中的一个字符。
[a-z] a到z中的一个字符。
[0-9a-z] 0到9和a到z中的一个字符。
[^ ] 指定范围外的单个字符。
[^0-9] 代表除了0到9外的一个字符。
特殊的字符组:
[[:alnum:]] 大小写字母和数字,不包括下划线
[[:alpha:]] 大小写字母
[[:blank:]] 空格和制表符
[[:cntrl:]] 控制字符,也就是ASCII码表中1-31号的字符
[[:digit:]] 0-9之间的数字,与\d的含义相同
[[:graph:]] 所有可以显示的字符
[[:lower:]] 小写字母
[[:print:]] alnum的另外一种表示方法
[[:punct:]] 所有标点字符
[[:space:]] 空白字符,与\s的含义相同
[[:upper:]] 所有大写字母
[[:xdigit:]] 所有16进制数字,包括0-9a-fA-F
1.3通配符的使用范围
在shell命令行和shell脚本中都可以使用通配符,在ls、find等命令中我们常使用通配符去匹配目标。
2.1正则表达式(regular expression)说明
它是一种对字符串匹配模式的描述和规定 —— 并且是一种标准。Linux中awk、grep、sed等工具都支持这种标准,所以你可以在这些工具中使用正则表达式这种“匹配模式标准”。
2.2正则表达式使用说明
正则表达式中仍然支持通配符中的字符组。
.一个点 匹配任意1个字符
*星号 匹配前面模式中的0个或者任意个
a*b能匹配 b ab aab
.*组合 任意长度的任意字符
\?问号 匹配前面模式中的0个或者1个
\{m,n\} 匹配前面的字符至少m次最多n次。
[ ] 指定范围内的单个字符。
[^ ] 指定范围外的单个字符。
位置指定:
^锁定行首 此字符后的字符必须出现在行首。
$锁定行尾 从字符之前的字符必须出现在行尾。
^$ 匹配空行。
\< 其后面的字符必须以单词首部出现。
\> 其前面的字符必须以单词尾部出现。
\<root\> 代表匹配root这个单词。
\(\) ab* 代表b出现0次或多次
\(ab\)* 代表ab出现0次或多次,此时ab为一个组。
向后引用 \1: 引用第一个左括号以及与之对应的右括号所包括的所有内容。
2.3正则表达式的使用范围
awk、grep、sed中都能使用正则表达式。
3.1扩展正则表达式和正则表达式的区别
扩展正则表达式是在正则表达式的基础上做了一些改变,使之功能更加强大。下面简要说明扩张正则表达式和正则表达式的区别。
? 和正则表达式中的\?相同的功能但是少了转义符\。
{m,n} 和正则表达式中的\{m,n\}相同功能但是少了转义符\。
( ) 和正则表达式中的\( \)相同功能,但是少了转义符\。
新增的功能:(正则表达式中没有)
+ 此字符之前的字符至少出现一次。
| 或者运算。
‘(C|c)at’ 匹配Cat或者cat。