2.11 根据扩展名切分文件名

有一些脚本是依据文件名进行各种处理的。我们可能会需要在保留扩展名的同时修改文件名、转换文件格式(保留文件名的同时修改扩展名)或提取部分文件名。shell具有的内建功能可以依据不同的情况来切分文件名。

2.11.1 实战演练

借助 % 操作符可以轻松将名称部分从“名称.扩展名”这种格式的文件名中提取出来。你可以按照下面的方法从sample.jpg中提取名称。

  1. file_jpg="sample.jpg"
  2. name=${file_jpg%.*}
  3. echo File name is: $name

输出结果:

  1. File name is: sample

下一个任务是将文件名的扩展名部分提取出来,这可以借助 # 操作符实现。

提取文件名中的 .jpg并存储到变量file_jpg中:

  1. extension=${file_jpg#*.}
  2. echo Extension is: jpg

输出结果:

  1. Extension is: jpg

2.11.2 工作原理

在第一个任务中,为了从“名称.扩展名”这种格式的文件名中提取名称,我们使用了%操作符。

${VAR%.*} 的含义是:

  • $VAR中删除位于 % 右侧的通配符(在前例中是.*)所匹配的字符串。通配符从右向左进行匹配。

  • VAR赋值,VAR=sample.jpg。那么,通配符从右向左就会匹配到.jpg,因此,从 $VAR中删除匹配结果,就会得到输出“sample”。

% 属于非贪婪(non-greedy)操作。它从右到左找出匹配通配符的最短结果。还有另一个操作符 %%,这个操作符与%相似,但行为模式却是贪婪的(greedy),这意味着它会匹配符合条件的最长的字符串。

例如,我们现在有这样一个文件:

  1. VAR=hack.fun.book.txt

使用 % 操作符:

  1. $ echo ${VAR%.*}

得到输出:hack.fun.book

操作符 % 使用.*从右向左执行非贪婪匹配(.txt)。

使用 %% 操作符:

  1. $ echo ${VAR%%.*}

得到输出:hack

操作符 %% 则用.*从右向左执行贪婪匹配(.fun.book.txt)。

在第二个任务中,我们用 # 操作符从文件名中提取扩展名。这个操作符与%类似,不过求值方向是从左向右。

${VAR#*.}的含义是:从$VAR中删除位于 # 右侧的通配符(即在前例中使用的*.)所匹配的字符串。通配符从左向右进行匹配。

%% 类似,#也有一个相对应的贪婪操作符 ##

## 从左向右进行贪婪匹配,并从指定变量中删除匹配结果。

来看一个例子:

  1. VAR=hack.fun.book.txt

使用#操作符:

  1. $ echo ${VAR#*.}

得到输出:fun.book.txt

操作符 #*.从左向右执行非贪婪匹配(hack.)。

使用##操作符:

  1. $ echo ${VAR##*.}

得到输出:txt

操作符 ## 则用*.从左向右执行贪婪匹配(hack.fun.book)。

2.11 根据扩展名切分文件名 - 图1 因为文件名中可能包含多个'.'字符,所以相较于### 更适合于从文件名中提取扩展名。## 执行的是贪婪匹配,因而总是能够准确地提取出扩展名。-

这里有个能够提取域名不同部分的实用案例。假定URL="www.google.com"

  1. $ echo ${URL%.*} # 移除.*所匹配的最右边的内容
  2. www.google
  3. $ echo ${URL%%.*} # 将从右边开始一直匹配到最左边的*.移除(贪婪操作符)
  4. www
  5. $ echo ${URL#*.} #移除*.所匹配的最左边的内容
  6. google.com
  7. $ echo ${URL##*.} #将从左边开始一直匹配到最右边的*.移除(贪婪操作符)
  8. com