Answers:
与zsh
:
file='INT_V1_<Product>_<ID>_<Name>_<ddmmyy>.csv'
setopt extendedglob
if [[ $file = (#b)*_(*)_(*)_(*)_(*).csv ]]; then
product=$match[1] id=$match[2] name=$match[3] date=$match[4]
fi
bash
在sh仿真中使用4.3或更高版本,ksh93t或更高版本或zsh(尽管在中zsh
,您宁愿简单地field=("${(@s:_:)field}")
进行拆分,而不是使用的split + glob nonsense运算符sh
)可以在字符上拆分字符串_
并从末尾引用它们:
IFS=_
set -o noglob
field=($file) # split+glob operator
date=${field[-1]%.*}
name=${field[-2]}
id=${field[-3]}
product=${field[-4]}
或(bash 3.2或更高版本):
if [[ $file =~ .*_(.*)_(.*)_(.*)_(.*)\.csv$ ]]; then
product=${BASH_REMATCH[1]}
id=${BASH_REMATCH[2]}
name=${BASH_REMATCH[3]}
date=${BASH_REMATCH[4]}
fi
(假定$file
当前语言环境中包含有效文本,除非您将语言环境固定为C或其他语言环境(每个字符字符集为一个字节),否则不能保证文件名有效)。
像zsh
的*
上方,则.*
是贪婪。因此,第一个将吃掉尽可能多的东西*_
,因此剩余的.*
将仅匹配_
-free字符串。
有了ksh93
,您可以做到
pattern='*_(*)_(*)_(*)_(*).csv'
product=${file//$pattern/\1}
id=${file//$pattern/\2}
name=${file//$pattern/\3}
date=${file//$pattern/\4}
在POSIX sh
脚本,您可以使用${var#pattern}
,${var%pattern}
标准参数扩展运营商:
rest=${file%.*} # remove .csv suffix
date=${rest##*_} # remove everything on the left up to the rightmost _
rest=${rest%_*} # remove one _* from the right
name=${rest##*_}
rest=${rest%_*}
id=${rest##*_}
rest=${rest%_*}
product=${rest##*_}
或再次使用split + glob运算符:
IFS=_
set -o noglob
set -- $file
shift "$(($# - 4))"
product=$1 id=$2 name=$3 date=${4%.*}
ksh: file: 0403-046 The specified subscript cannot be greater than 4095.
要求${field[-1]}
或表格中的任何内容${x[n]}
。
${field[-1]}
是为bash-4.3+
。对于ksh
,请使用任何“ POSIX”解决方案。在ksh93t(源自zsh的功能)之前未添加对负下标的支持。
您可以<Name>
使用以下命令获取字段的值:
cut -d'<' -f4 < csvlist | sed -e 's/>_//g'
(或使用awk
):
awk -F'<' '{print $4}' < csvlist | sed -e 's/>_//g'
您可以将它们放在这样的变量中:
variable_name=$(cut -d'<' -f4 < csvlist | sed -e 's/>_//g')
要么
awk -F'<' '{print $4}' < csvlist | sed -e 's/>_//g'
在这个问题中尚不清楚,是否要为所有值使用相同的变量,还是为每个值使用一个变量。
file='INT_V1_<Product>_<ID>_<Name>_<ddmmyy>.csv'
IFS=\_ read -r x x product id name date x <<< "$file"
date=${date%.*}
_
不是特殊的,不需要引用。假定文件名不包含换行符。您可能要添加一个-d ''
。