是否有用于输出制表符分隔列的简单命令?


67

例如,我有一个文件(由生成echo -e "var1\tvar2\t\var3\tvar4" > foo),其输出为:

$ cat foo
case    elems   meshing nlsys
uniform 2350    0.076662        2.78
non-conformal   348     0.013332        0.55
scale   318     0.013333        0.44
smarter 504     0.016666        0.64
submodel        360     .009999 0.40
unstruct-quad   640     0.019999        0.80
unstruct-tri    1484    0.01    0.88

我更喜欢这样的输出(在这里我使用vim:set tabstop=14):

case          elems         meshing       nlsys
uniform       2350          0.076662      2.78
non-conformal 348           0.013332      0.55
scale         318           0.013333      0.44
smarter       504           0.016666      0.64
submodel      360           .009999       0.40
unstruct-quad 640           0.019999      0.80
unstruct-tri  1484          0.01          0.88

cat如果$ tabs=15在bash中使用,则可以获得相同的功能(请参阅此问题)。是否有可以自动进行这种格式设置的程序?我不想tabscat写入文件之前尝试使用该值。

Answers:


87

我通常使用该column程序,它bsdmainutils在Debian上的一个软件包中:

column -t foo

输出:

case           elems  meshing   nlsys
uniform        2350   0.076662  2.78
non-conformal  348    0.013332  0.55
scale          318    0.013333  0.44
smarter        504    0.016666  0.64
submodel       360    .009999   0.40
unstruct-quad  640    0.019999  0.80
unstruct-tri   1484   0.01      0.88

摘录column(1)自我的系统:

...

-t      Determine the number of columns the input contains and create a
        table.  Columns are delimited with whitespace, by default, or
        with the characters supplied using the -s option.  Useful for
        pretty-printing displays.

...

大!非常感谢!它已经安装在我的机器上。
塞巴斯蒂安

11
-s $'\t'如果某些字段包含空格,则可能需要添加(虽然在每个列实现中都找不到)。
斯特凡Chazelas

2
@RakholiyaJenish $'\t'表示制表符。新行是$'\n',依此类推。
Manwe 2015年

2
我用这个作为column -ts: /etc/passwd。看起来不错!
kyb

1
@kyb:使用看起来更好-n,例如避免合并多个相邻的定界符
Thor

10

几种选择:

var1=uniform var2=2350 var3=0.076662 var4=2.78

printf '%-15s %-10s %-12s %s\n' \
  case elems messing nlsys \
  "$var1" "$var2" "$var3" "$var4"

printf '%s\t%s\t%s\t%s\n' \
  case elems messing nlsys \
  "$var1" "$var2" "$var3" "$var4" |
  expand -t 15,25,37

printf '%s\t%s\t%s\t%s\n' \
  case elems messing nlsys \
  "$var1" "$var2" "$var3" "$var4" |
  column -t -s $'\t'

column是非标准命令,某些实现/版本不支持-s选项。它根据输入来计算列的宽度,但这意味着它只能在所有输入都输入给它之后才开始显示。$'...'是zsh和bash中的ksh93语法。

使用zsh:

values=(
  case elems messing nlsys
  "$var1" "$var2" "$var3" "$var4"
)
print -arC4 -- "$values[@]"

4

您还可以使用rs作为替代column -t

(x=$(cat);rs -c -z $(wc -l<<<"$x")<<<"$x")

-c更改输入列分隔符,但-c仅将输入列分隔符设置为选项卡。-z将每列的宽度设置为该列最长条目的宽度,而不是使所有列具有相同的宽度。如果某些行的列数少于第一行,请添加-n


rs是什么 我的CentOS或Ubuntu / Mint系统上都没有安装该命令。
Anthon

1
@Anthon这是OS X附带的BSD命令,以APL中的reshape函数命名。Debian软件包的名称是just rs,因此您可以使用来安装它apt-get install rs
nisetama'3

您能否提供一个示例说明如何调用该命令(x=$(cat);rs -c -z $(wc -l<<<"$x")<<<"$x")?我不知道如何与csv文件一起使用
baxx

3

另一个可以做到这一点的工具tsv-pretty来自eBay的TSV实用程序(免责声明:我是作者)。它需要在小数点上排列数字字段的附加步骤。例如:

$ tsv-pretty foo
case           elems   meshing  nlsys
uniform         2350  0.076662   2.78
non-conformal    348  0.013332   0.55
scale            318  0.013333   0.44
smarter          504  0.016666   0.64
submodel         360   .009999   0.40
unstruct-quad    640  0.019999   0.80
unstruct-tri    1484  0.01       0.88

有几个格式选项。例如,-u为标题加上下划线并-f以类似的格式设置字段中的浮点数以提高可读性:

$ tsv-pretty foo -f -u
case           elems   meshing  nlsys
----           -----   -------  -----
uniform         2350  0.076662   2.78
non-conformal    348  0.013332   0.55
scale            318  0.013333   0.44
smarter          504  0.016666   0.64
submodel         360  0.009999   0.40
unstruct-quad    640  0.019999   0.80
unstruct-tri    1484  0.010000   0.88

tsv-pretty参考中提供了更多信息。


这真的很有帮助
Arefe

1

问题是关于输出制表符分隔的列。

因此正确的答案是@nisetama的答案的一小部分改编。我添加了-C $'\ t'选项来设置输出格式。

x=$(cat foo2); rs -C$'\t' $(wc -l <<<"$x") <<<"$x"

工藤到@nisetama虽然:)


1
function printTable()
{
    local -r delimiter="${1}"
    local -r data="$(removeEmptyLines "${2}")"

    if [[ "${delimiter}" != '' && "$(isEmptyString "${data}")" = 'false' ]]
    then
        local -r numberOfLines="$(wc -l <<< "${data}")"

        if [[ "${numberOfLines}" -gt '0' ]]
        then
            local table=''
            local i=1

            for ((i = 1; i <= "${numberOfLines}"; i = i + 1))
            do
                local line=''
                line="$(sed "${i}q;d" <<< "${data}")"

                local numberOfColumns='0'
                numberOfColumns="$(awk -F "${delimiter}" '{print NF}' <<< "${line}")"

                # Add Line Delimiter

                if [[ "${i}" -eq '1' ]]
                then
                    table="${table}$(printf '%s#+' "$(repeatString '#+' "${numberOfColumns}")")"
                fi

                # Add Header Or Body

                table="${table}\n"

                local j=1

                for ((j = 1; j <= "${numberOfColumns}"; j = j + 1))
                do
                    table="${table}$(printf '#| %s' "$(cut -d "${delimiter}" -f "${j}" <<< "${line}")")"
                done

                table="${table}#|\n"

                # Add Line Delimiter

                if [[ "${i}" -eq '1' ]] || [[ "${numberOfLines}" -gt '1' && "${i}" -eq "${numberOfLines}" ]]
                then
                    table="${table}$(printf '%s#+' "$(repeatString '#+' "${numberOfColumns}")")"
                fi
            done

            if [[ "$(isEmptyString "${table}")" = 'false' ]]
            then
                echo -e "${table}" | column -s '#' -t | awk '/^\+/{gsub(" ", "-", $0)}1'
            fi
        fi
    fi
}

function removeEmptyLines()
{
    local -r content="${1}"

    echo -e "${content}" | sed '/^\s*$/d'
}

function repeatString()
{
    local -r string="${1}"
    local -r numberToRepeat="${2}"

    if [[ "${string}" != '' && "${numberToRepeat}" =~ ^[1-9][0-9]*$ ]]
    then
        local -r result="$(printf "%${numberToRepeat}s")"
        echo -e "${result// /${string}}"
    fi
}

function isEmptyString()
{
    local -r string="${1}"

    if [[ "$(trimString "${string}")" = '' ]]
    then
        echo 'true' && return 0
    fi

    echo 'false' && return 1
}

function trimString()
{
    local -r string="${1}"

    sed 's,^[[:blank:]]*,,' <<< "${string}" | sed 's,[[:blank:]]*$,,'
}

样品运行

$ cat data-1.txt
HEADER 1,HEADER 2,HEADER 3

$ printTable ',' "$(cat data-1.txt)"
+-----------+-----------+-----------+
| HEADER 1  | HEADER 2  | HEADER 3  |
+-----------+-----------+-----------+

$ cat data-2.txt
HEADER 1,HEADER 2,HEADER 3
data 1,data 2,data 3

$ printTable ',' "$(cat data-2.txt)"
+-----------+-----------+-----------+
| HEADER 1  | HEADER 2  | HEADER 3  |
+-----------+-----------+-----------+
| data 1    | data 2    | data 3    |
+-----------+-----------+-----------+

$ cat data-3.txt
HEADER 1,HEADER 2,HEADER 3
data 1,data 2,data 3
data 4,data 5,data 6

$ printTable ',' "$(cat data-3.txt)"
+-----------+-----------+-----------+
| HEADER 1  | HEADER 2  | HEADER 3  |
+-----------+-----------+-----------+
| data 1    | data 2    | data 3    |
| data 4    | data 5    | data 6    |
+-----------+-----------+-----------+

$ cat data-4.txt
HEADER
data

$ printTable ',' "$(cat data-4.txt)"
+---------+
| HEADER  |
+---------+
| data    |
+---------+

$ cat data-5.txt
HEADER

data 1

data 2

$ printTable ',' "$(cat data-5.txt)"
+---------+
| HEADER  |
+---------+
| data 1  |
| data 2  |
+---------+

REF LIB位于:https : //github.com/gdbtek/linux-cookbooks/blob/master/libraries/util.bash


有趣的bash,唯一的解决办法-谢谢你的分享
塞巴斯蒂安

这太令人费解了。而且它不是仅限bash,因为有一些外部命令,例如sed被使用。
codeforester
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.