将CSV转换成表格


15

挑战

给定CSV输入,请使用框字符输出适当的unicode表。

格式化

该表将使用以下规则进行格式化:

  • 列宽将等于该列的最长值
  • 所有表格数据将保持对齐
  • 每个表将假定第一csv行为标题
  • 该表格的边框将使用以下字符:

┌ ┬ ┐ ├ ┼ ┤ └ ┴ ┘ ─ │

Input:
Name,Age,Gender
Shaun,19,Male
Debra,19,Female
Alan,26,Male
George,15,Male

Output:
┌──────┬───┬──────┐
│Name  │Age│Gender│
├──────┼───┼──────┤
│Shaun │19 │Male  │
│Debra │19 │Female│
│Alan  │26 │Male  │
│George│15 │Male  │
└──────┴───┴──────┘

规则

  • 适用标准漏洞
  • 您可以提交完整的程序,函数或lambda
  • 输入可以来自文件,程序参数或任何可接受的替代方法
  • 输出可以是文件,返回或任何可接受的替代方法
  • CSV输入应采用与我的示例相同的格式。
  • 以字节为单位的最短答案将获胜。

CSV输入应采用以下形式:

Header1,Header2,Header3 newline
Column1,Column2,Column3 newline
Column1,Column2,Column3 optional_newline

2
我认为使用CSV定义基本上可以有两种方法。如果问题的有趣部分是输出,则可以使其简单如“用逗号分隔”,而不必担心如何用逗号引用和如何用引号引起来。否则,您可以声明一种解析CSV的特定方法(“双引号切换一种忽略逗号的模式,连续两个双引号会产生一个文字双引号”是一种相当常见的方法,但绝不是唯一的方法存在)。

4
错误,严重的问题:您尚未指定胜利条件。要针对哪些程序进行优化?长度(代码高尔夫球)?

1
至少那里的前三个链接都以不同的方式定义CSV(至少有两个说有很多不同的方式来做)。因此,我假设“ CSV”需要在问题中使用时进行更全面的定义(并且解决方案将尽量避免使用逗号分割而不是转义,因为它允许它们更短)。

2
好的,我已经编辑了问题,以包括我希望每个人都使用的CSV格式的详细信息。
肖恩·怀德(Shaun Wild)

1
CRLF?认真吗 在Unix上CR意味着文本文件中的其他内容,这将给Unix带来相当大的损失。您可能只想将其替换为“换行符”,从而允许使用特定于操作系统的换行符。

Answers:


10

尝试(Dyalog)APL38 43 字节

最后输入行必须有尾随换行符。

{{(⊃⍵)⍪⍉⍪↑¨↓⍉↑1↓⍵}s¨',',¨(s1↓¨⊢⊂⍨⊢=⊃)¯1⌽⍵}

在线尝试!在Dyalog APL的脱机版本中,执行]boxing ON -style=min以达到相同的效果。

说明

{... }一个匿名函数,其中代表参数:

¯1 ⌽ ⍵ 将尾随换行符旋转到前面

(s ←... )定义函数s ^如下,并将其应用

  1 ↓¨ 删除每个的第一个字符

  ⊢ ⊂⍨ 行,在哪里拆分

  ⊃ = ⊢ 第一个字符等于字符串中的字符

',' ,¨ 然后在每行前面加一个逗号

将函数s应用于每一行

{... }现在应用以下匿名函数:

  1 ↓ ⍵ 删除第一个元素(行标题)

  ↓ ⍉ ↑ 将行列表转置为列列表

  ↑¨ 使每个元素(条目列表)成为填充条目矩阵

  ⍉ ⍪ 制成一列矩阵,然后转置为一列矩阵

  (⊃⍵) ⍪ 将参数的第一个元素(标题列表)放在顶部

注意:虽然在我的解决方案中未明确使用线条画字符,但它们是APL字符集的一部分,也将被视为单个字节。


参见上面的评论Is input using list or array of strings (and no newlines) valid? Nope.
edc65 '16

@ edc65固定。谢谢。
阿达姆,2013年

哈哈,那盒装展示肯定会派上用场:)
2016年

2

PowerShell 3 +,365字节

$d=$input|ipcsv
$h=$d[0].PSObject.Properties.Name|%{$_|Add-Member -type NoteProperty -na c -v(($d.$_+$_|measure Length -ma).Maximum)-pa}
"┌$(($h|%{'─'*$_.c})-join'┬')┐"
"│$(($h|%{$_.PadRight($_.c)})-join'│')│"
"├$(($h|%{'─'*$_.c})-join'┼')┤"
$d|%{$i=$_;"│$(($h|%{$i.$_.PadRight($_.c)})-join'│')│"}
"└$(($h|%{'─'*$_.c})-join'┴')┘"

我觉得这可以改善很多,但是我没时间了。所有行尾均不\n\r,编码为UTF8,不带BOM。


1

球拍578字节

(let*((ll(map(λ(x)(string-split x","))ll))(lr list-ref)(sl string-length)(d display)(dl displayln)(nc(length(lr ll 0)))
(nl(for/list((i nc))(apply max(for/list((j ll))(sl(lr j i))))))(pl(λ(sy)(d(lr sy 0))(for((n nc))(for((m(lr nl n)))(d(lr sy 1)))
(if(< n(sub1 nc))(d(lr sy 2))(dl(lr sy 3))))))(g(λ(i n)(for((m(-(lr nl n)(sl i))))(d" ")))))(pl'("┌""─""┬""┐"))
(for((i(lr ll 0))(n(in-naturals)))(d"│")(d i)(g i n))(dl"│")(pl'("├""─""┼""┤"))(for((j(range 1(length ll))))
(for((i(lr ll j))(n nc))(d"│")(d i)(g i n))(dl"│"))(pl'("└" "─" "┴" "┘")))

取消高尔夫:

(define(f1 ll)
 (let* ((ll (map (λ (x)(string-split x ",")) ll))  ; use this to convert csv format to list of lists; 
         (lr list-ref)                    ; make short names of standard fns
         (sl string-length)
         (d display)
         (dl displayln)
         (nc (length (lr ll 0)))          ; number of cols; 
         (nl(for/list ((i nc))            ; get list of max string-length for each column
              (apply max
                     (for/list ((j ll))
                       (sl (lr j i))
                       ))))
         (pl (λ (sy)                      ; put lines using sent symbol list
               (d (lr sy 0)) 
               (for ((n nc))
                 (for ((m (lr nl n))) (d (lr sy 1)))
                 (if (< n (sub1 nc))
                     (d (lr sy 2))
                     (dl (lr sy 3))
                     ))))
         (g (λ (i n)                     ; pad with spaces if needed
              (for ((m (- (lr nl n) (sl i)))) (d " ")) ))) 
    ; put line above header: 
    (pl '("┌" "─" "┬" "┐"))

    ; put header: 
    (for ((i (lr ll 0)) (n (in-naturals)))
      (d "│")
      (d i)
      (g i n)
      )
    (dl "│")

    ; put line below header;
    (pl '("├" "─" "┼" "┤"))

    ; put rows: 
    (for ((j (range 1 (length ll))))
      (for ((i (lr ll j))
            (n nc))
        (d "│")
        (d i)
        (g i n)
        )
      (dl "│")
      )

    ; put bottom line: 
    (pl '("└" "─" "┴" "┘"))
    ))

测试:

(f (list  "Name,Age,Gender"
          "Shaun,19,Male"
          "Debra,19,Female"
          "Alan,26,Male"
          "George,15,Male"))

输出:

┌──────┬───┬──────┐
│Name  │Age│Gender│
├──────┼───┼──────┤
│Shaun │19 │Male  │
│Debra │19 │Female│
│Alan  │26 │Male  │
│George│15 │Male  │
└──────┴───┴──────┘

1

JavaScript(ES6 | FireFox),286字节

f=>(d=f.split`
`.map(a=>a.split`,`),s=d[0].map((a,i)=>d.reduce((b,c)=>(n=c[i].length)>b?n:b,0)),d=d.map(a=>`│${a.map((b,i)=>b.padEnd(s[i])).join`│`}│`),d.splice(1,0,(g=h=>h[0]+s.map(a=>'─'.repeat(a)).join(h[1])+h[2])('├┼┤')),g('┌┬┐')+`
${d.join`
`}
`+g('└┴┘'))

使用padEnd,特定于FireFox。


1
这不是288个字节吗?
2013年

1
@Adám...是...已修正
Mwr247 '16

您大量使用了此功能,这不g('└┴┘')等同于g└┴┘g在结尾和结尾处带有反引号)吗?
NoOneIsHere16年

1
padEnd是非标准的。您应该指定必要的执行环境。
尼尔

1
另外,在几个地方可以写`foo`+bar+`baz`-您可以使用template保存一个字节`foo${bar}baz`
尼尔

1

JavaScript(ES6),281字节

注意:输入带有换行符的单个字符串-根据OP的要求。其他答案使用字符串列表-在输入中使用字符串数组我可以避免第一个拆分和剪切9个字节。

l=>(l=l.split`
`.map(r=>r.split`,`.map((w,i)=>(v=w.length)<c[i]?w:(c[i]=v,w)),c=[k=0]),l=l.map(r=>r.map((v,i)=>(v+' '.repeat(c[i]-v.length)))),[h=c.map(x=>'─'.repeat(x)),l.shift(),h,...l,h].map(a=>'│┌├└'[j=a!=h?0:++k]+a.join('│┬┼┴'[j])+'│┐┤┘'[j]).join`
`)

少打高尔夫球

l=>(
  // split input in an array of string arrays
  // meanwhile find the column widths and put them in *c*
  l = l.split`\n`.map(r=>r.split`,`.map((w,i)=>(v=w.length)<c[i]?w:(c[i]=v,w)),c=[]),

  // pad each column to the max column width
  l = l.map(r=>r.map((v,i)=>(v+' '.repeat(c[i]-v.length)))),

  // put in *h* the horizontal lines for top,bottom and head separator
  h = c.map(x => '─'.repeat(x) ),

  // add the *h* line at top, bottom and after head line
  l = [h, l.shift(), h, ...l, h],

  // rebuild a string, joining columns with '|' unless the row is *h*
  // if the row is *h* use different characters to join columns
  k = 0, 
  l.map(a=> '│┌├└'[j=a!=h?0:++k] + a.join('│┬┼┴'[j]) + '│┐┤┘'[j])
  .join`\n`  
)

测试

F=
l=>(l=l.split`
`.map(r=>r.split`,`.map((w,i)=>(v=w.length)<c[i]?w:(c[i]=v,w)),c=[k=0]),l=l.map(r=>r.map((v,i)=>(v+' '.repeat(c[i]-v.length)))),[h=c.map(x=>'─'.repeat(x)),l.shift(),h,...l,h].map(a=>'│┌├└'[j=a!=h?0:++k]+a.join('│┬┼┴'[j])+'│┐┤┘'[j]).join`
`) 
  
function update() {
  O.textContent = F(I.value)
}
update()
#I { width:60%; height: 8em} 
<textarea id=I>Name,Age,Gender
Shaun,19,Male
Debra,19,Female
Alan,26,Male
George,15,Male</textarea><br>
<button onclick='update()'>Go</button>
<pre id=O></pre>


0

Python 3,318字节

-3个字节用于%格式设置,-1表示缩写str.join

L=[c.split(',')for c in input().split('\n')]
m=[max(len(x)for x in c)for c in zip(*L)]
L=[[""]+[d.ljust(n)for d,n in zip(c,m)]+[""]for c in L]
g=["─"*i for i in m]
J=str.join
print('\n'.join(["┌%s┐"%J("┬",g),J("│",L[0]),"├%s┤"%J("┼",g)]+[J("│",L[i])for i in range(1,len(L))]+["└%s┘"%J("┴",g)]))

需要输入用引号引起来。


1
在我看来是318个字节。
阿达姆(Adám)'16

1
@Adám你说得对,我看着这些字符。
Karl Napf

不起作用,因为input()每个呼叫仅占用一行。您将需要进行呼叫input()直到没有更多的行,或者直接从读取stdin
movatica

除此之外:292个字节
movatica

0

C#,696字节

打高尔夫球:

string T(string[]f){int w=f.Max(r=>r.Length),a=f.Select(r=>r.Split(',')[0].Length).Max(),b=f.Select(r=>r.Split(',')[1].Length).Max(),c=f.Select(r=>r.Split(',')[2].Length).Max();string o="",n="\r\n",d="",j=string.Concat(Enumerable.Repeat("─",a)),k=string.Concat(Enumerable.Repeat("─",b)),l=string.Concat(Enumerable.Repeat("─",c));Func<string,int,string>z=(q,p)=>{return q.PadRight(p);};d="┌"+j+"┬"+k+"┬"+l+"┐";o+=d+n;var g=f.First().Split(',');o+="|"+z(g[0],a)+"|"+z(g[1],b)+"|"+z(g[2],c)+"|";d="├"+j+"┼"+k+"┼"+l+"┤";o+=n+d+n;for(int i=1;i<f.Length;i++){var h=f[i].Split(',');o+="|"+z(h[0],a)+"|"+z(h[1],b)+"|"+z(h[2],c)+"|"+n;}d="└"+j+"┴"+k+"┴"+l+"┘";o+=d;return o;}

放心(更好,因为^对任何人都没有用):

public string T(string[] c)
{
  int width = c.Max(r => r.Length),
    longestFirstColumn = c.Select(r => r.Split(',')[0].Length).Max(),
    longestSecondColumn = c.Select(r => r.Split(',')[1].Length).Max(),
    longestThirdColumn = c.Select(r => r.Split(',')[2].Length).Max();

  string o = "", lr = "\r\n", border = "",
    firstColumnFiller = string.Concat(Enumerable.Repeat("─", longestFirstColumn)),
    secondColumnFiller = string.Concat(Enumerable.Repeat("─", longestSecondColumn)),
    thirdColumnFiller = string.Concat(Enumerable.Repeat("─", longestThirdColumn));

  Func<string, int, string> padRight = (a, b) => { return a.PadRight(b); };

  border = "┌" + firstColumnFiller
    + "┬" +
    secondColumnFiller + "┬"
    + thirdColumnFiller
    + "┐";

  o += border + lr;

  var firstRow = c.First().Split(',');

  o += "|" + padRight(firstRow[0], longestFirstColumn) +
    "|" + padRight(firstRow[1], longestSecondColumn) +
    "|" + padRight(firstRow[2], longestThirdColumn) + "|";

  border = "├" +
    firstColumnFiller + "┼" +
    secondColumnFiller + "┼" +
    thirdColumnFiller
    + "┤";

  o += lr + border + lr;

  for (int i = 1; i < c.Length; i++)
  {
    var row = c[i].Split(',');

    o += "|" + padRight(row[0], longestFirstColumn) + "|"
    + padRight(row[1], longestSecondColumn) + "|" +
    padRight(row[2], longestThirdColumn) + "|" + lr;
  }

  border = "└" +
    firstColumnFiller + "┴" +
    secondColumnFiller + "┴" +
    thirdColumnFiller
    + "┘";

  o += border;

  return o;
}

测试:

┌──────┬───┬──────┐         ┌──────────┬───────────────────────────┬─────┐
|Name  |Age|Gender|         |Name      |PPCG Challenge             |Votes|
├──────┼───┼──────┤         ├──────────┼───────────────────────────┼─────┤
|Shaun |19 |Male  |         |Pete Arden| Print all integers        | 4   |
|Debra |19 |Female|         |Pete Arden| Yes of course I'm an adult| 3   |
|Alan  |26 |Male  |         |Pete Arden| 5 Favorite Letters        | 1   |
|George|15 |Male  |         └──────────┴───────────────────────────┴─────┘
└──────┴───┴──────┘

不知何故,在计数时,我一直得到697个字节。
亚当

@Adám再次检查,在Visual Studio中Golfed字符串的长度为666列。但是无论是666还是697都不是完全具有竞争力的分数:)
Pete Arden

您有结尾的换行符,但是即使删除它,它仍然是696 bytes
2013年

@Adám啊...我一直在等待字母数/字节数差异使我绊倒。在这个(“┼”)中应该已经知道这些有趣的符号。更新,谢谢:)
Pete Arden

参见上面的评论Is input using list or array of strings (and no newlines) valid? Nope.
edc65 '16

0

Perl,273 + 9(-CS -nlaF,标志)= 282字节

$v[$.-1]=[@F];map$l[$_]<($l=length$F[$_])&&($l[$_]=$l),0..$#F}sub p{printf$p,@_}sub o{p
pop,map{$\x$l[$_],$_-$#l?$_[0]:pop}0..$#l}$p=join'%s','',(map"\%-${_}s",@l),$/;($\,$c,@c)=map
chr$_*4+9472,0,.5,3..15;o@c[8,1,0];p($c,map{$_,$c}@$_),$i++||o@c[12,6,4]for@v;o@c[10,3,2];{

使用:

cat file.csv | perl -CS -nlaF, script.pl

Ideone上尝试一下。


0

PHP,313字节

for(;$r=fgetcsv(STDIN);$a[]=$r)foreach($r as$x=>$s)$e[$x]=max($e[$x],strlen($s));$t=["┬","┌","┐"];eval($L='foreach($e as$i=>$n)echo$t[!$i],str_repeat("─",$n);echo"$t[2]\n";');foreach($a as$k=>$r){foreach($r as$i=>$s)echo"│",str_pad($s,$e[$i]);echo"│\n";$t=["┼","├","┤"];if(!$k)eval($L);}$t=["┴","└","┘"];eval($L);

分解

for(;$r=fgetcsv(STDIN);$a[]=$r)                         // read csv from STDIN, append to array $a
    foreach($r as$x=>$s)$e[$x]=max($e[$x],strlen($s));  // remember max length in array $e
                                                        // print top border
$t=["┬","┌","┐"];eval($L='foreach($e as$i=>$n)echo$t[!$i],str_repeat("─",$n);echo"$t[2]\n";');
foreach($a as$k=>$r)
{
    foreach($r as$i=>$s)echo"│",str_pad($s,$e[$i]);echo"│\n";   // print row
    $t=["┼","├","┤"];if(!$k)eval($L);                           // print border below header
}
$t=["┴","└","┘"];eval($L);                              // print bottom border

在ideone上测试


0

APL(Dyalog扩展)36 25 字节SBCS

完整程序。假设ABCDEFGHIJKLMNOPQRSTUVWXYZ是CSV文件。打印到标准输出。

disp(1m)⍪↑¨↓⍉1m←⎕CSVA

在线尝试!

⎕A 大写 lphabet(最短到参考内置字符串)
⎕CSV 读取该文件,并转换从CSV到矩阵
m← 存储作为m(为 ATRIX)
1↓ 下降的第一行
 转置
 分裂成列的列表
↑¨ 字符串的每个列表混合成矩阵
(... )⍪ 堆在最重要的是以下情况:
1↑m 采取的第一行m
⌂disp  应用于dfns.disp(绘制线条图字符)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.