MySQL-行到列


185

我尝试搜索帖子,但仅找到SQL Server / Access的解决方案。我需要MySQL(5.X)中的解决方案。

我有一个包含3列的表(称为历史记录):hostid,itemname,itemvalue。
如果我选择(select * from history),它将返回

   +--------+----------+-----------+
   | hostid | itemname | itemvalue |
   +--------+----------+-----------+
   |   1    |    A     |    10     |
   +--------+----------+-----------+
   |   1    |    B     |     3     |
   +--------+----------+-----------+
   |   2    |    A     |     9     |
   +--------+----------+-----------+
   |   2    |    c     |    40     |
   +--------+----------+-----------+

我如何查询数据库以返回类似

   +--------+------+-----+-----+
   | hostid |   A  |  B  |  C  |
   +--------+------+-----+-----+
   |   1    |  10  |  3  |  0  |
   +--------+------+-----+-----+
   |   2    |   9  |  0  |  40 |
   +--------+------+-----+-----+

@Rob,能否请您编辑问题以包括确切的查询?
约翰

Answers:


274

我将对解决该问题所要采取的步骤添加一个稍长且更详细的解释。如果时间太长,我深表歉意。


我将从您给出的基础开始,并使用它来定义几个术语,这些术语将在本文的其余部分中使用。这将是基本表

select * from history;

+--------+----------+-----------+
| hostid | itemname | itemvalue |
+--------+----------+-----------+
|      1 | A        |        10 |
|      1 | B        |         3 |
|      2 | A        |         9 |
|      2 | C        |        40 |
+--------+----------+-----------+

漂亮的数据透视表将是我们的目标:

select * from history_itemvalue_pivot;

+--------+------+------+------+
| hostid | A    | B    | C    |
+--------+------+------+------+
|      1 |   10 |    3 |    0 |
|      2 |    9 |    0 |   40 |
+--------+------+------+------+

history.hostid列中的值将在数据透视表中成为y值。在值history.itemname列将成为x值(原因很明显)。


当我必须解决创建数据透视表的问题时,可以使用三步过程(可选的第四步)解决它:

  1. 选择感兴趣的列,即y值x值
  2. 用额外的列扩展基本表-每个x值一个
  3. 分组并汇总扩展表-每个y值一组
  4. (可选)整理汇总表

让我们将这些步骤应用于您的问题,看看会得到什么:

第1步:选择感兴趣的列。在期望的结果中,hostid提供y值itemname提供x值

步骤2:使用额外的列扩展基本表。每个x值通常需要一列。回想一下,我们的x值列是itemname

create view history_extended as (
  select
    history.*,
    case when itemname = "A" then itemvalue end as A,
    case when itemname = "B" then itemvalue end as B,
    case when itemname = "C" then itemvalue end as C
  from history
);

select * from history_extended;

+--------+----------+-----------+------+------+------+
| hostid | itemname | itemvalue | A    | B    | C    |
+--------+----------+-----------+------+------+------+
|      1 | A        |        10 |   10 | NULL | NULL |
|      1 | B        |         3 | NULL |    3 | NULL |
|      2 | A        |         9 |    9 | NULL | NULL |
|      2 | C        |        40 | NULL | NULL |   40 |
+--------+----------+-----------+------+------+------+

请注意,我们没有更改行数,只是添加了额外的列。还要注意NULLs 的模式-具有的行itemname = "A"的新列具有非Anull值,其他新列具有null值。

步骤3:将扩展表分组并汇总。我们需要group by hostid,因为它提供了y值:

create view history_itemvalue_pivot as (
  select
    hostid,
    sum(A) as A,
    sum(B) as B,
    sum(C) as C
  from history_extended
  group by hostid
);

select * from history_itemvalue_pivot;

+--------+------+------+------+
| hostid | A    | B    | C    |
+--------+------+------+------+
|      1 |   10 |    3 | NULL |
|      2 |    9 | NULL |   40 |
+--------+------+------+------+

(请注意,我们现在每个y值都有一行。) 好的,我们快到了!我们只需要摆脱那些难看NULL的东西。

步骤4:美化。我们将用零代替任何空值,以便更好地查看结果集:

create view history_itemvalue_pivot_pretty as (
  select 
    hostid, 
    coalesce(A, 0) as A, 
    coalesce(B, 0) as B, 
    coalesce(C, 0) as C 
  from history_itemvalue_pivot 
);

select * from history_itemvalue_pivot_pretty;

+--------+------+------+------+
| hostid | A    | B    | C    |
+--------+------+------+------+
|      1 |   10 |    3 |    0 |
|      2 |    9 |    0 |   40 |
+--------+------+------+------+

我们已经完成了-我们已经使用MySQL构建了一个漂亮的漂亮数据透视表。


应用此过程时的注意事项:

  • 在多余的列中使用什么值。我itemvalue在这个例子中使用
  • 在多余的列中使用什么“中性”值。我用过NULL,但也可以是0"",具体取决于您的具体情况
  • 分组时使用什么聚合函数。我用sum,但countmax也经常使用(max构建跨越了很多行已经扩展一排“对象”时经常使用)
  • 使用多个列作为y值。此解决方案不限于对y值使用单个列-只需将多余的列插入group by子句中(不要忘了它们select

已知限制:

  • 此解决方案不允许数据透视表中有n列-扩展基本表时,需要手动添加每个数据透视列。因此,对于5或10个x值,此解决方案很好。对于100,不是很好。有一些存储过程生成查询的解决方案,但是它们很丑陋,很难正确处理。当数据透视表需要有很多列时,我目前不知道解决此问题的好方法。

25
+1这是迄今为止我所见过的关于MySQL数据透视表/交叉表的最佳/最清晰的解释
cameron.bracken

6
很好的解释,谢谢。通过使用IFNULL(sum(A),0)AS A,可以将步骤4合并为步骤3,从而获得相同的结果,但无需创建另一个表
nealio82,2013年

1
对于枢轴来说,这是最了不起的解决方案,但是我很好奇,如果在形成x轴的列itemname中有多个值,例如这里我们只有三个值,即A,B,C。如果这些值扩展到A, B,C,D,E,AB,BC,AC,AD,H ..... n。那么在这种情况下,解决方案是什么。
Deepesh '16

1
这应该是这里公认的答案。它更详细,有用,并且解释了如何理解它,而不仅仅是链接到某些文章,例如当前被接受的文章
EdgeCaseBerg

1
@WhiteBig请查看日期-这个StackOverflow答案是在那篇博客文章的1.5年之前写的。也许您应该改为要求博客向我赞扬。
马特·芬威克

55
SELECT 
    hostid, 
    sum( if( itemname = 'A', itemvalue, 0 ) ) AS A,  
    sum( if( itemname = 'B', itemvalue, 0 ) ) AS B, 
    sum( if( itemname = 'C', itemvalue, 0 ) ) AS C 
FROM 
    bob 
GROUP BY 
    hostid;

为“ A”,“ B”,“ C”创建三个不同的行
Palani 2012年

@Palani:不,不是。请参阅group by
ruakh 2012年

谢谢,这对我有用!但是,仅在FYI推迟了几年之后,我不得不使用MAX代替,SUM因为我itemValue是字符串,而不是数字值。
Merricat

31

另一种选择,特别是在您需要处理许多项目时特别有用,是让mysql为您构建查询:

SELECT
  GROUP_CONCAT(DISTINCT
    CONCAT(
      'ifnull(SUM(case when itemname = ''',
      itemname,
      ''' then itemvalue end),0) AS `',
      itemname, '`'
    )
  ) INTO @sql
FROM
  history;
SET @sql = CONCAT('SELECT hostid, ', @sql, ' 
                  FROM history 
                   GROUP BY hostid');

PREPARE stmt FROM @sql;
EXECUTE stmt;
DEALLOCATE PREPARE stmt;

FIDDLE 添加了一些额外的值以使其正常运行

GROUP_CONCAT 的默认值为1000,因此如果您有很大的查询,请在运行前更改此参数

SET SESSION group_concat_max_len = 1000000;

测试:

DROP TABLE IF EXISTS history;
CREATE TABLE history
(hostid INT,
itemname VARCHAR(5),
itemvalue INT);

INSERT INTO history VALUES(1,'A',10),(1,'B',3),(2,'A',9),
(2,'C',40),(2,'D',5),
(3,'A',14),(3,'B',67),(3,'D',8);

  hostid    A     B     C      D
    1     10      3     0      0
    2     9       0    40      5
    3     14     67     0      8

@Mihai也许你可以帮助我。看看这个:stackoverflow.com/questions/51832979/...
成功男人

24

利用马特·芬威克(Matt Fenwick)的想法帮助我解决了这个问题(非常感谢),让我们将其简化为一个查询:

select
    history.*,
    coalesce(sum(case when itemname = "A" then itemvalue end), 0) as A,
    coalesce(sum(case when itemname = "B" then itemvalue end), 0) as B,
    coalesce(sum(case when itemname = "C" then itemvalue end), 0) as C
from history
group by hostid

14

我从子查询编辑Agung Sagita的答案加入。我不确定这两种方式之间有多少区别,但仅供参考。

SELECT  hostid, T2.VALUE AS A, T3.VALUE AS B, T4.VALUE AS C
FROM TableTest AS T1
LEFT JOIN TableTest T2 ON T2.hostid=T1.hostid AND T2.ITEMNAME='A'
LEFT JOIN TableTest T3 ON T3.hostid=T1.hostid AND T3.ITEMNAME='B'
LEFT JOIN TableTest T4 ON T4.hostid=T1.hostid AND T4.ITEMNAME='C'

2
可能是一个更快的解决方案。
jave.web 2016年

我不这么认为。因为左联接有它自己的延迟!
阿巴迪斯

10

使用子查询

SELECT  hostid, 
    (SELECT VALUE FROM TableTest WHERE ITEMNAME='A' AND hostid = t1.hostid) AS A,
    (SELECT VALUE FROM TableTest WHERE ITEMNAME='B' AND hostid = t1.hostid) AS B,
    (SELECT VALUE FROM TableTest WHERE ITEMNAME='C' AND hostid = t1.hostid) AS C
FROM TableTest AS T1
GROUP BY hostid

但是如果子查询产生的结果超过一行,将是一个问题,请在子查询中使用进一步的聚合函数


4

我的解决方案:

select h.hostid, sum(ifnull(h.A,0)) as A, sum(ifnull(h.B,0)) as B, sum(ifnull(h.C,0)) as  C from (
select
hostid,
case when itemName = 'A' then itemvalue end as A,
case when itemName = 'B' then itemvalue end as B,
case when itemName = 'C' then itemvalue end as C
  from history 
) h group by hostid

它在提交的案例中产生预期的结果。


3

我将其放入Group By hostId其中,它将仅显示带有值的第一行,
例如:

A   B  C
1  10
2      3

3

我想出了一种方法,可以使我的报表使用简单查询将行转换为列几乎是动态的。您可以在此处在线查看和测试。

查询是固定的,但是值是动态的,并且基于行的值。您可以构建它因此,我使用一个查询来构建表头,并使用另一个查询来查看值:

SELECT distinct concat('<th>',itemname,'</th>') as column_name_table_header FROM history order by 1;

SELECT
     hostid
    ,(case when itemname = (select distinct itemname from history a order by 1 limit 0,1) then itemvalue else '' end) as col1
    ,(case when itemname = (select distinct itemname from history a order by 1 limit 1,1) then itemvalue else '' end) as col2
    ,(case when itemname = (select distinct itemname from history a order by 1 limit 2,1) then itemvalue else '' end) as col3
    ,(case when itemname = (select distinct itemname from history a order by 1 limit 3,1) then itemvalue else '' end) as col4
FROM history order by 1;

您也可以总结一下:

SELECT
     hostid
    ,sum(case when itemname = (select distinct itemname from history a order by 1 limit 0,1) then itemvalue end) as A
    ,sum(case when itemname = (select distinct itemname from history a order by 1 limit 1,1) then itemvalue end) as B
    ,sum(case when itemname = (select distinct itemname from history a order by 1 limit 2,1) then itemvalue end) as C
FROM history group by hostid order by 1;
+--------+------+------+------+
| hostid | A    | B    | C    |
+--------+------+------+------+
|      1 |   10 |    3 | NULL |
|      2 |    9 | NULL |   40 |
+--------+------+------+------+

RexTester的结果:

RexTester的结果

http://rextester.com/ZSWKS28923

作为一个实际的使用示例,此报告在下面的栏中以可视化的时间表显示了船/公共汽车的离港时间。您将看到上一栏未使用的另一列,而不会混淆可视化效果: Sistema venda de passns在线和最终消费者在线控制-xsl技术-xsl.com.br **售票系统用于在线销售和展示门票


3

如果可以使用MariaDB,那么有一个非常简单的解决方案。

MariaDB-10.02开始,添加了一个名为CONNECT的新存储引擎,该引擎可以帮助我们将另一个查询或表的结果转换为数据透视表,就像您想要的那样:您可以看一下docs

首先安装连接存储引擎

现在,我们表itemname的数据透视表列为,并且每个项目的数据都位于itemvalue列中,因此我们可以使用以下查询获得结果数据透视表:

create table pivot_table
engine=connect table_type=pivot tabname=history
option_list='PivotCol=itemname,FncCol=itemvalue';

现在我们可以从中选择我们想要的pivot_table

select * from pivot_table

在这里更多细节


1

这不是您要查找的确切答案,但这是我在项目中需要的解决方案,希望对您有所帮助。这将列出1至n行项目,以逗号分隔。Group_Concat使这在MySQL中成为可能。

select
cemetery.cemetery_id as "Cemetery_ID",
GROUP_CONCAT(distinct(names.name)) as "Cemetery_Name",
cemetery.latitude as Latitude,
cemetery.longitude as Longitude,
c.Contact_Info,
d.Direction_Type,
d.Directions

    from cemetery
    left join cemetery_names on cemetery.cemetery_id = cemetery_names.cemetery_id 
    left join names on cemetery_names.name_id = names.name_id 
    left join cemetery_contact on cemetery.cemetery_id = cemetery_contact.cemetery_id 

    left join 
    (
        select 
            cemetery_contact.cemetery_id as cID,
            group_concat(contacts.name, char(32), phone.number) as Contact_Info

                from cemetery_contact
                left join contacts on cemetery_contact.contact_id = contacts.contact_id 
                left join phone on cemetery_contact.contact_id = phone.contact_id 

            group by cID
    )
    as c on c.cID = cemetery.cemetery_id


    left join
    (
        select 
            cemetery_id as dID, 
            group_concat(direction_type.direction_type) as Direction_Type,
            group_concat(directions.value , char(13), char(9)) as Directions

                from directions
                left join direction_type on directions.type = direction_type.direction_type_id

            group by dID


    )
    as d on d.dID  = cemetery.cemetery_id

group by Cemetery_ID

该墓地有两个公共名称,因此名称在通过单个ID连接的不同行中列出,但具有两个名称ID,并且查询产生类似以下内容的

    墓地CemeteryID Cemetery_Name纬度
    1 Appleton,Sulpher Springs 35.4276242832293


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.