MySQL查询GROUP BY按日/月/年

649

是否可以通过简单的查询来计算在一个确定的时间段（例如年，月或日）中有TIMESTAMP字段的记录数，例如：

SELECT COUNT(id)
FROM stats
WHERE record_date.YEAR = 2009
GROUP BY record_date.YEAR

甚至：

SELECT COUNT(id)
FROM stats
GROUP BY record_date.YEAR, record_date.MONTH

具有每月统计信息。

谢谢！

— 费尔南多·巴罗卡尔
source

1

我猜应该GROUP BY record_date.MONTH在您的第一个代码段中？

— chiccodoro

1012

GROUP BY YEAR(record_date), MONTH(record_date)

在MySQL中检查日期和时间函数。

— 代码逻辑
source

27

在某些情况下（例如记录跨越数年），您可能需要添加额外的列以提高清晰度。SELECT COUNT（event_id），DATE_FORMAT（event_start，'％Y /％m'）

— Ric

一个简单的完整示例：

SELECT count(*), record_date FROM anytable WHERE anytable.anycolumn = 'anycondition' GROUP BY YEAR(record_date), month(record_date);

注意：record_date是日期类型TIMESTAMP

— renedet

可能值得一提的是，这在带有COUNT别名列的MySQL 5.7上无法运行（没有错误，结果为零）。当我更改为使用别名选择那些字段时，可以按别名分组。这是在本地环境中运行的标准MySQL 5.7 docker镜像，因此我不知道为什么它没有出错或返回结果。

— MrMesees's

3

哦，天哪，如果我较早知道这一点...那么多行PHP可以完成mysql可以在一行中完成的工作。

— 夜

230

GROUP BY DATE_FORMAT(record_date, '%Y%m')

注意（首先要注意潜在的拒绝者）。目前，这可能不如其他建议有效。尽管如此，我仍然将其作为替代方案，也可以用来观察其他解决方案的速度。（因为在看到差异之前，您不能从慢到快真正分辨出来。）而且，随着时间的流逝，可以对MySQL的引擎进行优化方面的更改，以便在某些情况下（例如，并非如此）做出此解决方案。远点），使其在效率上可以与大多数其他产品媲美。

— 安德烈·M
source

3

我有种感觉，因为格式函数无法在日期列上使用索引，所以执行效果不佳。

— 桑尼

@Stv：那您可能要考虑@ fu-chi的答案。据我所知，答案和我的分组表达式对同一事物求值，但EXTRACT()可能比高效DATE_FORMAT()。（不过，我没有用于适当测试的MySQL。）

— Andriy M

45

试试这个

SELECT COUNT(id)
FROM stats
GROUP BY EXTRACT(YEAR_MONTH FROM record_date)

EXTRACT（unit FROM date）函数更好，因为使用的分组较少，并且该函数返回数字值。

分组时的比较条件将比DATE_FORMAT函数（返回字符串值）快。尝试使用返回SQL比较条件（WHERE，HAVING，ORDER BY，GROUP BY）的非字符串值的function | field。

— 富池
source

43

我尝试使用上面的“ WHERE”语句，因为没有人纠正它，但是我错了，所以我认为它是正确的。经过一些搜索后，我发现这是WHERE语句的正确公式，因此代码如下所示：

SELECT COUNT(id)  
FROM stats  
WHERE YEAR(record_date) = 2009  
GROUP BY MONTH(record_date)

— 地西za
source

30

如果您的搜索时间超过几年，并且仍然希望每月进行分组，建议您：

版本1：

SELECT SQL_NO_CACHE YEAR(record_date), MONTH(record_date), COUNT(*)
FROM stats
GROUP BY DATE_FORMAT(record_date, '%Y%m')

版本＃2（效率更高）：

SELECT SQL_NO_CACHE YEAR(record_date), MONTH(record_date), COUNT(*)
FROM stats
GROUP BY YEAR(record_date)*100 + MONTH(record_date)

我在一张有1,357,918行的大表上比较了这些版本（Innodb），第二版似乎有更好的结果。

版本1 （平均执行10次）：1.404秒
版本2 （平均执行10次）：0.780秒

（SQL_NO_CACHE添加了此键以防止MySQL缓存到查询。）

— 宝贝123
source

1

考虑将@ fu-chi的建议包括在您的测试中，它可能被证明更加有效。另外，您也进行了测试GROUP BY YEAR(record_date)*100 + MONTH(record_date)，但为什么不同时进行测试GROUP BY YEAR(record_date), MONTH(record_date)呢？

— Andriy M 2014年

2

如果使用COUNT（1）转换为COUNT（*），它将更快，并且结果数据相同。

— Pa0l0

2

*100Versión＃2上的内容是什么？提前致谢。

— 艾维

1

*100至YEAR(record_date)*100 + MONTH(record_date) == DATE_FORMAT(record_date, '%Y%m')

— Phu Duy

17

如果要在MySQL中按日期分组，请使用以下代码：

 SELECT COUNT(id)
 FROM stats
 GROUP BY DAYOFMONTH(record_date)

希望这可以为将要查找此线程的人节省一些时间。

— Haijerome
source

6

重要的是要注意，您还需要分组MONTH(record_date)以占多个月的时间。

— Webnet 2012年

14

如果要过滤特定年份（例如2000）的记录，则可以WHERE像下面这样优化子句：

SELECT MONTH(date_column), COUNT(*)
FROM date_table
WHERE date_column >= '2000-01-01' AND date_column < '2001-01-01'
GROUP BY MONTH(date_column)
-- average 0.016 sec.

代替：

WHERE YEAR(date_column) = 2000
-- average 0.132 sec.

针对包含30万行和日期索引列的表生成结果。

至于GROUP BY条款，我对照上述表格测试了三种变体。结果如下：

SELECT YEAR(date_column), MONTH(date_column), COUNT(*)
FROM date_table
GROUP BY YEAR(date_column), MONTH(date_column)
-- codelogic
-- average 0.250 sec.

SELECT YEAR(date_column), MONTH(date_column), COUNT(*)
FROM date_table
GROUP BY DATE_FORMAT(date_column, '%Y%m')
-- Andriy M
-- average 0.468 sec.

SELECT YEAR(date_column), MONTH(date_column), COUNT(*)
FROM date_table
GROUP BY EXTRACT(YEAR_MONTH FROM date_column)
-- fu-chi
-- average 0.203 sec.

最后一个是获胜者。

— 萨尔曼A
source

10

完整而简单的解决方案，具有与当前正在执行的性能类似但又更短，更灵活的替代方案：

SELECT COUNT(*) FROM stats
-- GROUP BY YEAR(record_date), MONTH(record_date), DAYOFMONTH(record_date)
GROUP BY DATE_FORMAT(record_date, '%Y-%m-%d')

— 塞斯·蒂默曼
source

7

如果要获取每月统计信息，并按最近月份的顺序对每年的每月行计数进行排序，请尝试以下操作：

SELECT count(id),
      YEAR(record_date),
      MONTH(record_date) 
FROM `table` 
GROUP BY YEAR(record_date),
        MONTH(record_date) 
ORDER BY YEAR(record_date) DESC,
        MONTH(record_date) DESC

— 用户3019799
source

7

您只需在GROUP BY中执行Mysql DATE_FORMAT（）函数即可。在某些情况下（例如记录跨度数年而不同月份出现同一月数），您可能需要添加额外的列以提高清晰度。请从头开始阅读。希望对您有帮助。这是示例查询供您理解

SELECT
    COUNT(id),
    DATE_FORMAT(record_date, '%Y-%m-%d') AS DAY,
    DATE_FORMAT(record_date, '%Y-%m') AS MONTH,
    DATE_FORMAT(record_date, '%Y') AS YEAR

FROM
    stats
WHERE
    YEAR = 2009
GROUP BY
    DATE_FORMAT(record_date, '%Y-%m-%d ');

— 费萨尔
source

4

以下查询在Oracle Database 12c 12.1.0.1.0版中对我有用

SELECT COUNT(*)
FROM stats
GROUP BY 
extract(MONTH FROM TIMESTAMP),
extract(MONTH FROM TIMESTAMP),
extract(YEAR  FROM TIMESTAMP);

— 迷你沙
source

2

我更喜欢这样优化一年组选择：

SELECT COUNT(*)
  FROM stats
 WHERE record_date >= :year 
   AND record_date <  :year + INTERVAL 1 YEAR;

这样，您只需将年份'2009'与一个命名参数绑定一次，而不必担心单独添加'-01-01'或传递'2010'。

此外，由于想必大家都只是计算行id是从来没有NULL的，我更喜欢COUNT(*)到COUNT(id)。

— 阿尔特
source

0

.... group by to_char(date, 'YYYY') -> 1989年

.... group by to_char(date,'MM') -> 05

.... group by to_char(date,'DD') -> 23

.... group by to_char(date,'MON') ---> MAY

.... group by to_char(date,'YY') -> 89

— 芳香之森
source

这将非常非常慢。

— Earl3s 16/12/21