MySQL查询GROUP BY按日/月/年


649

是否可以通过简单的查询来计算在一个确定的时间段(例如年,月或日)中有TIMESTAMP字段的记录数,例如:

SELECT COUNT(id)
FROM stats
WHERE record_date.YEAR = 2009
GROUP BY record_date.YEAR

甚至:

SELECT COUNT(id)
FROM stats
GROUP BY record_date.YEAR, record_date.MONTH

具有每月统计信息。

谢谢!


1
我猜应该GROUP BY record_date.MONTH在您的第一个代码段中?
chiccodoro

Answers:


1012
GROUP BY YEAR(record_date), MONTH(record_date)

在MySQL中检查日期和时间函数


27
在某些情况下(例如记录跨越数年),您可能需要添加额外的列以提高清晰度。SELECT COUNT(event_id),DATE_FORMAT(event_start,'%Y /%m')
Ric

一个简单的完整示例:SELECT count(*), record_date FROM anytable WHERE anytable.anycolumn = 'anycondition' GROUP BY YEAR(record_date), month(record_date);注意:record_date是日期类型TIMESTAMP
renedet

可能值得一提的是,这在带有COUNT别名列的MySQL 5.7上无法运行(没有错误,结果为零)。当我更改为使用别名选择那些字段时,可以按别名分组。这是在本地环境中运行的标准MySQL 5.7 docker镜像,因此我不知道为什么它没有出错或返回结果。
MrMesees's

3
哦,天哪,如果我较早知道这一点...那么多行PHP可以完成mysql可以在一行中完成的工作。

230
GROUP BY DATE_FORMAT(record_date, '%Y%m')

注意(首先要注意潜在的拒绝者)。目前,这可能不如其他建议有效。尽管如此,我仍然将其作为替代方案,也可以用来观察其他解决方案的速度。(因为在看到差异之前,您不能从慢到快真正分辨出来。)而且,随着时间的流逝,可以对MySQL的引擎进行优化方面的更改,以便在某些情况下(例如,并非如此)做出此解决方案。远点),使其在效率上可以与大多数其他产品媲美。


3
我有种感觉,因为格式函数无法在日期列上使用索引,所以执行效果不佳。
桑尼

@Stv:那您可能要考虑@ fu-chi的答案。据我所知,答案和我的分组表达式对同一事物求值,但EXTRACT()可能比高效DATE_FORMAT()。(不过,我没有用于适当测试的MySQL。)
Andriy M

45

试试这个

SELECT COUNT(id)
FROM stats
GROUP BY EXTRACT(YEAR_MONTH FROM record_date)

EXTRACT(unit FROM date)函数更好,因为使用的分组较少,并且该函数返回数字值。

分组时的比较条件将比DATE_FORMAT函数(返回字符串值)快。尝试使用返回SQL比较条件(WHERE,HAVING,ORDER BY,GROUP BY)的非字符串值的function | field。


43

我尝试使用上面的“ WHERE”语句,因为没有人纠正它,但是我错了,所以我认为它是正确的。经过一些搜索后,我发现这是WHERE语句的正确公式,因此代码如下所示:

SELECT COUNT(id)  
FROM stats  
WHERE YEAR(record_date) = 2009  
GROUP BY MONTH(record_date)

30

如果您的搜索时间超过几年,并且仍然希望每月进行分组,建议您:

版本1:

SELECT SQL_NO_CACHE YEAR(record_date), MONTH(record_date), COUNT(*)
FROM stats
GROUP BY DATE_FORMAT(record_date, '%Y%m')

版本#2(效率更高)

SELECT SQL_NO_CACHE YEAR(record_date), MONTH(record_date), COUNT(*)
FROM stats
GROUP BY YEAR(record_date)*100 + MONTH(record_date)

我在一张有1,357,918行的大表上比较了这些版本(),第二版似乎有更好的结果。

版本1 (平均执行10次):1.404秒
版本2 (平均执行10次):0.780秒

SQL_NO_CACHE添加了此键以防止MySQL缓存到查询。)


1
考虑将@ fu-chi的建议包括在您的测试中,它可能被证明更加有效。另外,您也进行了测试GROUP BY YEAR(record_date)*100 + MONTH(record_date),但为什么不同时进行测试GROUP BY YEAR(record_date), MONTH(record_date)呢?
Andriy M 2014年

2
如果使用COUNT(1)转换为COUNT(*),它将更快,并且结果数据相同。
Pa0l0

2
*100Versión#2上的内容是什么?提前致谢。
艾维

1
*100YEAR(record_date)*100 + MONTH(record_date) == DATE_FORMAT(record_date, '%Y%m')
Phu Duy

17

如果要在MySQL中按日期分组,请使用以下代码:

 SELECT COUNT(id)
 FROM stats
 GROUP BY DAYOFMONTH(record_date)

希望这可以为将要查找此线程的人节省一些时间。


6
重要的是要注意,您还需要分组MONTH(record_date)以占多个月的时间。
Webnet 2012年

14

如果要过滤特定年份(例如2000)的记录,则可以WHERE像下面这样优化子句:

SELECT MONTH(date_column), COUNT(*)
FROM date_table
WHERE date_column >= '2000-01-01' AND date_column < '2001-01-01'
GROUP BY MONTH(date_column)
-- average 0.016 sec.

代替:

WHERE YEAR(date_column) = 2000
-- average 0.132 sec.

针对包含30万行和日期索引列的表生成结果。

至于GROUP BY条款,我对照上述表格测试了三种变体。结果如下:

SELECT YEAR(date_column), MONTH(date_column), COUNT(*)
FROM date_table
GROUP BY YEAR(date_column), MONTH(date_column)
-- codelogic
-- average 0.250 sec.

SELECT YEAR(date_column), MONTH(date_column), COUNT(*)
FROM date_table
GROUP BY DATE_FORMAT(date_column, '%Y%m')
-- Andriy M
-- average 0.468 sec.

SELECT YEAR(date_column), MONTH(date_column), COUNT(*)
FROM date_table
GROUP BY EXTRACT(YEAR_MONTH FROM date_column)
-- fu-chi
-- average 0.203 sec.

最后一个是获胜者。


10

完整而简单的解决方案,具有与当前正在执行的性能类似但又更短,更灵活的替代方案:

SELECT COUNT(*) FROM stats
-- GROUP BY YEAR(record_date), MONTH(record_date), DAYOFMONTH(record_date)
GROUP BY DATE_FORMAT(record_date, '%Y-%m-%d')

7

如果要获取每月统计信息,并按最近月份的顺序对每年的每月行计数进行排序,请尝试以下操作:

SELECT count(id),
      YEAR(record_date),
      MONTH(record_date) 
FROM `table` 
GROUP BY YEAR(record_date),
        MONTH(record_date) 
ORDER BY YEAR(record_date) DESC,
        MONTH(record_date) DESC

7

您只需在GROUP BY中执行Mysql DATE_FORMAT()函数即可。在某些情况下(例如记录跨度数年而不同月份出现同一月数),您可能需要添加额外的列以提高清晰度。请从头开始阅读。希望对您有帮助。这是示例查询供您理解

SELECT
    COUNT(id),
    DATE_FORMAT(record_date, '%Y-%m-%d') AS DAY,
    DATE_FORMAT(record_date, '%Y-%m') AS MONTH,
    DATE_FORMAT(record_date, '%Y') AS YEAR

FROM
    stats
WHERE
    YEAR = 2009
GROUP BY
    DATE_FORMAT(record_date, '%Y-%m-%d ');

4

以下查询在Oracle Database 12c 12.1.0.1.0版中对我有用

SELECT COUNT(*)
FROM stats
GROUP BY 
extract(MONTH FROM TIMESTAMP),
extract(MONTH FROM TIMESTAMP),
extract(YEAR  FROM TIMESTAMP);

2

我更喜欢这样优化一年组选择:

SELECT COUNT(*)
  FROM stats
 WHERE record_date >= :year 
   AND record_date <  :year + INTERVAL 1 YEAR;

这样,您只需将年份'2009'与一个命名参数绑定一次,而不必担心单独添加'-01-01'或传递'2010'

此外,由于想必大家都只是计算行id是从来没有NULL的,我更喜欢COUNT(*)COUNT(id)


0

.... group by to_char(date, 'YYYY') -> 1989年

.... group by to_char(date,'MM') -> 05

.... group by to_char(date,'DD') -> 23

.... group by to_char(date,'MON') ---> MAY

.... group by to_char(date,'YY') -> 89


这将非常非常慢。
Earl3s 16/12/21
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.