MySQL的distinct和group by 哪个效率更高?

  • 在语义相同,有索引的情况下:

group by 和 distinct 都能使用索引,效率相同。因为group by 和 distinct近乎等价,distinct可以被看做是一种特殊的group by。

  • 在语义相同,无索引的情况下:

distinct 效率高于 group by。原因是 distinct 和 group by 都会进行分组操作,但 group by 在 MySQL8.0 之前会进行隐式排序,导致触发 filesort,SQL 执行效率低下。


但为什么推荐group by 的原因

  1. group by 语义更为清晰
  2. group by 可对数据进行更为复杂的一些处理

相对于 distinct 来说,group by 的语义明确。且由于 distinct 关键字会对所有字段生效,在进行复合业务处理时,group by 的使用灵活性更高,group by 能根据分组情况,对数据进行更为复杂的处理,例如通过 having 对数据进行过滤,或通过聚合函数对数据进行运算。