SQL执行顺序：从逻辑到物理的完整解析

一、核心执行顺序概览

SQL查询的执行顺序与书写顺序存在显著差异，这是数据库优化和查询性能调优的基础。标准的逻辑执行顺序如下：

标准执行顺序：

FROM（确定数据源）
ON（应用连接条件）
JOIN（执行表连接）
WHERE（行级过滤）
GROUP BY（数据分组）
聚合函数（计算COUNT、SUM等）
HAVING（分组后过滤）
SELECT（选择输出列）
DISTINCT（去重）
ORDER BY（排序）
LIMIT/OFFSET（限制结果集）

书写顺序：SELECT → FROM → WHERE → GROUP BY → HAVING → ORDER BY → LIMIT

二、详细执行步骤解析

1. FROM & JOIN：数据源准备

FROM子句是SQL查询的起点，确定查询的数据来源。当涉及多表连接时，数据库会执行笛卡尔积操作，生成虚拟表VT1。

执行过程：

对FROM子句中的前两个表执行笛卡尔积
应用ON条件筛选，生成虚拟表VT2
如果是外连接（LEFT/RIGHT JOIN），添加保留表的未匹配行，生成虚拟表VT3
如果FROM子句包含多个表，重复执行步骤1-3，直到处理完所有表

2. WHERE：行级过滤

WHERE子句对FROM/JOIN后的虚拟表进行过滤，只保留满足条件的行，生成虚拟表VT4。

关键限制：

WHERE中不能使用SELECT定义的别名（因为SELECT尚未执行）
WHERE中不能使用聚合函数（因为GROUP BY尚未执行）
WHERE在GROUP BY之前执行，可以提前过滤数据，减少分组计算量

3. GROUP BY：数据分组

根据GROUP BY子句指定的列对VT4中的记录进行分组，生成虚拟表VT5。每个分组在结果集中只包含一行。

重要特性：

分组后，后续操作只能使用GROUP BY的列或聚合函数
从这一步开始，可以在后续语句中使用SELECT中定义的别名

4. 聚合函数计算

在GROUP BY之后，计算聚合函数（COUNT、SUM、AVG、MAX、MIN等），为每个分组生成聚合值。

执行时机：聚合函数在GROUP BY之后、HAVING之前执行

5. HAVING：分组后过滤

HAVING子句对分组后的结果进行过滤，只保留满足条件的分组，生成虚拟表VT6。

与WHERE的区别：

WHERE在分组前过滤行，HAVING在分组后过滤组
HAVING可以使用聚合函数，WHERE不能
对于普通条件，WHERE和HAVING效果相同，但WHERE性能更好

6. SELECT：选择输出列

SELECT子句选择最终要输出的列，计算表达式，并为列定义别名，生成虚拟表VT7。

关键点：

SELECT在WHERE、GROUP BY、HAVING之后执行
此时可以引用之前定义的别名
聚合函数的结果在此阶段正式输出

7. DISTINCT：去重操作

如果指定了DISTINCT关键字，去除结果集中的重复行，生成虚拟表VT8。

注意：如果已经使用了GROUP BY，DISTINCT通常是多余的，因为分组后每个组只包含一行

8. ORDER BY：结果排序

根据ORDER BY子句指定的列对结果集进行排序，生成游标VC9。

性能影响：

ORDER BY是非常消耗资源的操作
如果排序列有索引，可以利用索引顺序避免额外排序
如果没有索引，可能需要使用临时文件排序（Filesort）

9. LIMIT/OFFSET：限制结果集

最后应用LIMIT和OFFSET子句，从排序后的结果中截取指定行数，生成最终结果集VT10并返回给客户端。

重要特性：

LIMIT在ORDER BY之后执行，确保返回的是排序后的前N条记录
如果LIMIT在ORDER BY之前执行，返回的是前N条记录再排序，结果可能不符合预期

三、执行顺序的三大维度

1. 语法顺序（书写顺序）

开发者编写SQL语句时的顺序，主要用于规范代码结构：

SELECT → FROM → WHERE → GROUP BY → HAVING → ORDER BY → LIMIT

2. 逻辑执行顺序

数据库解析SQL时的抽象执行流程，决定各子句的实际处理顺序：

FROM → ON → JOIN → WHERE → GROUP BY → 聚合函数 → HAVING → SELECT → DISTINCT → ORDER BY → LIMIT

3. 物理执行顺序

查询优化器根据成本模型动态调整的实际执行路径，目标是提升性能：

可能调整表连接顺序（小表驱动大表）
可能提前应用WHERE条件（谓词下推）
可能利用索引避免全表扫描
可能并行处理复杂操作

四、关键差异与注意事项

1. 别名使用限制

WHERE中不能使用SELECT别名：因为WHERE执行时SELECT尚未处理
HAVING和ORDER BY可以使用SELECT别名：因为它们在SELECT之后执行

错误示例：

SELECT salary * 12 AS annual_salary
FROM employees
WHERE annual_salary > 60000;  -- 报错：annual_salary未定义

正确做法：

SELECT salary * 12 AS annual_salary
FROM employees
WHERE salary * 12 > 60000;  -- 重复表达式

2. 聚合函数位置限制

WHERE中不能使用聚合函数：因为WHERE在GROUP BY之前执行
HAVING中可以使用聚合函数：因为HAVING在GROUP BY之后执行

错误示例：

SELECT department, AVG(salary)
FROM employees
WHERE AVG(salary) > 5000;  -- 报错：聚合函数不能在WHERE中使用
GROUP BY department;

正确做法：

SELECT department, AVG(salary)
FROM employees
GROUP BY department
HAVING AVG(salary) > 5000;  -- 正确：HAVING支持聚合函数

3. 性能优化建议

WHERE条件尽量使用索引列：提前过滤数据，减少处理量
GROUP BY列尽量包含在索引中：避免额外排序操作
避免在WHERE中使用函数：可能导致索引失效
LIMIT与ORDER BY配合使用：可提前终止排序，提升性能

五、实际案例分析

案例1：完整查询执行过程

SELECT DISTINCT department, AVG(salary) AS avg_sal
FROM employees e
JOIN departments d ON e.dept_id = d.id
WHERE hire_date > '2020-01-01'
GROUP BY department
HAVING AVG(salary) > 5000
ORDER BY avg_sal DESC
LIMIT 5;

执行步骤：

FROM + JOIN：加载employees和departments表，执行连接操作
WHERE：过滤2020年后入职的员工
GROUP BY：按部门分组
计算AVG(salary)：计算每个部门的平均工资
HAVING：过滤平均工资大于5000的部门
SELECT：选择department和avg_sal列
DISTINCT：去重（此处可能多余，因为GROUP BY已分组）
ORDER BY：按平均工资降序排序
LIMIT：取前5条记录

案例2：WHERE与HAVING的区别

-- 统计每个部门2020年后入职的员工数量，只显示员工数大于10的部门
SELECT department, COUNT(*) AS emp_count
FROM employees
WHERE hire_date > '2020-01-01'  -- WHERE在分组前过滤
GROUP BY department
HAVING COUNT(*) > 10;           -- HAVING在分组后过滤

执行逻辑：

WHERE先过滤掉2020年前入职的员工，减少分组数据量
GROUP BY按部门分组
HAVING过滤掉员工数小于等于10的部门

六、物理执行顺序与优化

1. 查询优化器的作用

查询优化器会分析多种可能的执行计划，选择成本最低的方案：

优化策略：

索引选择：根据统计信息选择最优索引
连接顺序调整：小表驱动大表，减少中间结果集
谓词下推：将过滤条件提前到存储层
并行执行：复杂查询拆分为多个线程并行处理

2. 查看执行计划

使用EXPLAIN命令查看SQL的物理执行计划：

EXPLAIN SELECT * FROM users WHERE id = 10;

关键字段：

id：执行顺序编号（id相同从上到下，id不同id大的先执行）
type：访问类型（system > const > eq_ref > ref > range > index > all）
key：使用的索引
rows：预估扫描行数（越少性能越好）

3. 物理执行可能顺序

对于复杂查询，优化器可能调整执行顺序：

graph LR
A[读取索引] --> B[扫描索引过滤条件]
B --> C{嵌套循环连接}
C --> D[WHERE过滤]
D --> E[按分组列分组]
E --> F[计算聚合函数]
F --> G[HAVING过滤]
G --> H[排序并取LIMIT]

七、面试常见问题

问题1：为什么SELECT的别名不能在WHERE中使用？

答案：因为WHERE在SELECT之前执行，执行WHERE时SELECT定义的别名尚未计算。正确做法是在WHERE中重复表达式，或者使用子查询。

问题2：WHERE和HAVING的区别是什么？

答案：

执行时机：WHERE在GROUP BY之前执行，HAVING在GROUP BY之后执行
作用对象：WHERE过滤行，HAVING过滤组
聚合函数：WHERE不能使用聚合函数，HAVING可以
性能：WHERE提前过滤数据，性能更好

问题3：GROUP BY和DISTINCT的区别？

答案：

GROUP BY：按指定列分组，通常配合聚合函数使用
DISTINCT：去除重复行，不进行分组计算
性能：如果已经使用GROUP BY，DISTINCT通常是多余的

问题4：LIMIT在ORDER BY之前还是之后执行？

答案：LIMIT在ORDER BY之后执行。如果LIMIT在ORDER BY之前执行，返回的是前N条记录再排序，而不是排序后的前N条记录。

问题5：如何优化SQL查询性能？

答案：

WHERE条件使用索引列
GROUP BY列包含在索引中
避免在WHERE中使用函数
合理使用覆盖索引
使用EXPLAIN分析执行计划

八、总结

掌握SQL执行顺序是数据库开发和优化的基础。理解FROM先于WHERE、GROUP BY先于HAVING、SELECT最后执行的核心逻辑，能够帮助开发者编写更高效、更准确的SQL查询。同时，了解物理执行顺序与逻辑执行顺序的区别，有助于通过EXPLAIN分析查询性能瓶颈，进行针对性优化。

核心要点：

SQL执行顺序与书写顺序不同
WHERE在GROUP BY之前执行，HAVING在GROUP BY之后执行
SELECT在WHERE、GROUP BY、HAVING之后执行
别名和聚合函数的使用受执行顺序限制
查询优化器会调整物理执行顺序以提升性能

通过系统掌握SQL执行顺序，开发者能够编写出性能更优、逻辑更清晰的SQL语句，在面试和实际工作中游刃有余。

{{userData.name}}已认证

SQL执行顺序：从逻辑到物理的完整解析

SQL执行顺序：从逻辑到物理的完整解析

一、核心执行顺序概览

二、详细执行步骤解析

1. FROM & JOIN：数据源准备

2. WHERE：行级过滤

3. GROUP BY：数据分组

4. 聚合函数计算

5. HAVING：分组后过滤

6. SELECT：选择输出列

7. DISTINCT：去重操作

8. ORDER BY：结果排序

9. LIMIT/OFFSET：限制结果集

三、执行顺序的三大维度

1. 语法顺序（书写顺序）

2. 逻辑执行顺序

3. 物理执行顺序

四、关键差异与注意事项

1. 别名使用限制

2. 聚合函数位置限制

3. 性能优化建议

五、实际案例分析

案例1：完整查询执行过程

案例2：WHERE与HAVING的区别

六、物理执行顺序与优化

1. 查询优化器的作用

2. 查看执行计划

3. 物理执行可能顺序

七、面试常见问题

问题1：为什么SELECT的别名不能在WHERE中使用？

问题2：WHERE和HAVING的区别是什么？

问题3：GROUP BY和DISTINCT的区别？

问题4：LIMIT在ORDER BY之前还是之后执行？

问题5：如何优化SQL查询性能？

八、总结

PHP常用框架深度解析：从Laravel到ThinkPHP的现代Web开发实践

【C语言】循环嵌套江湖：while小弟+for大哥带你开启封神之路

HaiOOS

海之云

{{userData.name}}已认证

SQL执行顺序：从逻辑到物理的完整解析

一、核心执行顺序概览

二、详细执行步骤解析

1. FROM & JOIN：数据源准备

2. WHERE：行级过滤

3. GROUP BY：数据分组

4. 聚合函数计算

5. HAVING：分组后过滤

6. SELECT：选择输出列

7. DISTINCT：去重操作

8. ORDER BY：结果排序

9. LIMIT/OFFSET：限制结果集

三、执行顺序的三大维度

1. 语法顺序（书写顺序）

2. 逻辑执行顺序

3. 物理执行顺序

四、关键差异与注意事项

1. 别名使用限制

2. 聚合函数位置限制

3. 性能优化建议

五、实际案例分析

案例1：完整查询执行过程

案例2：WHERE与HAVING的区别

六、物理执行顺序与优化

1. 查询优化器的作用

2. 查看执行计划

3. 物理执行可能顺序

七、面试常见问题

问题1：为什么SELECT的别名不能在WHERE中使用？

问题2：WHERE和HAVING的区别是什么？

问题3：GROUP BY和DISTINCT的区别？

问题4：LIMIT在ORDER BY之前还是之后执行？

问题5：如何优化SQL查询性能？

八、总结

PHP常用框架深度解析：从Laravel到ThinkPHP的现代Web开发实践

【C语言】循环嵌套江湖：while小弟+for大哥带你开启封神之路

相似站点

HaiOOS

海之云