MySQL 衍生表(Derived Tables)

发布于:2025-03-16 ⋅ 阅读:(19) ⋅ 点赞:(0)

在SQL的查询语句select …. from …中,跟在from子句后面的通常是一张拥有定义的实体表,而有的时候我们会用子查询来扮演实体表的角色,这个在from子句中的子查询会返回一个结果集,这个结果集可以像普通的实体表一样查询、连接,这个子查询的结果集就叫做衍生表。

一、衍生表简介

衍生表常用在需要对数据进行临时处理的场景,即对表直接查询无法得出结果,需要对数据进行加工,然后在加工基础上与原数据再次进行连接,才能得出结果。

示例数据准备
例如下面一的张考试成绩表,subject_id代表不同的科目,score代表分数:

create table exam(
id int not null auto_increment primary key,
subject_id int,
student varchar(12),
score int);

insert into exam values(null,1,'小红',89), (null,1,'小橙',76), (null,1,'小黄',89),
 (null,1,'小绿',95), (null,2,'小青',77), (null,2,'小蓝',83), (null,2,'小紫',99);

select * from exam;

在这里插入图片描述

1.1 衍生表基本用法

现要求:找出每个科目得分最高那条记录,这个问题需要拆分成2步完成:

第一步:找出每个科目的最高分

select subject_id, max(score) score from exam group by subject_id;

在这里插入图片描述
第二步:将上一步的结果与exam表进行连接,找出具体的记录:

select e.* from exam e, (select subject_id, max(score) score from exam group by subject_id) d 
where d.subject_id=e.subject_id and d.score=e.score;

在这里插入图片描述
• 这里将第一步的查询放在括号中,并取一个别名d。
• 通过别名d,MySQL可以像引用实体表一样引用子查询的结果集(衍生表)。

1.2 自定义列名

在给衍生表定义别名时,可以同时定义列名,方法是在别名后的括号内列出列名,要注意列名的数量要和子查询返回的列数量相同:

select a, b, d from (select 1,2,3,4) d(a,b,c,d);

在这里插入图片描述

1.3 衍生表的局限

衍生表目前的局限是它是一个独立的子查询,在生成结果集之前无法和from表中的其他表产生关联,如果产生衍生表的子查询成本非常高,而最后与其他表连接后只使用了一小部分数据,那么这个性能浪费是非常严重的。

例如上面的例子中,如果表中有10万个科目,而我最终结果只涉及2个科目,那么在衍生表中对10万个科目进行group by显然是没有必要的,这种情况我们需要提前将外层谓语条件(where)传入衍生表中,避免处理不必要的数据,但这也意味着谓语条件在外层写了一遍,必须在衍生表中再写一遍,增加了SQL复杂度。

在MySQL 8.0.14版本后,通过横向衍生表(lateral关键字),可以在衍生表中引用from子句中之前出现的表,可以完美解决上述局限。


网站公告

今日签到

点亮在社区的每一天
去签到