MySQL基础篇(黑马程序员2022-01-18)

发布于:2024-09-17 ⋅ 阅读:(63) ⋅ 点赞:(0)

1 MySQL数据库概述

1.1 MySQL数据库的下载,安装,启动停止

1.2 数据模型

(1)关系型数据库(RDBMS)

概念:建立在关系模型基础上,由多张相互连接的二维表组成的数据库。

特点:

A. 使用表存储数据,格式统一,便于维护。

B. 使用SQL语言操作,标准统一,使用方便。

(3)数据模型

MySQL是关系型数据库,是基于二维表进行数据存储的,具体的结构图下:

我们可以通过MySQL客户端连接数据库管理系统DBMS,然后通过DBMS操作数据库。

可以使用SQL语句,通过数据库管理系统操作数据库,以及操作数据库中的表结构及数据。

一个数据库服务器中可以创建多个数据库,一个数据库中也可以包含多张表,而一张表中又可以包含多行记录。

2 SQL

通用语法

1). SQL语句可以单行或多行书写,以分号结尾。

2). SQL语句可以使用空格/缩进来增强语句的可读性。

3). MySQL数据库的SQL语句不区分大小写,关键字建议使用大写。

4). 注释:

单行注释:-- 注释内容 或 # 注释内容

多行注释:/* 注释内容 */

SQL分类

SQL语句,根据其功能,主要分为四类:DDL、DML、DQL、DCL。

分类 全程 说明
DDL Data Definition Language 数据定义语言,用来定义数据库对象(数据库,表,字段)
DML Data Manipulation Language 数据操作语言,用来对数据库表中的数据进行增删改
DQL Data Query Language 数据查询语言,用来查询数据库中表的记录
DCL Data Control Language 数据控制语言,用来创建数据库用户、控制数据库的访问权限
2.3 DDL
数据库操作

查询所有数据库
查询当前数据库
创建数据库
删除数据库
切换数据库

表操作

查询当前数据库所有表show tables;
查看指定表结构desc 表名 ;
查询指定表的建表语句show create table 表名 ;
创建表

修改表

1 添加字段

ALTER TABLE 表名 ADD 字段名 类型 (长度) [ COMMENT 注释 ] [ 约束 ];
# 为emp表增加一个新的字段”昵称”为nickname,类型为varchar(20)
ALTER TABLE emp ADD nickname varchar(20) COMMENT '昵称';

2 修改数据类型

ALTER TABLE 表名 MODIFY 字段名 新数据类型 (长度);

3). 修改字段名和字段类型

ALTER TABLE 表名 CHANGE 旧字段名 新字段名 类型 (长度) [ COMMENT 注释 ] [ 约束 ];
# 将emp表的nickname字段修改为username,类型为varchar(30)
ALTER TABLE emp CHANGE nickname username varchar(30) COMMENT '昵称';
create table tb_user(
id int comment '编号',
name varchar(50) comment '姓名',
age int comment '年龄',
gender varchar(1) comment '性别'
) comment '用户表';
数据类型

主要分为三类:数值类型、字符串类型、日期时间类型
1). 数值类型

类型 大小 有符号(SIGNED)范围 无符号(UNSIGNED)范围 描述
TINYINT 1 byte (-128,127) (0,255) 小整数值
SMALLINT 2 bytes (-32768,32767) (0,65535) 大整数值
MEDIUMINT 3 bytes (-8388608,8388607) (0,16777215) 大整数值
INT/INTEGER 4 bytes (-2147483648,2147483647) (0,4294967295) 大整数值
BIGINT 8 bytes (-263,263-1) (0,2^64-1) 极大整数值
FLOAT 4 bytes (-3.402823466 E+38,3.402823466351 E+38) 0 和 (1.175494351 E-38,3.402823466 E+38) 单精度浮点数值
DOUBLE 8 bytes (-1.7976931348623157 E+308,1.7976931348623157 E+308) 0 和 (2.2250738585072014 E-308,1.7976931348623157 E+308) 双精度浮点数值
DECIMAL 依赖于M(精度)和D(标度)的值 依赖于M(精度)和D(标度)的值 小数值(精确定点数)

2). 字符串类型

类型 大小 描述
CHAR 0-255 bytes 定长字符串(需要指定长度)
VARCHAR 0-65535 bytes 变长字符串(需要指定长度)
TINYBLOB 0-255 bytes 不超过255个字符的二进制数据
TINYTEXT 0-255 bytes 短文本字符串
BLOB 0-65 535 bytes 二进制形式的长文本数据
TEXT 0-65 535 bytes 长文本数据
MEDIUMBLOB 0-16 777 215 bytes 二进制形式的中等长度文本数据
MEDIUMTEXT 0-16 777 215 bytes 中等长度文本数据
LONGBLOB 0-4 294 967 295 bytes 二进制形式的极大文本数据
LONGTEXT 0-4 294 967 295 bytes 极大文本数据
char 与 varchar 都可以描述字符串,char是定长字符串,指定长度多长,就占用多少个字符,和字段值的长度无关 。而varchar是变长字符串,指定的长度为最大占用长度 。相对来说,char的性能会更高些。

1). 用户名 username ------> 长度不定, 最长不会超过50
username varchar(50)
2). 性别 gender ---------> 存储值, 不是男,就是女
gender char(1)
3). 手机号 phone --------> 固定长度为11
phone char(11)

3). 日期时间类型

类型 大小 范围 格式 描述
DATE 3 1000-01-01 至 9999-12-31 YYYY-MM-DD 日期值
TIME 3 -838:59:59 至 838:59:59 HH:MM:SS 时间值或持续时间
YEAR 1 1901 至 2155 YYYY 年份值
DATETIME 8 1000-01-01 00:00:00 至 9999-12-31 23:59:59 YYYY-MM-DD HH:MM:SS 混合日期和时间值
TIMESTAMP 4 1970-01-01 00:00:01 至 2038-01-19 03:14:07 YYYY-MM-DD HH:MM:SS 混合日期和时间值,时间戳
2.4 DML

数据操作语言,主要是增删改数据(INSERT UPDATE DELETE)

2.5DQL

数据准备

drop table if exists emp;
create table emp(
  id int comment '编号',
  workno varchar(10) comment '工号',
  name varchar(10) comment '姓名',
  gender char(1) comment '性别',
  age tinyint unsigned comment '年龄',
  idcard char(18) comment '身份证号',
  workaddress varchar(50) comment '工作地址',
  entrydate date comment '入职时间'
)comment '员工表';


INSERT INTO emp (id, workno, name, gender, age, idcard, workaddress, entrydate)
VALUES (1, '00001', '柳岩666', '女', 20, '123456789012345678', '北京', '2000-01-01');
INSERT INTO emp (id, workno, name, gender, age, idcard, workaddress, entrydate)
VALUES (2, '00002', '张无忌', '男', 18, '123456789012345670', '北京', '2005-09-01');
INSERT INTO emp (id, workno, name, gender, age, idcard, workaddress, entrydate)
VALUES (3, '00003', '韦一笑', '男', 38, '123456789712345670', '上海', '2005-08-01');
INSERT INTO emp (id, workno, name, gender, age, idcard, workaddress, entrydate)
VALUES (4, '00004', '赵敏', '女', 18, '123456757123845670', '北京', '2009-12-01');
INSERT INTO emp (id, workno, name, gender, age, idcard, workaddress, entrydate)
VALUES (5, '00005', '小昭', '女', 16, '123456769012345678', '上海', '2007-07-01');
INSERT INTO emp (id, workno, name, gender, age, idcard, workaddress, entrydate)
VALUES (6, '00006', '杨逍', '男', 28, '12345678931234567X', '北京', '2006-01-01');
INSERT INTO emp (id, workno, name, gender, age, idcard, workaddress, entrydate)
VALUES (7, '00007', '范瑶', '男', 40, '123456789212345670', '北京', '2005-05-01');
INSERT INTO emp (id, workno, name, gender, age, idcard, workaddress, entrydate)
VALUES (8, '00008', '黛绮丝', '女', 38, '123456157123645670', '天津', '2015-05-01');
INSERT INTO emp (id, workno, name, gender, age, idcard, workaddress, entrydate)
VALUES (9, '00009', '范凉凉', '女', 45, '123156789012345678', '北京', '2010-04-01');
INSERT INTO emp (id, workno, name, gender, age, idcard, workaddress, entrydate)
VALUES (10, '00010', '陈友谅', '男', 53, '123456789012345670', '上海', '2011-01-01');
INSERT INTO emp (id, workno, name, gender, age, idcard, workaddress, entrydate)
VALUES (11, '00011', '张士诚', '男', 55, '123567897123465670', '江苏', '2015-05-01');
INSERT INTO emp (id, workno, name, gender, age, idcard, workaddress, entrydate)
VALUES (12, '00012', '常遇春', '男', 32, '123446757152345670', '北京', '2004-02-01');
INSERT INTO emp (id, workno, name, gender, age, idcard, workaddress, entrydate)
VALUES (13, '00013', '张三丰', '男', 88, '123656789012345678', '江苏', '2020-11-01');
INSERT INTO emp (id, workno, name, gender, age, idcard, workaddress, entrydate)
VALUES (14, '00014', '灭绝', '女', 65, '123456719012345670', '西安', '2019-05-01');
INSERT INTO emp (id, workno, name, gender, age, idcard, workaddress, entrydate)
VALUES (15, '00015', '胡青牛', '男', 70, '12345674971234567X', '西安', '2018-04-01');
INSERT INTO emp (id, workno, name, gender, age, idcard, workaddress, entrydate)
VALUES (16, '00016', '周芷若', '女', 18, null, '北京', '2012-06-01');
基础查询

条件查询

比较运算符

运算符 功能
> 大于
>= 大于等于
< 小于
<= 小于等于
== 等于
!= 不等于
BETWEEN ... AND ... 在某个范围之内(含最小、最大值)
IN(...) 在列表中的值
LIKE 模糊匹配 (_匹配单个字符, %匹配任意个字符)
IS NULL 是 NULL

逻辑运算符

运算符 功能
AND&& 并且(多个条件同时成立)
OR 或 `
NOT! 非,不是
聚合函数
函数 功能
count 统计数量
max 最大值
min 最小值
avg 平均值
sum 求和
select count(*) from emp; -- 统计的是总记录数

select avg(age) from emp; -- 计算平均年龄

select sum(age) from emp where workaddress = '西安';
分组查询(注意where和having)

where与having区别

执行时机不同:where是分组之前进行过滤,不满足where条件,不参与分组;而having是分组之后对结果进行过滤。

判断条件不同:where不能对聚合函数进行判断,而having可以。

分组之后,查询的字段一般为聚合函数和分组字段,查询其他字段无任何意义。

执行顺序: where > 聚合函数 > having 。

# 根据性别分组 , 统计男性员工 和 女性员工的数量
select gender, count(*) from emp group by gender;

# 根据性别分组 , 统计男性员工 和 女性员工的平均年龄
select gender, avg(age) from emp group by gender ;

# 根据性别和工作地址分组 , 统计每个工作地址的男性员工 和 女性员工的数量
select workaddress, gender, count(*) '数量' from emp group by gender , workaddress;
排序查询
  • ASC : 升序(默认值)
  • DESC: 降序
select * from emp order by entrydate desc;
分页查询
  • 起始索引从0开始,起始索引 = (查询页码 - 1)* 每页显示记录数。
  • 分页查询是数据库的方言,不同的数据库有不同的实现,MySQL中是LIMIT。
  • 如果查询的是第一页数据,起始索引可以省略,直接简写为 limit 10。
# 查询员工信息,每页显示10条数据
select * from emp limit 0,10;
执行顺序

2.6DCL

数据控制语言,用来管理数据库用户、控制数据库的访问权限

管理用户和

# 查询用户
select * from mysql.user;

# 创建用户itcast, 只能够在当前主机localhost访问, 密码123456;
create user 'itcast'@'localhost' identified by '123456';

# 创建用户heima, 可以在任意主机访问该数据库, 密码123456
create user 'heima'@'%' identified by '123456';
# 修改用户heima的访问密码为1234;
alter user 'heima'@'%' identified with mysql_native_password by '1234';

# 删除 itcast@localhost 用户
drop user 'itcast'@'localhost';
# 删除 'heima'@'%' 用户
drop user 'heima'@'%';

3 函数

字符串函数

# concat : 字符串拼接
select concat('Hello' , ' MySQL');

# lower : 全部转小写
select lower('Hello');

# upper : 全部转大写
select upper('Hello');

# lpad : 左填充
select lpad('01', 5, '-');

# rpad : 右填充
select rpad('01', 5, '-');

# trim : 去除空格
select trim(' Hello MySQL ');

# substring : 截取子字符串
select substring('Hello MySQL',1,5);

数值函数

函数 功能
CEIL(x) 向上取整
FLOOR(x) 向下取整
MOD(x, y) 返回 x / y 的模
RAND() 返回 0~1 内的随机数
ROUND(x, y) 求参数 x 的四舍五入的值,保留 y 位小数
# ceil:向上取整
select ceil(1.1);
# floor:向下取整
select floor(1.1);
# mod:取模
select mod(10,3);
# rand:获取随机数
select rand();
# round:四舍五入
select round(2.344,2);

案例:

通过数据库的函数,生成一个六位数的随机验证码。

# 思路: 获取随机数可以通过rand()函数,但是获取出来的随机数是在0-1之间的,所以可以在其基础上乘以1000000,然后舍弃小数部分,如果长度不足6位,补0
select lpad(round(rand()*1000000,0),6,'0')

日期函数

函数 功能
CURDATE() 返回当前日期
CURTIME() 返回当前时间
NOW() 返回当前日期和时间
YEAR(date) 获取指定 date 的年份
MONTH(date) 获取指定 date 的月份
DAY(date) 获取指定 date 的日期
DATE_ADD(date, INTERVAL expr type) 返回一个日期/时间值加上一个时间间隔 expr 后的时间值
DATEDIFF(date1, date2) 返回起始时间 date1 和结束时间 date2 之间的天数
select curdate();
select curtime();
select now();
select YEAR(now());
select MONTH(now());
select DAY(now());
select date_add(now(), INTERVAL 70 YEAR );
select datediff('2021-10-01', '2021-12-01');

流程函数

函数 功能描述
IF(value, t, f) 如果 value 为 true,则返回 t,否则返回 f
IFNULL(value1, value2) 如果 value1 不为空,返回 value1,否则返回 value2
CASE WHEN [val1] THEN [res1] … ELSE [default] END 如果 val1 为 true,返回 res1,否则返回 default 默认值。
CASE [expr] WHEN [val1] THEN [res1] … ELSE [default] END 如果 expr 的值等于 val1,返回 res1,否则返回 default 默认值。
select if(false, 'Ok', 'Error');
select ifnull('Ok', 'Default');

# 需求: 查询emp表的员工姓名和工作地址 (北京/上海 ----> 一线城市 , 其他 ----> 二线城市)
select name,
       (case workaddress
            when '北京' then '一线城市'
            when '上海' then '一线城市'
            else '二线城市' end) as '工作地址'
from emp;

create table score
(
    id      int comment 'ID',
    name    varchar(20) comment '姓名',
    math    int comment '数学',
    english int comment '英语',
    chinese int comment '语文'
) comment '学员成绩表';
insert into score(id, name, math, english, chinese)
VALUES (1, 'Tom', 67, 88, 95),
       (2, 'Rose', 23, 66, 90),
       (3, 'Jack', 56, 98, 76);

select id,
       name,
       (case when math >= 85 then '优秀' when math >= 60 then '及格' else '不及格' end)
                '数学',
       (case
            when english >= 85 then '优秀'
            when english >= 60 then '及格'
            else '不及格'
           end) '英语',
       (case
            when chinese >= 85 then '优秀'
            when chinese >= 60 then '及格'
            else '不及格'
           end) '语文'
from score;

1). 数据库中,存储的是入职日期,如 2000-01-01,如何快速计算出入职天数呢? -------->

答案: datediff

2). 数据库中,存储的是学生的分数值,如98、75,如何快速判定分数的等级呢? ---------->

答案: case … when …

4 约束

概述

概念:约束是作用于表中字段上的规则,用于限制存储在表中的数据。

目的:保证数据库中数据的正确、有效性和完整性

约束 描述 关键字
非空约束 限制该字段的数据不能为 NULL NOT NULL
唯一约束 保证该字段的所有数据都是唯一、不重复的 UNIQUE
主键约束 主键是一行数据的唯一标识,要求非空且唯一 PRIMARY KEY
默认约束 保存数据时,如果未指定该字段的值,则采用默认值 DEFAULT
检查约束 保证字段值满足某一个条件 CHECK
外键约束 用来让两张表的数据之间建立连接,保证数据的一致性和完整性 FOREIGN KEY

约束演示

字段名 字段含义 字段类型 约束条件 约束关键字
id ID唯一标识 int 主键,并且自动增长 PRIMARY KEY, AUTO_INCREMENT
name 姓名 varchar(10) 不为空,并且唯一 NOT NULL, UNIQUE
age 年龄 int 大于0,并且小于等于120 CHECK
status 状态 char(1) 如果没有指定该值,默认为1 DEFAULT
gender 性别 char(1)
CREATE TABLE tb_user(
id int AUTO_INCREMENT PRIMARY KEY COMMENT 'ID唯一标识',
name varchar(10) NOT NULL UNIQUE COMMENT '姓名' ,
age int check (age > 0 && age <= 120) COMMENT '年龄' ,
status char(1) default '1' COMMENT '状态',
gender char(1) COMMENT '性别'
);


insert into tb_user(name,age,status,gender) values ('Tom1',19,'1','男'),
('Tom2',25,'0','男');
insert into tb_user(name,age,status,gender) values ('Tom3',19,'1','男');
insert into tb_user(name,age,status,gender) values ('Tom3',19,'1','男');
insert into tb_user(name,age,status,gender) values ('Tom4',80,'1','男');
insert into tb_user(name,age,status,gender) values ('Tom5',-1,'1','男');
insert into tb_user(name,age,status,gender) values ('Tom5',121,'1','男');
insert into tb_user(name,age,gender) values ('Tom5',120,'男');

明显,name重复的和age不在规定范围的添加失败

外键约束

介绍

外键:用来让两张表的数据之间建立连接,从而保证数据的一致性和完整性。

左侧的emp表是员工表,里面存储员工的基本信息,包含员工的ID、姓名、年龄、职位、薪资、入职日期、上级主管ID、部门ID,在员工的信息中存储的是部门的ID dept_id,而这个部门的ID是关联的部门表dept的主键id,那emp表的dept_id就是外键,关联的是另一张表的主键。

注意:目前上述两张表,只是在逻辑上存在这样一层关系;在数据库层面,并未建立外键关联,所以是无法保证数据的一致性和完整性的。

数据准备

create table dept(
id int auto_increment comment 'ID' primary key,
name varchar(50) not null comment '部门名称'
)comment '部门表';
INSERT INTO dept (id, name) VALUES (1, '研发部'), (2, '市场部'),(3, '财务部'), (4,
'销售部'), (5, '总经办');

drop table if exists emp;
create table emp(
id int auto_increment comment 'ID' primary key,
name varchar(50) not null comment '姓名',
age int comment '年龄',
job varchar(20) comment '职位',
salary int comment '薪资',
entrydate date comment '入职时间',
managerid int comment '直属领导ID',
dept_id int comment '部门ID'
)comment '员工表';
INSERT INTO emp (id, name, age, job,salary, entrydate, managerid, dept_id)
VALUES
(1, '金庸', 66, '总裁',20000, '2000-01-01', null,5),(2, '张无忌', 20,
'项目经理',12500, '2005-12-05', 1,1),
(3, '杨逍', 33, '开发', 8400,'2000-11-03', 2,1),(4, '韦一笑', 48, '开
发',11000, '2002-02-05', 2,1),
(5, '常遇春', 43, '开发',10500, '2004-09-07', 3,1),(6, '小昭', 19, '程
序员鼓励师',6600, '2004-10-12', 2,1);
语法

添加外键

CREATE TABLE 表名(
字段名 数据类型,
...
[CONSTRAINT] [外键名称] FOREIGN KEY (外键字段名) REFERENCES 主表 (主表列名)
);

ALTER TABLE 表名 ADD CONSTRAINT 外键名称 FOREIGN KEY (外键字段名)
REFERENCES 主表 (主表列名) ;

# 案例 为emp表的dept_id字段添加外键约束,关联dept表的主键id。
alter table emp add constraint fk_emp_dept_id foreign key (dept_id) references dept(id);

添加外简约束后,不能删除或更新父表记录,因为存在外键约束。

删除外建

# 删除外建
ALTER TABLE 表名 DROP FOREIGN KEY 外键名称;

# 删除emp表的外键fk_emp_dept_id。
alter table emp drop foreign key fk_emp_dept_id;
删除/更新行为
行为 说明
NO ACTION 当在父表中删除/更新对应记录时,首先检查该记录是否有对应外键,如果有则不允许删除/更新。 (与 RESTRICT 一致) 默认行为
RESTRICT 当在父表中删除/更新对应记录时,首先检查该记录是否有对应外键,如果有则不允许删除/更新。 (与 NO ACTION 一致) 默认行为
CASCADE 当在父表中删除/更新对应记录时,首先检查该记录是否有对应外键,如果有,则也删除/更新外键在子表中的记录。
SET NULL 当在父表中删除对应记录时,首先检查该记录是否有对应外键,如果有则设置子表中该外键值为 null(这就要求该外键允许取 null)。
SET DEFAULT 父表有变更时,子表将外键列设置成一个默认的值 (InnoDB 不支持)
  1. CASCADE
# 语法
ALTER TABLE 表名 ADD CONSTRAINT 外键名称 FOREIGN KEY (外键字段) REFERENCES
主表名 (主表字段名) ON UPDATE CASCADE ON DELETE CASCADE;

SET NULL
alter table emp add constraint fk_emp_dept_id foreign key (dept_id) references
dept(id) on update cascade on delete cascade ;

修改父表id为1的记录,将id修改为6

原来在子表中dept_id值为1的记录,现在也变为6了,这就是cascade级联的效果。

删除父表id为6的记录

父表的数据删除成功了,但是子表中关联的记录也被级联删除了

  1. SET NULL

在进行测试之前,我们先需要删除上面建立的外键 fk_emp_dept_id。然后再通过数据脚本,将emp、dept表的数据恢复了。

alter table emp add constraint fk_emp_dept_id foreign key (dept_id) references
dept(id) on update set null on delete set null ;

删除id为1的数据

父表的记录是可以正常的删除的,父表的数据删除之后,再打开子表 emp,我们发现子表emp的dept_id字段,原来dept_id为1的数据,现在都被置为NULL了。

5 多表查询

5.1 多表管理

由于业务之间相互关联,所以各个表结构之间也存在着各种联系,基本上分为三种:

一对多,多对多,一对一。

一对多

案例: 部门 与 员工的关系

关系: 一个部门对应多个员工,一个员工对应一个部门

实现: 在多的一方建立外键,指向一的一方的主键

多对多

案例: 学生 与 课程的关系

关系: 一个学生可以选修多门课程,一门课程也可以供多个学生选择

实现: 建立第三张中间表,中间表至少包含两个外键,分别关联两方主键

drop table if exists student_course;
# 学生表
create table student
(
    id   int auto_increment primary key comment '主键ID',
    name varchar(10) comment '姓名',
    no   varchar(10) comment '学号'
) comment '学生表';
insert into student
values (null, '黛绮丝', '2000100101'),
       (null, '谢逊',
        '2000100102'),
       (null, '殷天正', '2000100103'),
       (null, '韦一笑', '2000100104');

# 课程表
drop table if exists course;
create table course
(
    id   int auto_increment primary key comment '主键ID',
    name varchar(10) comment '课程名称'
) comment '课程表';
insert into course
values (null, 'Java'),
       (null, 'PHP'),
       (null, 'MySQL'),
       (null, 'Hadoop');

# 学生课程中间表
drop table if exists student_course;
create table student_course
(
    id        int auto_increment comment '主键' primary key,
    studentid int not null comment '学生ID',
    courseid  int not null comment '课程ID',
    constraint fk_courseid foreign key (courseid) references course (id),
    constraint fk_studentid foreign key (studentid) references student (id)
) comment '学生课程中间表';
insert into student_course
values (null, 1, 1),
       (null, 1, 2),
       (null, 1, 3),
       (null, 2, 2),
       (null, 2, 3),
       (null, 3, 4);
一对一

案例: 用户 与 用户详情的关系

关系: 一对一关系,多用于单表拆分,将一张表的基础字段放在一张表中,其他详情字段放在另一张表中,以提升操作效率

实现: 在任意一方加入外键,关联另外一方的主键,并且设置外键为唯一的(UNIQUE)

5.2 多表查询概述

多表查询就是指从多张表中查询数据。

原来查询单表数据,执行的SQL形式为:select * from emp;

那么我们要执行多表查询,就只需要使用逗号分隔多张表即可,如: select * from emp , dept;

我们看到查询结果中包含了大量的结果集,总共102条记录,而这其实就是员工表emp所有的记录(17) 与 部门表dept所有记录(6) 的所有组合情况,这种现象称之为笛卡尔积。接下来,就来简单介绍下笛卡尔积。

笛卡尔积: 笛卡尔乘积是指在数学中,两个集合A集合 和 B集合的所有组合情况。

而在多表查询中,我们是需要消除无效的笛卡尔积的,只保留两张表关联部分的数据。

在SQL语句中,如何来去除无效的笛卡尔积呢? 我们可以给多表查询加上连接查询的条件即可。

select * from emp , dept where emp.dept_id = dept.id;

而由于id为17的员工,没有dept_id字段值,所以在多表查询时,根据连接查询的条件并没有查询到。

分类

连接查询

  • 内连接:相当于查询A、B交集部分数据
  • 外连接:
  • 左外连接:查询左表所有数据,以及两张表交集部分数据
  • 右外连接:查询右表所有数据,以及两张表交集部分数据
  • 自连接:当前表与自身的连接查询,自连接必须使用表别名

子查询

5.3 内连接

内连接查询的是两张表交集部分的数据。(也就是绿色部分的数据)

内连接的语法分为两种: 隐式内连接、显式内连接。

# 1 隐式内连接
SELECT 字段列表 FROM1 ,2 WHERE 条件 ... ;
# 2 显式内连接
SELECT 字段列表 FROM1 [ INNER ] JOIN2 ON 连接条件 ... ;

# 查询每一个员工的姓名 , 及关联的部门的名称 (隐式内连接实现)
select emp.name,dept.name from emp,dept where emp.dept_id=dept.id;

# 查询每一个员工的姓名 , 及关联的部门的名称 (显式内连接实现) --- INNER JOIN ...ON ...
select  emp.name,dept.name from emp join dept on

5.4 外连接

外连接分为两种,分别是:左外连接 和 右外连接。

# 左外连接
SELECT 字段列表 FROM1 LEFT [ OUTER ] JOIN2 ON 条件 ... ;
# 右外连接
SELECT 字段列表 FROM1 RIGHT [ OUTER ] JOIN2 ON 条件 ... ;

# 查询emp表的所有数据, 和对应的部门信息
# 由于需求中提到,要查询emp的所有数据,所以是不能内连接查询的,需要考虑使用外连接查询。
select d.*,e.* from emp e left outer join dept d on e.dept_id=d.id;

select d.*,e.* from emp e left join dept d on e.dept_id=d.id;


# 查询dept表的所有数据, 和对应的员工信息(右外连接)
select d.*,e.* from emp e right join dept d on d.id = e.dept_id;

左外连接和右外连接是可以相互替换的,只需要调整在连接查询时SQL中,表结构的先后顺序就可以了。而我们在日常开发使用时,更偏向于左外连接。

5.5 自连接

自连接查询

自己连接自己,也就是把一张表连接查询多次。对于自连接查询,可以是内连接查询,也可以是外连接查询。

SELECT 字段列表 FROM 表A 别名A JOIN 表A 别名B ON 条件 ... ;

# 查询员工 及其 所属领导的名字
select a.name '员工', b.name '领导'
from emp a,
     emp b
where a.managerid = b.id;

# 查询所有员工 emp 及其领导的名字 emp , 如果员工没有领导, 也需要查询出来
select a.name '员工', b.name '领导'
from emp a
         left join emp b on a.managerid = b.id;

在自连接查询中,必须要为表起别名,要不然我们不清楚所指定的条件、返回的字段,到底是哪一张表的字段

联合查询

对于union查询,就是把多次查询的结果合并起来,形成一个新的查询结果集。

SELECT 字段列表 FROM 表A ...
UNION [ ALL ]
SELECT 字段列表 FROM 表B ....;

对于联合查询的多张表的列数必须保持一致,字段类型也需要保持一致。

union all 会将全部的数据直接合并在一起,union 会对合并之后的数据去重。

# 将薪资低于 5000 的员工 , 和 年龄大于 50 岁的员工全部查询出来(未去重)
select * from emp where salary<5000
union all
select * from emp where age>50;

union all查询出来的结果,仅仅进行简单的合并,并未去重。

# 已去重
select * from emp where salary<5000
union
select * from emp where age>50;

如果多条查询语句查询出来的结果,字段数量不一致,在进行union/union all联合查询时,将会报错

5.6 子查询

SQL语句中嵌套SELECT语句,称为嵌套查询,又称子查询。

SELECT * FROM t1 WHERE column1 = ( SELECT column1 FROM t2 );

子查询外部的语句可以是INSERT / UPDATE / DELETE / SELECT 的任何一个。

根据子查询结果不同,分为:

A. 标量子查询(子查询结果为单个值)

B. 列子查询(子查询结果为一列)

C. 行子查询(子查询结果为一行)

D. 表子查询(子查询结果为多行多列)

根据子查询位置,分为:

A. WHERE之后

B. FROM之后

C. SELECT之后

标量子查询

子查询返回的结果是单个值(数字、字符串、日期等),最简单的形式,这种子查询称为标量子查询。

常用的操作符:= <> > >= < <=

# 案例 查询 "销售部" 的所有员工信息
# 1 查询 "销售部" 部门ID
select id
from dept
where name = '销售部';
# 2 查询 "销售部" 部门的所有员工信息
select *
from emp
where dept_id = (select id from dept where name = '销售部');

# 查询在 "方东白" 入职之后的员工信息
# 1 查询 "方东白" 的入职日期
select entrydate from emp where name='方东白';
# 2 查询在 "方东白" 入职之后的员工信息
select * from emp where entrydate > (select entrydate from emp where name='方东白');
列子查询

子查询返回的结果是一列(可以是多行),这种子查询称为列子查询。

常用的操作符:IN 、NOT IN 、 ANY 、SOME 、 ALL

操作符 描述
IN 在指定的集合范围之内,多选一
NOT IN 不在指定的集合范围之内
ANY 子查询返回列表中,有任意一个满足即可
SOME 与 ANY 等同,使用 SOME 的地方都可以使用 ANY
ALL 子查询返回列表的所有值都必须满足
# 查询比 财务部 最低工资高的员工信息
# 查询财务部人员工资
select id
from dept
where name = '财务部';
select salary
from emp
where dept_id = (select id from dept where name = '财务部');

# 比财务部最低工资高的员工信息
select *
from emp
where salary > any (select salary from emp where dept_id = (select id from dept where name = '财务部'));

两列

行子查询

子查询返回的结果是一行(可以是多列),这种子查询称为行子查询。

常用的操作符:= 、<> 、IN 、NOT IN

# 查询与 "张无忌" 的薪资及直属领导相同的员工信息 ;
# 1 查询"张无忌"的薪资及直属领导
select salary, managerid
from emp
where name = '张无忌';
# 2 查询与 "张无忌" 的薪资及直属领导相同的员工信息 ;
select *
from emp
where (salary, managerid) = (select salary, managerid from emp where name = '张无忌');

两行

表子查询

子查询返回的结果是多行多列,这种子查询称为表子查询。

常用的操作符:IN

# 查询与 "鹿杖客" , "宋远桥" 的职位和薪资相同的员工信息
# 1查询 "鹿杖客" , "宋远桥" 的职位和薪资
select job, salary
from emp
where name in ('鹿杖客', '宋远桥');
# 2查询与 "鹿杖客" , "宋远桥" 的职位和薪资相同的员工信息
select *
from emp
where (job, salary) in (select job, salary from emp where name in ('鹿杖客', '宋远桥'));

# 查询入职日期是 "2006-01-01" 之后的员工信息 , 及其部门信息
# 1入职日期是 "2006-01-01" 之后的员工信息
select *
from emp
where entrydate > '2006-01-01';
# 查询这部分员工, 对应的部门信息;
select e.*, d.*
from (select * from emp where entrydate > '2006-01-01') e
         left join dept d on e.dept_id = d.id;

两行两列

5.7 多表查询案例

drop table if exists salgrade;
create table salgrade
(
    grade int,
    losal int,
    hisal int
) comment '薪资等级表';
insert into salgrade
values (1, 0, 3000);
insert into salgrade
values (2, 3001, 5000);
insert into salgrade
values (3, 5001, 8000);
insert into salgrade
values (4, 8001, 10000);
insert into salgrade
values (5, 10001, 15000);
insert into salgrade
values (6, 15001, 20000);
insert into salgrade
values (7, 20001, 25000);
insert into salgrade
values (8, 25001, 30000);

emp员工表、dept部门表、salgrade薪资等级表

# 1 查询员工的姓名、年龄、职位、部门信息 (隐式内连接)
select e.name, e.age, e.job, d.name
from emp e,
     dept d
where e.dept_id = d.id;

# 2 查询年龄小于30岁的员工的姓名、年龄、职位、部门信息(显式内连接)
select e.name, e.age, e.job, d.name
from emp e
         inner join dept d on e.dept_id = d.id
where e.age < 30;

# 3 查询拥有员工的部门ID、部门名称
select distinct d.id, d.name
from emp e,
     dept d
where e.dept_id = d.id;

# 4 查询所有年龄大于40岁的员工, 及其归属的部门名称; 如果员工没有分配部门, 也需要展示出来(外连接)
select e.*, d.name
from emp e
         left join dept d on e.dept_id = d.id
where age > 40;

# 5 查询所有员工的工资等级
# 由薪水区间划分等级,需要找一个等级的最低薪水和最高薪水
select e.*, s.grade, s.losal, s.hisal
from emp e,
     salgrade s
where e.salary between s.losal and s.hisal;

# 6 查询 "研发部" 所有员工的信息及 工资等级
select e.*, s.grade
from emp e,
     dept d,
     salgrade s
where e.dept_id = d.id
  and e.salary between s.losal and s.hisal
  and d.name = '研发部';

# 7 查询 "研发部" 员工的平均工资
select avg(e.salary)
from emp e,
     dept d
where e.dept_id = d.id
  and d.name = '研发部';

# 8 查询工资比 "灭绝" 高的员工信息。
select *
from emp
where salary > (select salary from emp where name = '灭绝');

# 9 查询比平均薪资高的员工信息
select *
from emp
where salary > (select avg(salary) from emp);

# 10 查询低于本部门平均工资的员工信息
# (1)查询指定部门平均薪资
select avg(e1.salary)
from emp e1
where e1.dept_id = 1;

select avg(e1.salary)
from emp e1
where e1.dept_id = 2;

# (2) 查询低于本部门平均工资的员工信息
# select *
# from emp e
# where e.salary < (select avg(e1.salary)
#                    from emp e1,
#                         dept d1
#                    where e1.dept_id = 2);  需要修改2 ,再使用内连接查询
select *
from emp e2
where e2.salary < (select avg(e1.salary)
                   from emp e1,
                        dept d1
                   where e1.dept_id = e2.dept_id);

# 11 查询所有的部门信息, 并统计部门的员工人数
select d.id, d.name, (select count(*) from emp where dept_id = d.id) '人数'
from dept d;

# 12 查询所有学生的选课情况, 展示出学生名称, 学号, 课程名称
select s.name, s.no, c.name
from student s,
     student_course sc,
     course c
where s.id = sc.studentid
  and sc.courseid = c.id;