MySQL基础总结合集

发布于:2022-12-13 ⋅ 阅读:(2158) ⋅ 点赞:(2)

MySQL是啥?数据库又是啥?

MySQL:

MySQL 是最流行的关系型数据库管理系统,在 WEB 应用方面 MySQL 是最好的 RDBMS(Relational Database Management System:关系数据库管理系统)应用软件之一。

数据库:

数据库(Database)是按照数据结构来组织、存储和管理数据的仓库。

每个数据库都有一个或多个不同的 API 用于创建,访问,管理,搜索和复制所保存的数据。

我们也可以将数据存储在文件中,但是在文件中读写数据速度相对较慢。

所以,我们使用关系型数据库管理系统一般是用来存储和管理大数据量。

关系型数据库(SQL):关系型数据库指的是使用关系模型(二维表格模型)来组织数据的数据库。

非关系型数据库(NOSQL):非关系型数据库又被称为 NoSQL(Not Only SQL ),意为不仅仅是 SQL。通常指数据以对象的形式存储在数据库中,而对象之间的关系通过每个对象自身的属性来决定,常用于存储非结构化的数据。

MySQL安装及配置

  1. 首先先下载到一个文件夹中

  2. 下载后在环境变量中Path路径 添加MySQL的bin目录的路径

  3. 在 mysql-5.7.19-winx64 文件夹中 创建一个 my.ini 文件,内容为:

    [client]
    port=3306
    default-character-set=utf8
    [mysqld]
    #设置为自己MYSQL的安装目录
    basedir=D:\hspmysql\mysql-5.7.19-winx64\
    #设置为MYSQL的数据目录
    datadir=E:\mysql-5.7.19-winx64\data\
    port=3306
    character_set_server=utf8
    ##跳过安全检查,注销后,需要输入正确的用户名和密码才能启动
    skip-grant-tables
  4. 使用管理员的身份打开cmd,并切换到安装的MySQL的bin目录底下,执行 mysqld-install

  5. 初始化数据库:mysqld --initialize-insecure --user=mysql 此句执行后就会生成一个 data 目录

  6. 启动服务 net start mysql (要看MySQL服务是否启动可以去任务管理器的服务栏看)

  7. 关闭服务 net stop mysql

  8. 进入MySQL管理终端 mysql -u root -p

  9. 使用mysql数据库 :use mysql; 然后 UPDATE user SET authentication_string = PASSWORD('新的密码') WHERE user = 'dbadmin' AND host = 'localhost'; FLUSH PRIVILEGES; 这句表示刷新一下权限

  10. quit 指退出管理终端

如果真在 5-10步骤中哪里出了非错,可删除MySQL后重新配置服务 (sc delete mysql 改语句工作时一定要慎用!!)

4~7步一定要以管理员身份运行控制台才行

MySQL的服务,默认是“启动”的状态,只有启动了mysql才能用。 默认情况下是“自动”启动,自动启动表示下一次重启操作系统的时候自动启动该服务。

可以在服务上点击右键: 启动 重启服务 停止服务 ...

还可以改变服务的默认配置: 服务上点击右键,属性,然后可以选择启动方式: 自动(延迟启动) 自动 手动 禁用

在windows操作系统当中,怎么使用命令来启动和关闭mysql服务呢? 语法: net stop 服务名称; net start 服务名称;

其它服务的启停都可以采用以上的命令。

使用命令行窗口连接MySQL数据库:

首先,MySQL是一种服务(可在任务管理器服务栏中查看到MySQL),而只要是一个服务都会监听一个端口

mysql -h 主机IP -P 端口 -u 用户名 -p密码 (p和密码间不要有空格,如果-p后面没有写密码,回车后会要求输入密码)

如果不写 -h 主机IP,默认就是连接到本地

如果不写-P 端口,默认就是3306

在实际工作中往往会修改端口号而不是使用此默认端口号,此处为了方便就不做改动了

MySQL数据库的三层结构

数据在数据库中的存储形式

以表格的形式存储数据

任何一张表都有行和列:

行(row):被称为数据/记录。 ​ 列(column):被称为字段。

每一个字段都有:字段名、数据类型、约束等属性。 字段名可以理解是一个普通的名字,见名知意就行。 数据类型:字符串,数字,日期等。

什么是SQL语句?

SQL:结构化查询语言 程序员需要学习SQL语句,程序员通过编写SQL语句,然后DBMS负责执行SQL 语句,最终来完成数据库中数据的增删改查操作。

SQL语句分类

DQL:数据查询语言[select…… ]

DML:数据操作语言[增加insert ,修改update,删除delete] 操作的是表中的数据

DDL:数据定义语言[create、drop、alter] 操作的是表的结构

DCL:数据控制语言[管理数据库,比如:授权grant、撤销权限revoke.... ]

TCL:事务控制语言 [如:事务提交:commit; 事务回滚:rollback;]

数据库、数据库管理系统、SQL之间的关系

三者之间的关系? DBMS通过执行SQL来操作DB

先安装数据库管理系统MySQL,然后学习SQL语句怎么写,编写SQL语句之后,DBMS 对SQL语句进行执行,最终来完成数据库的数据管理。

常用命令

注意:这些命令不区分大小写都行。

注意:mysql是不见“;”不执行,“;”表示结束!

退出exit; 或者 quit;

查看mysql数据库的版本号: select version();

查看mysql中有哪些数据库? show databases; 注意:以分号结尾,分号是英文的分号。

mysql默认自带了4个数据库。

怎么选择使用某个数据库呢? mysql> use test; 表示使用一个名字叫做test的数据库。

查看当前使用的是哪个数据库? mysql> select database();

导入一下提前准备好的数据: bjpowernode.sql 是提前为练习准备的数据库表。 怎么将sql文件中的数据导入呢?(可以将文件拖入source空格 后) 要在使用某个数据库后才能使用该语句 mysql> source D:\course\03-MySQL\document\bjpowernode.sql

注意:路径中不要有中文!!!!

不看表中的数据,只看表的结构,有一个命令: desc 表名;

简单查询

查询一个字段?

select 字段名 from 表名;

查询两个字段,或者多个字段怎么办? 使用逗号隔开“,”

查询所有字段?

使用:select * from 表名;

别把把这种写法写到 Java 程序中,因为到时还要把 * 先转换成字段

缺点:①效率低 ②可读性差。

在实际开发中不建议,可以自己玩没问题。 你可以在DOS命令窗口中想快速的看一看全表数据可以采用这种方式。

给查询的列起别名?

使用 as 关键字,可以省略 select deptno,dname as deptname from dept;

假设起别名的时候,别名里面有空格,怎么办? mysql> select deptno,dname dept name from dept; DBMS看到这样的语句,进行SQL语句的编译,不符合语法,编译报错。 怎么解决? select deptno,dname 'dept name' from dept; //加单引号 select deptno,dname "dept name" from dept; //加双引号

注意:在所有的数据库当中,字符串统一使用单引号括起来, 单引号是标准,双引号在oracle数据库中用不了。但是在mysql 中可以使用。

再次强调:数据库中的字符串都是采用单引号括起来。这是标准的。 双引号不标准。

字段可以使用数学表达式

select ename,sal*12 from emp;

显示时字段名是 sal*12 这样时一般取个别名 select ename,sal*12 year_sal from emp;

条件查询

什么是条件查询?

查询出来符合条件的 ​ 语法格式: ​ select ​ 字段1,字段2,字段3.... ​ from ​ 表名 ​ where ​ 条件;

都有哪些条件?

= 等于 查询薪资等于800的员工姓名和编号? select empno,ename from emp where sal = 800;

<> 或 != 不等于 查询薪资不等于800的员工姓名和编号? select empno,ename from emp where sal != 800;

同理还有:<=,<,>=,>

between … and …. 两个值之间, 等同于 >= and <=

查询薪资在2450和3000之间的员工信息?包括2450和3000?

注意: 使用between and的时候,必须遵循左小右大。 between and是闭区间,包括两端的值。

is null 表示为 null(is not null 不为空)

查询哪些员工的津贴/补助为null? select empno,ename,sal,comm from emp where comm = null;(像这样用=是查不到的) Empty set (0.00 sec)

注意:在数据库当中null不能使用等号进行衡量。需要使用is null 因为数据库中的null代表什么也没有,它不是一个值,所以不能使用 等号衡量。

正确的:select empno,ename,sal,comm from emp where comm is null;

and 并且 查询工作岗位是MANAGER并且工资大于2500的员工信息?

select empno,ename,job,sal from emp where job = 'MANAGER' and sal > 2500;

or 或者

查询工作岗位是MANAGER或SALESMAN的员工?

select empno,ename,job from emp where job = 'MANAGER' or job = 'SALESMAN';

and和or同时出现的话,有优先级问题吗?(开发中如不记得优先级,加小括号) 查询工资大于2500,并且部门编号为10或20部门的员工? select * from emp where sal > 2500 and deptno = 10 or deptno = 20; 分析以上语句的问题? and优先级比or高。 以上语句会先执行and,然后执行or。 以上这个语句表示什么含义? 找出工资大于2500并且部门编号为10的员工,或者20部门所有员工找出来。 正确做法:select * from emp where sal > 2500 and (deptno = 10 or deptno = 20);

in 包含,相当于多个 or (not in 不在这个范围中) 查询工作岗位是MANAGER和SALESMAN的员工? select empno,ename,job from emp where job = 'MANAGER' or job = 'SALESMAN'; select empno,ename,job from emp where job in('MANAGER', 'SALESMAN');

注意:in不是一个区间。in后面跟的是具体的值。

查询薪资是800和5000的员工信息? select ename,sal from emp where sal = 800 or sal = 5000; select ename,sal from emp where sal in(800, 5000); //这个不是表示800到5000都找出来。

not in 表示不在这几个值当中的数据。 select ename,sal from emp where sal not in(800, 5000, 3000);

not 可以取非,主要用在 is 或 in 中 is null is not null in not in

like 称为模糊查询,支持%或下划线匹配 %匹配任意多个字符 下划线:任意一个字符。 (%是一个特殊的符号,_ 也是一个特殊符号)

找出名字中含有O的? mysql> select ename from emp where ename like '%O%';

找出名字以T结尾的? select ename from emp where ename like '%T';

找出名字以K开始的? select ename from emp where ename like 'K%';

找出第二个字每是A的? select ename from emp where ename like '_A%';

找出第三个字母是R的? select ename from emp where ename like '__R%';

找出名字中有“_”的? select name from t_student where name like '%_%'; //这样不行。

正确: select name from t_student where name like '%\_%'; // \转义字符。

对查询结果排序

排序 order by( 默认是升序!!!)

查询所有员工薪资,排序? select ename,sal from emp order by sal;

怎么降序(后面加上desc)?

指定降序: select ename,sal from emp order by sal desc;

可以两个字段排序吗?或者说按照多个字段排序? 查询员工名字和薪资,要求按照薪资升序,如果薪资一样的话, 再按照名字升序排列。 select ename,sal from emp order by sal desc, ename asc; // sal在前,起主导,只有sal相等的时候,才会考虑启用ename排序。

了解内容:根据字段的位置也可以排序 select ename,sal from emp order by 2; // 2表示第二列。第二列是sal 按照查询结果的第2列sal排序。

了解一下,不建议在开发中这样写,因为不健壮。 因为列的顺序很容易发生改变,列顺序修改之后,2就废了

综合一点的案例: 找出工资在1250到3000之间的员工信息,要求按照薪资降序排列。 select ename,sal from emp where sal between 1250 and 3000 order by sal desc;

以上语句的执行顺序必须掌握: 第一步:from 第二步:where 第三步:select 第四步:order by

数据处理函数

数据处理函数又被称为单行处理函数

单行处理函数的特点:一个输入对应一个输出。

和单行处理函数相对的是:多行处理函数。(多行处理函数特点:多个输入,对应1个输出!)

常见的单行处理行数

lower 转换小写 select lower(ename) as ename from emp;

+--------+
| ename  |
+--------+
| smith  |
| allen  |
| ward   |
| jones  |
| martin |
| blake  |
| clark  |
| scott  |
| king   |
| turner |
| adams  |
| james  |
| ford   |
| miller |
+--------+

14个输入,最后还是14个输出。这是单行处理函数的特点。

upper 转换大写 select upper(name) as name from t_student;

substr 取子串(substr( 被截取的字符串, 起始下标,截取的长度)) select substr(ename, 1, 1) as ename from emp; 注意:起始下标从1开始,没有0.

LEFT (string2 ,length )从 string2 中的左边起取 length 个字符

RIGHT (string2 ,length ) 从 string2 中的右边起取 length 个字符

找出员工名字第一个字母是A的员工信息? 第一种方式:模糊查询 select ename from emp where ename like 'A%'; 第二种方式:substr函数 select ename from emp where substr(ename,1,1) = 'A';

学生名字首字母大写?

select concat(upper(substr(name,1,1)),substr(name,2,length(name) - 1)) as result from t_student;

注意:字符串拼接一定要用concat而不能用+

像这样不行:select upper(substr(name,1,1)) + substr(name,2,length(name) - 1) from t_student;

concat函数进行字符串的拼接 select concat(empno,ename) from emp;

可以拼接多个concat(……,……,……)

length 取长度 select length(ename) enamelength from emp;

trim 去两边空格

select * from emp where ename = trim(' KING');

RTrim切除右边的空格,LTrim切除左边的空格

str_to_date 将字符串转换成日期 date_format 格式化日期 format 设置千分位

(后面讲)

一个诡异的现象

select 'abc' as bieming from emp; // select后面直接跟“字面量/字面值”

        +---------+
        | bieming |
        +---------+
        | abc     |
        | abc     |
        | abc     |
        | abc     |
        | abc     |
        | abc     |
        | abc     |
        | abc     |
        | abc     |
        | abc     |
        | abc     |
        | abc     |
        | abc     |
        | abc     |
        +---------+

select abc from emp; ERROR 1054 (42S22): Unknown column 'abc' in 'field list' 这样肯定报错,因为会把abc当做一个字段的名字,去emp表中找abc字段去了。

结论:select后面可以跟某个表的字段名(可以等同看做变量名),也可以跟字面量/字面值(数据)。 select 21000 as num from dept;// 21000也是被当做一个字面量/字面值。

    +-------+
    | num   |
    +-------+
    | 21000 |
    | 21000 |
    | 21000 |
    | 21000 |
    +-------+

round(要操作的数, 保留几位小数) 四舍五入

select round(21000.4, 0) as num from dept; //结果和上面一样

select round(1236.567, -1); // 保留到十位。

rand() 生成随机数 在 0 ≤ 随机数 ≤ 1.0 select floor(rand()*100); // 100以内的随机数

如果使用 rand(seed) 返回随机数, 范围 0 ≤ 随机数 ≤ 1.0, 如果 seed 不变,多次执行返回的结果也是不变的

ifnull是空处理函数。专门处理空的,可以将 null 转换成一个具体值

在所有的数据库当中,只要有null参与了数学运算,最终结果就是NULL

计算每个员工的年薪?

select ename, (sal + ifnull(comm, 0))*12 year_sal from emp;

case..when..then..when..then..else..end 当员工的工作岗位是MANAGER的时候,工资上调10%,当工作岗位是SALESMAN的时候,工资上调50%,其它正常。 (注意:不修改数据库,只是将查询结果显示为工资上调) select ename, job, sal as oldsal, (case job when 'MANAGER' then sal*1.1 when 'SALESMAN' then sal*1.5 else sal end) as newsal from emp;

select 后可以不接from 当作简单的测试工具

等同于接了from dual;

dual为 亚元表, 系统表 可以作为测试表使用

select round(3.14, 3);

+----------------+
| round(3.14, 3) |
+----------------+
|          3.140 |
+----------------+

select concat('13','57','9');

+-----------------------+
| concat('13','57','9') |
+-----------------------+
| 13579                 |
+-----------------------+

多行处理函数

五个分组函数

多行处理函数也叫分组函数

多行处理函数的特点:输入多行,最终输出一行。

5个: count 计数 sum 求和 avg 平均值 max 最大值 min 最小值

注意: 分组函数在使用的时候必须先进行分组,然后才能用。 如果你没有对数据进行分组,整张表默认为一组。

找出最高工资? mysql> select max(sal) from emp;

找出最低工资? mysql> select min(sal) from emp;

计算工资和: mysql> select sum(sal) from emp;

计算平均工资: mysql> select avg(sal) from emp;

计算员工数量? mysql> select count(ename) from emp;

计算员工数量? mysql> select count(ename) from emp;

注意:如果count中填的是表达式的话,要加上 or null, 因为 Mysql 中 count() 函数的一般用法是统计字段非空的记录数,利用这个特点来进行条件统计,如果字段是 NULL 就不会统计,但是 false 是会被统计到的

分组函数在使用的时候需要注意哪些?

分组函数自动忽略NULL,你不需要提前对NULL进行处理。

mysql> select sum(comm) from emp;

    +-----------+
    | sum(comm) |
    +-----------+
    |   2200.00 |
    +-----------+

分组函数中count(*) 和 count(具体字段) 有什么区别?

count(具体字段):表示统计该字段下所有不为NULL的元素的总数。 count(*):统计表当中的总行数。(只要有一行数据count则++) 每一行记录不可能都为NULL(不存在一行全为null的表),一行数据中有一列不为NULL,则这行数据就是有效的。

mysql> select count(*) from emp;
+----------+
| count(*) |
+----------+
|       14 |
+----------+
​
mysql> select count(comm) from emp;
+-------------+
| count(comm) |
+-------------+
|           4 |
+-------------+

分组函数不能直接使用在where子句中

找出比最低工资高的员工信息。 select ename,sal from emp where sal > min(sal); 表面上意思感觉是没问题,运行一下发现: ERROR 1111 (HY000): Invalid use of group function ????????????????????????????????????????????????????????????????????? 分组函数在使用的时候必须先进行分组,而分组的group by 执行顺序是在where后的,也就是让分组函数 min 先于分组了,所以会报错

所有的分组函数可以组合起来一起用

select sum(sal),min(sal),max(sal),avg(sal),count(*) from emp;

+----------+----------+----------+-------------+----------+
| sum(sal) | min(sal) | max(sal) | avg(sal)    | count(*) |
+----------+----------+----------+-------------+----------+
| 29025.00 |   800.00 |  5000.00 | 2073.214286 |       14 |
+----------+----------+----------+-------------+----------+

分组查询

在实际的应用中,可能有这样的需求,需要先进行分组,然后对每一组的数据进行操作。 这个时候我们需要使用分组查询,怎么进行分组查询呢? select ... from ... group by ... 计算每个部门的工资和? 计算每个工作岗位的平均薪资? 找出每个工作岗位的最高薪资? ....

将之前的关键字全部组合在一起,他们的执行顺序? select ... from ... where ... group by ... order by ...

以上关键字的顺序不能颠倒,需要记住。 执行顺序是什么? 1.from 2.where 3.group by 4.select 5.order by

为什么分组函数不能直接使用在where后面? select ename,sal from emp where sal > min(sal);//报错。 因为分组函数在使用的时候必须先分组之后才能使用。 where执行的时候,还没有分组。所以where后面不能出现分组函数。

select sum(sal) from emp; ​ 这个没有分组,为啥sum()函数可以用呢? ​ 因为select在group by之后执行。

找出每个工作岗位的工资和? 实现思路:按照工作岗位分组,然后对工资求和。 select job,sum(sal) from emp group by job;

+-----------+----------+
| job       | sum(sal) |
+-----------+----------+
| ANALYST   |  6000.00 |
| CLERK     |  4150.00 |
| MANAGER   |  8275.00 |
| PRESIDENT |  5000.00 |
| SALESMAN  |  5600.00 |
+-----------+----------+
以上这个语句的执行顺序?
先从emp表中查询数据。
根据job字段进行分组。
然后对每一组的数据进行sum(sal)

重点结论: 在一条select语句当中,如果有group by语句的话, select后面只能跟:参加分组的字段,以及分组函数。 其它的一律不能跟。

找出“每个部门,不同工作岗位”的最高薪资?

两个字段联合分组 select deptno, job, max(sal) from emp group by deptno, job;

使用having对分组后的数据进一步过滤

having不能单独使用,having不能代替where,having必须和group by联合使用。

找出每个部门最高薪资,要求显示最高薪资大于3000的?

select deptno, max(sal) from emp group by deptno having max(sal) > 3000;

单表查询大总结

select ​ ... ​ from ​ ... ​ where ​ ... ​ group by ​ ... ​ having ​ ... ​ order by ​ ...

执行顺序?

1.from

2.where

3.group by

4.having

5.select

6.order by

找出除MANAGER岗位之外,每个岗位的平均薪资,要求显示平均薪资大于1500的, 要求按照平均薪资降序排。

select job, avg(sal) from emp where job != 'MANAGER' group by job having avg(sal) > 1500 order by avg(sal);

distinct 关键字

把查询结果去除重复记录【distinct】 注意:原表数据不会被修改,只是查询结果去重。 去重需要使用一个关键字:distinct

distinct只能出现在所有字段的最前方,表示对各字段联合起来的查询结果去重

这样编写是错误的,语法错误。

select ename,distinct job from emp;

统计一下工作岗位的数量? select count(distinct job) from emp;

连接查询

什么是连接查询?

从一张表中单独查询,称为单表查询。 ​ 多张表联合起来查询数据,被称为连接查询。

根据语法的年代分类: SQL92:1992年的时候出现的语法 SQL99:1999年的时候出现的语法 我们这里重点学习SQL99.(这个过程中简单演示一个SQL92的例子)

根据表连接的方式分类: 内连接: 等值连接 非等值连接 自连接

外连接: ​ 左外连接(左连接) ​ 右外连接(右连接)

什么是笛卡尔积现象

当两张表进行连接查询,没有任何条件限制的时候,最终查询结果条数,是 两张表条数的乘积,这种现象被称为:笛卡尔积现象。(笛卡尔发现的,这是一个数学现象。)

怎么避免笛卡尔积现象

连接时加条件,满足这个条件的记录被筛选出来!

表起别名。很重要。效率问题。 select e.ename,d.dname from emp e, dept d where e.deptno = d.deptno;

注意:通过笛卡尔积现象得出,表的连接次数越多效率越低,尽量减少表的连接次数。

内连接

两张表连接时没有主次关系的连接称为内连接

等值连接

案例:查询每个员工所在部门名称,显示员工名和部门名? emp e和dept d表进行连接。条件是:e.deptno = d.deptno

SQL92语法: select e.ename,d.dname from emp e, dept d where e.deptno = d.deptno;

sql92的缺点:结构不清晰,表的连接条件,和后期进一步筛选的条件,都放到了where后面。

SQL99语法:inner 可以省略,不省略可读性会好一些 select e.ename,d.dname from emp e inner join dept d on e.deptno = d.deptno;

sql99优点:表连接的条件是独立的,连接之后,如果还需要进一步筛选,再往后继续添加where

非等值连接

案例:找出每个员工的薪资等级,要求显示员工名、薪资、薪资等级?

select e.ename, e.sal, s.grade from emp e join salgrade s on e.sal between s.losal and s.hisal;

自连接

内连接之自连接 案例:查询员工的上级领导,要求显示员工名和对应的领导名?

emp a 员工表、emp b 领导表

select a.ename 员工, b.ename 领导 from emp a join emp b on a.mgr = b.empno;

外连接

两张表连接时有主次关系

右(外)连接

// outer是可以省略的,带着可读性强。 select e.ename,d.dname from emp e right outer join dept d on e.deptno = d.deptno;

right代表什么:表示将join关键字右边的这张表看成主表,主要是为了将 这主表的数据全部查询出来,捎带着关联查询左边的表。(如果此表没有对应和主表满足 on 后条件的 ,那次表会自动补充 NULL ) 在外连接当中,两张表连接,产生了主次关系。

左(外)连接

左外连接同理

任何一个右连接都有左连接的写法。 任何一个左连接都有右连接的写法。

案例:查询每个员工的上级领导,要求显示所有员工的名字和领导名?

select a.ename '员工', b.ename '领导' from emp a left join emp b on a.mgr = b.empno;

三张表连接如下(四张表同理)

语法: select ... from a join b on a和b的连接条件 join c on a和c的连接条件

案例:找出每个员工的部门名称以及工资等级, 要求显示员工名、部门名、薪资、薪资等级?

select e.ename, d.dname, s.grade from emp e join dept d on e.deptno = d.deptno join salgrade s on e.sal between s.losal and s.hisal;

一条SQL中内连接和外连接可以混合。都可以出现!

案例:找出每个员工的部门名称以及工资等级,还有上级领导, 要求显示员工名、领导名、部门名、薪资、薪资等级?

select e.ename '员工', u.ename '领导', d.dname, e.sal, s.grade from emp e left join emp u on e.mgr = u.empno join dept d on e.deptno = d.deptno join salgrade s on e.sal between s.losal and s.hisal;

什么是子查询?

select语句中嵌套select语句,被嵌套的select语句称为子查询。

子查询都可以出现在哪里呢?

select ​ ..(select). ​ from ​ ..(select). ​ where ​ ..(select).

where子句中的子查询

案例:找出比最低工资高100的员工姓名和工资?

select ​ ename,sal ​ from ​ emp ​ where ​ sal > min(sal);

ERROR 1111 (HY000): Invalid use of group function ​ where子句中不能直接使用分组函数。

正确:select e.ename, e.sal from emp e where e.sal > (select min(sal)+1000 from emp);

from子句中的子查询

案例:找出每个岗位的平均工资的薪资等级。

select a.*, s.grade from (select job, avg(sal) avg_sal from emp group by job) a join salgrade s on a.avg_sal between s.losal and s.hisal;

子查询中的avg(sal)一定要起个别名才能在内连接中使用

select后面出现的子查询(了解即可)

案例:找出每个员工的部门名称,要求显示员工名,部门名? select e.ename,e.deptno,(select d.dname from dept d where e.deptno = d.deptno) as dname from emp e;

select e.ename,e.deptno,(select dname from dept) as dname from emp e; //错误:ERROR 1242 (21000): Subquery returns more than 1 row

注意:对于select后面的子查询来说,这个子查询只能一次返回1条结果, 多于1条,就报错了。!

Union关键字

union作用:合并查询结果集

案例:查询工作岗位是MANAGER和SALESMAN的员工?

select ename,job from emp where job = 'MANAGER' or job = 'SALESMAN';

select ename,job from emp where job in('MANAGER','SALESMAN');

select ename,job from emp where job = 'MANAGER' union select ename,job from emp where job = 'SALESMAN';

像下面这样是错误的:union在进行结果集合并的时候,要求两个结果集的列数相同。 select ename,job from emp where job = 'MANAGER' union select ename from emp where job = 'SALESMAN';

// MYSQL可以结果集合并时列和列的数据类型不一致,oracle语法严格 ,不可以,其结果集合并时列和列的数据类型也要一致。 select ename,job from emp where job = 'MANAGER' union select ename,sal from emp where job = 'SALESMAN';

limit关键字

limit作用:将查询结果集的一部分取出来。通常使用在分页查询当中。 百度默认:一页显示10条记录。 分页的作用是为了提高用户的体验,因为一次全部都查出来,用户体验差。 可以一页一页翻页看。

完整用法:limit startIndex, length startIndex是起始下标,length是长度。 limit起始下标从0开始。substr的起始下标从1开始

缺省用法:limit 5; 这是取前5.

select ename,sal from emp order by sal desc limit 0,5;

注意:mysql当中limit在order by之后执行!!!!!!

取出工资排名在[3-5]名的员工? select ename,sal from emp order by sal desc limit 2, 3; 2表示起始位置从下标2开始,就是第三条记录。 3表示长度。

通用分页方法:

每页显示3条记录 第1页:limit 0,3 [0 1 2] 第2页:limit 3,3 [3 4 5] 第3页:limit 6,3 [6 7 8] 第4页:limit 9,3 [9 10 11]

每页显示pageSize条记录 第pageNo页:limit (pageNo - 1) * pageSize , pageSize

DQL语句总结

关于DQL语句的大总结: select ... from ... where ... group by ... having ... order by ... limit ...

执行顺序? 1.from 2.where 3.group by 4.having 5.select 6.order by 7.limit..

DDL及常见数据类型

create

建表的语法格式:

create table 表名(字段名1 数据类型, 字段名2 数据类型, 字段名3 数据类型);

create table 表名( 字段名1 数据类型, 字段名2 数据类型, 字段名3 数据类型 );

表名:建议以t_ 或者 tbl_开始,可读性强。见名知意。 字段名:见名知意。 表名和字段名都属于标识符。

drop

删除一个数据库

drop database [if exists] 库名; #if exists 如果库存在才删除

删除一张表:

drop table 表名;

Alter

对表结构的修改

什么是对表结构的修改? 添加一个字段,删除一个字段,修改一个字段!!!

第一:在实际的开发中,需求一旦确定之后,表一旦设计好之后,很少的 进行表结构的修改。因为开发进行中的时候,修改表结构,成本比较高。 修改表的结构,对应的java代码就需要进行大量的修改。成本是比较高的。 这个责任应该由设计人员来承担!

第二:由于修改表结构的操作很少,所以我们不需要掌握,如果有一天 真的要修改表结构,你可以使用工具!!!!

修改表结构的操作是不需要写到java程序中的。实际上也不是java程序员的范畴。

常见数据类型

varchar(最长255) 可变长度的字符串 比较智能,节省空间。 会根据实际的数据长度动态分配空间。

优点:节省空间 ​ 缺点:需要动态分配空间,速度慢。

char(最长255) 定长字符串 不管实际的数据长度是多少。 分配固定长度的空间去存储数据。 使用不恰当的时候,可能会导致空间的浪费。

优点:不需要动态分配空间,速度快。 ​ 缺点:使用不当可能会导致空间的浪费。

varchar和char我们应该怎么选择? 性别字段你选什么?因为性别是固定长度的字符串,所以选择char。 姓名字段你选什么?每一个人的名字长度不同,所以选择varchar。

int(最长11) 数字中的整数型。等同于java的int。

bigint 数字中的长整型。等同于java中的long。

float(数字a, 数字b) 其中数字a表示有效数字,数字b表示小数位 单精度浮点型数据

double(数字a, 数字b) 其中数字a表示有效数字,数字b表示小数位 双精度浮点型数据

date 短日期类型

datetime 长日期类型

clob 字符大对象 最多可以存储4G的字符串。 比如:存储一篇文章,存储一个说明。 超过255个字符的都要采用CLOB字符大对象来存储。 Character Large OBject:CLOB

blob 二进制大对象 Binary Large OBject 专门用来存储图片、声音、视频等流媒体数据。 往BLOB类型的字段上插入数据的时候,例如插入一个图片、视频等,需要使用IO流才行。

案例:

创建一个学生表? 学号、姓名、年龄、性别、邮箱地址 create table t_student( no int, name varchar(32), sex char(1), age int(3), email varchar(255) );

数据类型后括号内的数字表示内容的长度,int(3) 表示最多3位数

删除表: drop table t_student; // 当这张表不存在的时候会报错!

像下面这样删就不会报错 drop table if exists t_student;

DML

插入数据insert (DML)

语法格式: insert into 表名(字段名1,字段名2,字段名3...) values(值1,值2,值3);

注意:字段名和值要一一对应。

注意:insert语句但凡是执行成功了,那么必然会多一条记录。 没有给其它字段指定值的话,默认值是NULL。

注意:字段名可以省略,省略了的话等于都写了且按顺序写的

注意:数据库中的有一条命名规范: 所有的标识符都是全部小写,单词和单词之间使用下划线进行衔接。

修改update

语法格式: update 表名 set 字段名1=值1,字段名2=值2,字段名3=值3... where 条件;

注意:没有条件限制会导致所有数据全部更新。

删除数据 delete 

语法格式? ​ delete from 表名 where 条件;

注意:没有条件,整张表的数据会全部删除!

delete from t_user where id = 2;

delete from t_user; // 删除所有!

快速创建一张表

mysql> create table emp2 as select * from emp;

原理: 将一个查询结果当做一张表新建,这个可以完成表的快速复制。表创建出来,同时表中的数据也存在了。

create table mytable as select empno,ename from emp where job = 'MANAGER';

将查询结果插入到一张表当中?insert相关的

create table dept_bak as select * from dept;

insert into dept_bak select * from dept; //很少用!

快速删除表中数据

快速删除表中的数据?【truncate比较重要,必须掌握】

//删除dept_bak表中的数据 delete from dept_bak; //这种删除数据的方式比较慢。

mysql> select * from dept_bak; Empty set (0.00 sec)

delete语句删除数据的原理?(DML操作) 表中的数据被删除了,但是这个数据在硬盘上的真实存储空间不会被释放!!!(相当于把表中格子内容擦掉,但不会把格子删掉,还占了空间) 这种删除缺点是:删除效率比较低 这种删除优点是:支持回滚,后悔了可以再恢复数据!!!

truncate语句删除数据的原理? 这种删除效率比较高,表被一次截断,物理删除。(相当于把占的那片空间给截了) 这种删除缺点:不支持回滚。 这种删除优点:快速

用法:truncate table dept_bak; (这种操作属于DDL操作。)

大表非常大,上亿条记录???? 删除的时候,使用delete,也许需要执行很久才能删除完!效率较低。 可以选择使用truncate删除表中的数据。只需要不到1秒钟的时间就删除结束。效率较高。 但是使用truncate之前,必须仔细询问客户是否真的要删除,并警告删除之后不可恢复!

truncate是删除表中的数据,表还在!

删除表操作 drop table 表名; 会把表结构和表中的数据一起都删了

四大约束

什么是约束?

约束对应的英语单词:constraint 在创建表的时候,我们可以给表中的字段加上一些约束,来保证这个表中数据的 完整性、有效性!!!

约束的作用就是为了保证表中的数据有效!!

约束包括哪些?

非空约束:not null ​ 唯一性约束: unique ​ 主键约束: primary key (简称PK) ​ 外键约束:foreign key(简称FK) ​ 检查约束:check(mysql不支持,oracle支持)

非空约束:not null

非空约束not null约束的字段不能为NULL。 drop table if exists t_vip; create table t_vip( id int, name varchar(255) not null );

insert into t_vip(id) values(3); ERROR 1364 (HY000): Field 'name' doesn't have a default value

唯一性约束: unique

唯一性约束unique约束的字段不能重复,但是可以为NULL。 drop table if exists t_vip; create table t_vip( id int, name varchar(255) unique, email varchar(255) ); insert into t_vip(id,name,email) values(3,'wangwu','wangwu@123.com');

insert into t_vip(id,name,email) values(4,'wangwu','wangwu@sina.com'); ERROR 1062 (23000): Duplicate entry 'wangwu' for key 'name'

name字段虽然被unique约束了,但是可以为NULL。且可以有多个人的是null

新需求:name和email两个字段联合起来具有唯一性!!!! drop table if exists t_vip; create table t_vip( id int, name varchar(255) unique, // 约束直接添加到列后面的,叫做列级约束。 email varchar(255) unique ); 这张表这样创建是不符合我以上“新需求”的。 这样创建表示:name具有唯一性,email具有唯一性。各自唯一。

正确做法:

drop table if exists t_vip; ​ create table t_vip( ​ id int, ​ name varchar(255), ​ email varchar(255), ​ unique(name,email) // 约束没有添加在列的后面,这种约束被称为表级约束。 ​ );

需要给多个字段联合起来添加某一个约束的时候,需要使用表级约束

not null只有列级约束,没有表级约束!

在mysql当中,如果一个字段同时被not null和unique约束的话,该字段自动变成主键字段。(注意:oracle中不一样!)

主键约束(primary key,简称PK)

主键约束的相关术语?

主键约束:就是一种约束。 ​ 主键字段:该字段上添加了主键约束,这样的字段叫做:主键字段 ​ 主键值:主键字段中的每一个值都叫做:主键值。

什么是主键?有啥用?

主键值是每一行记录的唯一标识。 ​ 主键值是每一行记录的身份证号!!!

记住:任何一张表都应该有主键(且仅有一个),没有主键,表无效!!

主键的特征:not null + unique(主键值不能是NULL,同时也不能重复!)

主键可以使用表级约束

表级约束主要是给多个字段联合起来添加约束

几个字段联合起来的主键叫 复合主键

在实际开发中不建议使用复合主键。建议使用单一主键

主键值建议使用: int bigint char 等类型。

不建议使用:varchar来做主键。主键值一般都是数字,一般都是定长的!

主键除了:单一主键和复合主键之外,还可以这样进行分类?

自然主键:主键值是一个自然数,和业务没关系。 ​ 业务主键:主键值和业务紧密关联,例如拿银行卡账号做主键值。这就是业务主键!

在实际开发中使用业务主键多,还是使用自然主键多一些? ​ 自然主键使用比较多,因为主键只要做到不重复就行,不需要有意义。 ​ 业务主键不好,因为主键一旦和业务挂钩,那么当业务发生变动的时候, ​ 可能会影响到主键值,所以业务主键不建议使用。尽量使用自然主键。

在mysql当中,有一种机制,可以帮助我们自动维护一个主键值 drop table if exists t_vip; create table t_vip( id int primary key auto_increment, name varchar(255) );

auto_increment 表示自增,从1开始,以1递增!

外键约束(foreign key,简称FK)

外键约束涉及到的相关术语: 外键约束:一种约束(foreign key) 外键字段:该字段上添加了外键约束 外键值:外键字段当中的每一个值。

业务背景:
        请设计数据库表,来描述“班级和学生”的信息?
​
        第一种方案:班级和学生存储在一张表中???
        t_student
        no(pk)      name        classno         classname
        -------------------------------------------------------------------------------
        1           jack        100         北京市大兴区亦庄镇第二中学高三1班
        2           lucy        100         北京市大兴区亦庄镇第二中学高三1班
        3           lilei       100         北京市大兴区亦庄镇第二中学高三1班
        4           hanmeimei   100         北京市大兴区亦庄镇第二中学高三1班
        5           zhangsan    101         北京市大兴区亦庄镇第二中学高三2班
        6           lisi        101         北京市大兴区亦庄镇第二中学高三2班
        7           wangwu      101         北京市大兴区亦庄镇第二中学高三2班
        8           zhaoliu     101         北京市大兴区亦庄镇第二中学高三2班
        分析以上方案的缺点:
            数据冗余,空间浪费!!!!
            这个设计是比较失败的!
        
        第二种方案:班级一张表、学生一张表??
        
        t_class 班级表
        classno(pk)         classname
        ------------------------------------------------------
        100                 北京市大兴区亦庄镇第二中学高三1班
        101                 北京市大兴区亦庄镇第二中学高三1班
    
        t_student 学生表
        no(pk)          name            cno(FK引用t_class这张表的classno)
        ----------------------------------------------------------------
        1               jack            100
        2               lucy            100
        3               lilei           100
        4               hanmeimei       100
        5               zhangsan        101
        6               lisi            101
        7               wangwu          101
        8               zhaoliu         101
​
        当cno字段没有任何约束的时候,可能会导致数据无效。可能出现一个102,但是102班级不存在。
        所以为了保证cno字段中的值都是100和101,需要给cno字段添加外键约束。
        那么:cno字段就是外键字段。cno字段中的每一个值都是外键值。

注意:理解即记住

删除表的顺序? 先删子,再删父。

创建表的顺序? 先创建父,再创建子。

删除数据的顺序? 先删子,再删父。

插入数据的顺序? 先插入父,再插入子。

create table t_class (
    classno int primary key,
    classname varchar(255);
);
create table t_student (
    no int primary key auto_increment,
    name varchar(255),
    cno int,
    foreign key(cno) references t_class(classno)
);

思考:子表中的外键引用的父表中的某个字段,被引用的这个字段必须是主键吗? 不一定是主键,但至少具有unique约束。

即:外键引用的字段不一定是主键,但一定要有unique约束

测试:外键值可以为NULL吗? 外键只要满足至少含有unique约束即可,而有unique修饰的字段字段可以为NULL(而且可以有多个NULL),所以外键值当然可以为NULL。

存储引擎

什么是存储引擎,有什么用呢?

存储引擎是MySQL中特有的一个术语,其它数据库中没有。(Oracle中有,但是不叫这个名字) ​ 实际上存储引擎是一个 表存储/组织数据 的方式 ​ 不同的存储引擎,表存储数据的方式不同。

怎么给表添加/指定“存储引擎”呢?

在建表的时候可以在最后小括号的")"的右边使用: ENGINE来指定存储引擎。 CHARSET来指定这张表的字符编码方式。

结论: mysql默认的存储引擎是:InnoDB mysql默认的字符编码方式是:utf8

建表时指定存储引擎,以及字符编码方式。 create table t_product( id int primary key, name varchar(255) )engine=InnoDB default charset=gbk;

怎么查看mysql支持哪些存储引擎呢?

命令: show engines \G

MySQL支持9大存储引擎,不同版本支持引擎不同,通过上面指令可以看出当前版本哪些支持

关于mysql常用的存储引擎的介绍

MyISAM存储引擎? 它管理的表具有以下特征: 使用三个文件表示每个表: 格式文件 — 存储表结构的定义(mytable.frm) 数据文件 — 存储表行的内容(mytable.MYD) 索引文件 — 存储表上索引(mytable.MYI):索引用于缩小扫描范围,提高查询效率的一种机制。 可被转换为压缩、只读表来节省空间

注意: 对于一张表来说,主键或者加有unique约束的字段上会自动创建索引

MyISAM存储引擎特点: 可被转换为压缩、只读表来节省空间!

MyISAM不支持事务机制,安全性低。

InnoDB存储引擎 这是mysql默认的存储引擎,同时也是一个重量级的存储引擎。 InnoDB支持事务,支持数据库崩溃后自动恢复机制。 InnoDB存储引擎最主要的特点是:非常安全。

它管理的表具有下列主要特征: – 每个 InnoDB 表在数据库目录中以.frm 格式文件表示 – InnoDB 表空间 tablespace 被用于存储表的内容(表空间是一个逻辑名称。表空间存储数据和索引。)

– 提供一组用来记录事务性活动的日志文件 ​ – 用 COMMIT(提交)、SAVEPOINT 及ROLLBACK(回滚)支持事务处理 ​ – 提供全 ACID 兼容 ​ – 在 MySQL 服务器崩溃后提供自动恢复 ​ – 多版本(MVCC)和行级锁定 ​ – 支持外键及引用的完整性,包括级联删除和更新

InnoDB最大的特点就是:支持事务,以保证数据的安全。

效率不是很高,并且也不能压缩,不能转换为只读,不能很好的节省存储空间。

MEMORY存储引擎? 使用 MEMORY 存储引擎的表,其数据存储在内存中,且行的长度固定, 这两个特点使得 MEMORY 存储引擎非常快。

MEMORY 存储引擎管理的表具有下列特征: – 在数据库目录内,每个表均以.frm 格式的文件表示。 – 表数据及索引被存储在内存中。(目的就是快,查询快!) – 表级锁机制。 – 不能包含 TEXT 或 BLOB 字段。

MEMORY 存储引擎以前被称为HEAP 引擎。

MEMORY引擎优点:查询效率是最高的。不需要和硬盘交互。 MEMORY引擎缺点:不安全,关机之后数据消失。因为数据和索引都是在内存当中。

事务

一个事务其实就是一个完整的业务逻辑。 是一个最小的工作单元。不可再分。

说到本质上,一个事务其实就是多条DML语句同时成功,或者同时失败!

什么是一个完整的业务逻辑?
    假设转账,从A账户向B账户中转账10000.
    将A账户的钱减去10000(update语句)
    将B账户的钱加上10000(update语句)
    这就是一个完整的业务逻辑。
​
    以上的操作是一个最小的工作单元,要么同时成功,要么同时失败,不可再分。
    这两个update语句要求必须同时成功或者同时失败,这样才能保证钱是正确的。

只有DML语句才会有事务这一说,其它语句和事务无关!!! insert delete update 只有以上的三个语句和事务有关系,其它都没有关系。

因为 只有以上的三个语句是数据库表中数据进行增、删、改的。 只要你的操作一旦涉及到数据的增、删、改,那么就一定要考虑安全问题。

数据安全第一位!!

事务是怎么做到多条DML语句同时成功和同时失败的呢?

InnoDB存储引擎:提供一组用来记录事务性活动的日志文件

事务开启了: insert insert delete update update 事务结束了!

在事务的执行过程中,每一条DML的操作都会记录到“事务性活动的日志文件”中。 在事务的执行过程中,我们可以提交事务,也可以回滚事务。

提交事务? 清空事务性活动的日志文件,将数据全部彻底持久化到数据库表中。 提交事务标志着,事务的结束。并且是一种全部成功的结束。

回滚事务? 将之前所有的DML操作全部撤销,并且清空事务性活动的日志文件 回滚事务标志着,事务的结束。并且是一种全部失败的结束。

怎么提交事务,怎么回滚事务?

提交事务:commit; 语句 回滚事务:rollback; 语句(回滚永远都是只能回滚到上一次的提交点!)

事务对应的英语单词是:transaction

测试一下,在mysql当中默认的事务行为是怎样的? mysql默认情况下是支持自动提交事务的。(自动提交) 什么是自动提交? 每执行一条DML语句,则提交一次!

这种自动提交实际上是不符合我们的开发习惯,因为一个业务通常是需要多条DML语句共同执行才能完成的,为了保证数据的安全,必须要求同时成功之后再提交,所以不能执行一条 就提交一条。

怎么将mysql的自动提交机制关闭掉呢? 开启事务时先执行这个命令:start transaction;

事务的四个特性

事务包括4个特性?

A:原子性 说明事务是最小的工作单元。不可再分。所有操作必须同时成功,或者同时失败。

C:一致性 一个事务在执行前后,数据库都必须处于正确的状态,满足完整性约束。也就是说事务不能破坏数据库的完整性以及业务逻辑的一致性。

例如:

业务逻辑一致性:A给B转账,无论是否操作成功,两者的账户余额之和应该是不变的。

数据库完整性:数据库的约束关系应该是正确的,例如唯一索引,主键等。

I:隔离性 同时执行的事务是相互隔离的,它们不能相互冒犯。

D:持久性 事务最终结束的一个保障。事务提交,就相当于将没有保存到硬盘上的数据 保存到硬盘上!

4个隔离级别

读未提交:read uncommitted(最低的隔离级别,没有提交就读到了)

什么是读未提交? ​ 事务A可以读取到事务B未提交的数据。 ​ 这种隔离级别存在的问题就是: ​ 脏读现象!(Dirty Read) ​ 我们称读到了脏数据。 ​ 这种隔离级别一般都是理论上的,大多数的数据库隔离级别都是二档起步!

读已提交:read committed(提交之后才能读到)

什么是读已提交? ​ 事务A只能读取到事务B提交之后的数据。 ​ 这种隔离级别解决了什么问题? ​ 解决了脏读的现象。 ​ 这种隔离级别存在什么问题? ​ 不可重复读取数据。 ​ 什么是不可重复读取数据呢? ​ 在事务开启之后,第一次读到的数据是3条,当前事务还没有 ​ 结束,可能第二次再读取的时候,读到的数据是4条,3不等于4 ​ 称为不可重复读取。

这种隔离级别是比较真实的数据,每一次读到的数据是绝对的真实。 ​ oracle数据库默认的隔离级别是:read committed

可重复读:repeatable read(提交之后也读不到,永远读取的都是刚开启事务时的数据)

什么是可重复读取? ​ 事务A开启之后,不管是多久,每一次在事务A中读取到的数据 ​ 都是一致的。即使事务B将数据已经修改,并且提交了,事务A ​ 读取到的数据还是没有发生改变,这就是可重复读。 ​ 可重复读解决了什么问题? ​ 解决了不可重复读取数据。 ​ 可重复读存在的问题是什么? ​ 会出现幻影读。 ​ 每一次读取到的数据都是幻象。不够真实!

早晨9点开始开启了事务,只要事务不结束,到晚上9点,读到的数据还是那样! ​ 读到的是假象。不够绝对的真实。

mysql中默认的事务隔离级别就是这个!!

序列化/串行化:serializable(最高的隔离级别)

这是最高隔离级别,效率最低。解决了所有的问题。 ​ 这种隔离级别表示事务排队,不能并发! ​ synchronized,线程同步(事务同步) ​ 每一次读取到的数据都是最真实的,并且效率是最低的。

什么是索引?

索引是在数据库表的字段上添加的,是为了提高查询效率存在的一种机制。 一张表的一个字段可以添加一个索引,当然,多个字段联合起来也可以添加索引。 索引相当于一本书的目录,是为了缩小扫描范围而存在的一种机制。

MySQL在查询方面主要就是两种方式: 第一种方式:全表扫描 第二种方式:根据索引检索。

在mysql数据库当中索引也是需要排序的,并且这个索引的排序和TreeSet 数据结构相同。TreeSet(TreeMap)底层是一个自平衡的二叉树!在mysql 当中索引是一个B-Tree数据结构。

遵循左小右大原则存放。采用中序遍历方式遍历取数据。

提醒1:在任何数据库当中主键上都会自动添加索引对象。另外在mysql当中,一个字段上如果有unique约束的话,也会自动创建索引对象。

提醒2:在任何数据库当中,任何一张表的任何一条记录在硬盘存储上都有 一个硬盘的物理存储编号。

提醒3:在mysql当中,索引是一个单独的对象,不同的存储引擎以不同的形式 存在,在MyISAM存储引擎中,索引存储在一个.MYI文件中。在InnoDB存储引擎中 索引存储在一个逻辑名称叫做tablespace的当中。在MEMORY存储引擎当中索引 被存储在内存当中。不管索引存储在哪里,索引在mysql当中都是一个树的形式 存在。(自平衡二叉树:B-Tree)

什么条件下,我们会考虑给字段添加索引呢?

条件1:数据量庞大(到底有多么庞大算庞大?这个需要测试,因为每一个硬件环境不同) ​ 条件2:该字段经常出现在where的后面,以条件的形式存在,也就是说这个字段总是被扫描。 ​ 条件3:该字段很少的DML(insert delete update)操作。(因为DML之后,索引需要重新排序。)

建议不要随意添加索引,因为索引也是需要维护的,太多的话反而会降低系统的性能。 建议通过主键查询,建议通过unique约束的字段进行查询,效率是比较高的。

索引怎么创建?怎么删除?语法是什么?

创建索引: mysql> create index emp_ename_index on emp(ename); 给emp表的ename字段添加索引,起名:emp_ename_index

删除索引: mysql> drop index emp_ename_index on emp; 将emp表上的emp_ename_index索引对象删除。

查看是否使用索引

mysql> explain select * from emp where ename = 'KING';

type=ALL 说明没有使用索引,如果是 typr=ref 则使用了索引

索引失效

失效的第1种情况: select * from emp where ename like '%T';

ename上即使添加了索引,也不会走索引,为什么? 原因是因为模糊匹配当中以“%”开头了! 尽量避免模糊查询的时候以“%”开始。 在MySQL8开始好像会走索引了 这是一种优化的手段/策略。

失效的第2种情况: 使用or的时候会失效,如果使用or那么要求or两边的条件字段都要有 索引,才会走索引,如果其中一边有一个字段没有索引,那么另一个 字段上的索引也会失效。所以这就是为什么不建议使用or的原因。

失效的第3种情况: 使用复合索引的时候,没有使用左侧的列查找,索引失效 什么是复合索引? 两个字段,或者更多的字段联合起来添加一个索引,叫做复合索引。

create index emp_job_sal_index on emp(job,sal);

explain select * from emp where sal = 800; 没走索引

失效的第4种情况: 在where当中索引列参加了运算,索引失效。

create index emp_sal_index on emp(sal);

explain select * from emp where sal+1 = 800; 没走索引

失效的第5种情况: 在where当中索引列使用了函数 explain select * from emp where lower(ename) = 'smith';

索引的类别

单一索引:一个字段上添加索引。 复合索引:两个字段或者更多的字段上添加索引。

主键索引:主键上添加索引。 唯一性索引:具有unique约束的字段上添加索引。 .....

注意:唯一性比较弱的字段上添加索引用处不大。

什么是视图?

view:站在不同的角度去看待同一份数据。

怎么创建视图对象?怎么删除视图对象?

表复制:
mysql> create table dept2 as select * from dept;
​
dept2表中的数据:
mysql> select * from dept2;
+--------+------------+----------+
| DEPTNO | DNAME      | LOC      |
+--------+------------+----------+
|     10 | ACCOUNTING | NEW YORK |
|     20 | RESEARCH   | DALLAS   |
|     30 | SALES      | CHICAGO  |
|     40 | OPERATIONS | BOSTON   |
+--------+------------+----------+

创建视图对象: create view dept2_view as select * from dept2;

删除视图对象: drop view dept2_view;

注意:只有DQL语句才能以view的形式创建。 create view view_name as 这里的语句必须是DQL语句;

视图作用

我们可以面向视图对象进行增删改查,对视图对象的增删改查,会导致 原表被操作!(视图的特点:通过对视图的操作,会影响到原表数据。)

//面向视图查询 select * from dept2_view;

// 面向视图插入 insert into dept2_view(deptno,dname,loc) values(60,'SALES', 'BEIJING');

select * from dept2;

视图对象在实际开发中到底有什么用?方便,简化开发,利于维护

假设有一条非常复杂的SQL语句,而这条SQL语句需要在不同的位置上反复使用。 每一次使用这个sql语句的时候都需要重新编写,很长,很麻烦,怎么办? 可以把这条复杂的SQL语句以视图对象的形式新建。 在需要编写这条SQL语句的位置直接使用视图对象,可以大大简化开发。 并且利于后期的维护,因为修改的时候也只需要修改一个位置就行,只需要 修改视图对象所映射的SQL语句。

我们以后面向视图开发的时候,使用视图的时候可以像使用table一样。 可以对视图进行增删改查等操作。视图不是在内存当中,视图对象也是 存储在硬盘上的,不会消失。

如下面这样,就是将一条SQL语句以视图的形式创建出来

    create view 
        emp_dept_view
    as
        select 
            e.ename,e.sal,d.dname
        from
            emp e
        join
            dept d
        on
            e.deptno = d.deptno;

注意: 创建视图对应的语句只能是DQL语句。 但是视图对象创建完成之后,可以对视图进行增删改查等操作。

CRUD: 增删改查,又叫做:CRUD。 CRUD是在公司中程序员之间沟通的术语。一般我们很少说增删改查。 一般都说CRUD。

C:Create(增) R:Retrieve(查:检索) U:Update(改) D:Delete(删)

Java程序员必须会的DBA常用命令:

数据的导入和导出(数据的备份) ​ 其它命令了解一下即可。(这个B站嫖的培训日志文档留着,以后忘了,可以打开文档复制粘贴。)

数据导出? 注意:在windows的dos命令窗口中: mysqldump bjpowernode>D:\bjpowernode.sql -uroot -p123456

可以导出指定的表吗? mysqldump bjpowernode emp>D:\bjpowernode.sql -uroot -p123456

数据导入? 注意:需要先登录到mysql数据库服务器上。 然后创建数据库:create database bjpowernode; 使用数据库:use bjpowernode 然后初始化数据库:source D:\bjpowernode.sql 该语句后不需要跟分号

如果备份的是表则不需要创建数据库,直接使用需要导入表的数据即可

数据库设计范式共有3个

第一范式:要求任何一张表必须有主键,每一个字段原子性不可再分。

第二范式:建立在第一范式的基础之上,要求所有非主键字段完全依赖主键, 不要产生部分依赖。

第三范式:建立在第二范式的基础之上,要求所有非主键字段直接依赖主键, 不要产生传递依赖。

设计数据库表的时候,按照以上的范式进行,可以避免表中数据的冗余,空间的浪费。

第一范式

最核心,最重要的范式,所有表的设计都需要满足。 必须有主键,并且每一个字段都是原子性不可再分。

学生编号 学生姓名 联系方式
------------------------------------------
1001        张三      zs@gmail.com,1359999999
1002        李四      ls@gmail.com,13699999999
1001        王五      ww@163.net,13488888888
​
以上是学生表,满足第一范式吗?
    不满足,第一:没有主键。第二:联系方式可以分为邮箱地址和电话
​
学生编号(pk) 学生姓名   邮箱地址            联系电话
----------------------------------------------------
1001        张三      zs@gmail.com    1359999999
1002        李四      ls@gmail.com    13699999999
1003        王五      ww@163.net      13488888888

第二范式

4.4、第二范式: 建立在第一范式的基础之上, 要求所有非主键字段必须完全依赖主键,不要产生部分依赖。

学生编号 学生姓名 教师编号 教师姓名

1001 张三 001 王老师 1002 李四 002 赵老师 1003 王五 001 王老师 1001 张三 002 赵老师

这张表描述了学生和老师的关系:(1个学生可能有多个老师,1个老师有多个学生) 这是非常典型的:多对多关系!

分析以上的表是否满足第一范式? 不满足第一范式。

怎么满足第一范式呢?修改

学生编号+教师编号(pk) 学生姓名 教师姓名

1001 001 张三 王老师 1002 002 李四 赵老师 1003 001 王五 王老师 1001 002 张三 赵老师

学生编号 教师编号,两个字段联合做主键,复合主键(PK: 学生编号+教师编号) 经过修改之后,以上的表满足了第一范式。但是满足第二范式吗? 不满足,“张三”依赖1001,“王老师”依赖001,显然产生了部分依赖。 产生部分依赖有什么缺点? 数据冗余了。空间浪费了。“张三”重复了,“王老师”重复了。

为了让以上的表满足第二范式,你需要这样设计: 使用三张表来表示多对多的关系!!!! 学生表

学生编号(pk) 学生名字

1001 张三 ​ 1002 李四 ​ 1003 王五 ​

教师表

教师编号(pk) 教师姓名

001 王老师

002 赵老师

学生教师关系表

id(pk) 学生编号(fk) 教师编号(fk)

1 1001 001 2 1002 002 3 1003 001 4 1001 002

背口诀: 多对多怎么设计? 多对多,三张表,关系表两个外键!

第三范式

第三范式建立在第二范式的基础之上 ​ 要求所有非主键字典必须直接依赖主键,不要产生传递依赖。

学生编号(PK) 学生姓名 班级编号 班级名称

1001 张三 01 一年一班 1002 李四 02 一年二班 1003 王五 03 一年三班 1004 赵六 03 一年三班

以上表的设计是描述:班级和学生的关系。很显然是1对多关系! 一个教室中有多个学生。

分析以上表是否满足第一范式? 满足第一范式,有主键。

分析以上表是否满足第二范式? 满足第二范式,因为主键不是复合主键,没有产生部分依赖。主键是单一主键。

分析以上表是否满足第三范式? 第三范式要求:不要产生传递依赖! 一年一班依赖01,01依赖1001,产生了传递依赖。 不符合第三范式的要求。产生了数据的冗余。

那么应该怎么设计一对多呢?

班级表:一

班级编号(pk) 班级名称

01 一年一班 02 一年二班 03 一年三班

学生表:多

学生编号(PK) 学生姓名 班级编号(fk)

1001 张三 01 1002 李四 02 1003 王五 03 1004 赵六 03

背口诀: 一对多,两张表,多的表加外键!!

表的设计总结

总结表的设计?

一对多: 一对多,两张表,多的表加外键

多对多: 多对多,三张表,关系表两个外键

一对一: 一对一放到一张表中不就行了吗?为啥还要拆分表? 在实际的开发中,可能存在一张表字段太多,太庞大。这个时候要拆分表。 一对一怎么设计? 没有拆分表之前:一张表 t_user id login_name login_pwd real_name email

1 zhangsan 123 张三 zhangsan@xxx ​ 2 lisi 123 李四 lisi@xxx

这种庞大的表建议拆分为两张: t_login 登录信息表 id(pk) login_name login_pwd

1 zhangsan 123 ​ 2 lisi 123

t_user 用户详细信息表

id(pk) real_name email login_id(fk+unique)

100 张三 zhangsan@xxx 1 200 李四 lisi@xxx 2

口诀:一对一,外键唯一

数据库设计实际中要注意的

数据库设计三范式是理论上的。

实践和理论有的时候有偏差。

最终的目的都是为了满足客户的需求,有的时候会拿冗余换执行速度。

因为在sql当中,表和表之间连接次数越多,效率越低。(笛卡尔积)

有的时候可能会存在冗余,但是为了减少表的连接次数,这样做也是合理的, 并且对于开发人员来说,sql语句的编写难度也会降低。

 

本文含有隐藏内容,请 开通VIP 后查看

网站公告

今日签到

点亮在社区的每一天
去签到