ON DUPLICATE KEY UPDATE 子句

发布于:2024-06-12 ⋅ 阅读:(43) ⋅ 点赞:(0)

ON DUPLICATE KEY UPDATE 是 MySQL 中的一个 SQL 语句中的子句,主要用于在执行 INSERT 操作时处理可能出现的重复键值冲突。当尝试插入的记录导致唯一索引或主键约束冲突时(即试图插入的记录的键值已经存在于表中),此子句会触发一个更新操作,而不是抛出错误。

官方文档:https://dev.mysql.com/doc/refman/8.4/en/insert-on-duplicate.html

基本语法

INSERT INTO table_name (column1, column2, ...)
VALUES (value1, value2, ...)
ON DUPLICATE KEY UPDATE
    column1 = value1,
    column2 = value2,
    ...;

ON DUPLICATE KEY UPDATE子句处理逻辑

语句是根据唯一索引判断记录是否重复的。当执行插入操作时,如果唯一键不冲突(表中不存在记录),则执行插入操作;如果遇到唯一键冲突(表中存在记录),则会执行更新操作,使用给定的新值来更新冲突行中的列。

示例

假设我们有一个用户表 users,包含 id(主键)、username(用户名,唯一)和 email 三个字段。现在我们要插入或更新一条用户记录,如果用户名已经存在,则只更新用户的邮箱地址。

表结构如下:

CREATE TABLE `users` (
  `id` INT AUTO_INCREMENT PRIMARY KEY,
  `username` VARCHAR(255) UNIQUE NOT NULL,
  `email` VARCHAR(255)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

不存在记录,插入的情况

使用insert into插入已有的username,可以看到会报错

 使用ON DUPLICATE KEY UPDATE 子句插入已有的username,没有报错执行成功

总结:在上面这个例子中,如果尝试插入的用户名 '杜甫' 已经存在于表中,由于 username 字段设置了唯一约束,这将触发 ON DUPLICATE KEY UPDATE 子句。然后,这条 SQL 语句不会插入新的记录,而是执行更新操作,将该用户名对应的邮箱地址更新为 'libai@163.com'。如果用户名不存在,则正常插入新记录。

可能看到这里就会有人问了那么为什么不使用update呢,简单的来说不都是更新数据吗?

使用 ON DUPLICATE KEY UPDATE 与直接使用 UPDATE 语句的主要区别在于处理数据插入和更新的策略和目的。

下面是选择 ON DUPLICATE KEY UPDATE 而不直接使用 UPDATE 的几个主要原因:

  1. 同时处理插入与更新ON DUPLICATE KEY UPDATE 允许在一个操作中同时尝试插入新记录和更新现有记录。如果记录不存在,就插入新记录;如果存在(根据唯一索引或主键判断),则更新记录。这样可以在不确定记录是否存在的情况下,通过一次操作完成“插入或更新”,简化逻辑和代码。

  2. 减少查询开销:相比于先执行查询判断记录是否存在,再根据结果决定执行 INSERTUPDATEON DUPLICATE KEY UPDATE 直接在数据库层面处理,减少了额外的查询请求,降低了网络和计算开销。

  3. 原子性操作:在事务中使用时,ON DUPLICATE KEY UPDATE 作为一个整体操作,要么全部成功,要么全部失败,保证了数据操作的原子性,这对于维护数据一致性非常重要。

  4. 避免并发冲突:在高并发环境下,先查询后更新可能会遇到“丢失更新”的问题。而 ON DUPLICATE KEY UPDATE 通过数据库的内置机制处理冲突,有助于减少这类并发问题。

  5. 简化逻辑:对于批量数据处理,特别是导入大量数据时,使用 ON DUPLICATE KEY UPDATE 可以显著简化代码逻辑,避免编写复杂的循环判断逻辑。

总结ON DUPLICATE KEY UPDATE 提供了一种高效、简洁的方式来处理那些在插入数据时可能遇到的重复记录问题,特别适用于那些需要“如果存在则更新,否则插入”的场景,而直接使用 UPDATE 则更适合于确定记录已经存在并且需要修改的情况。

当然还有ON DUPLICATE KEY UPDATE 子句和 REPLACE INTO 语句的区别会在下一篇文章中介绍

使用 ON DUPLICATE KEY UPDATE 子句的场景及优缺点

使用场景 优点 缺点
数据去重与更新 自动处理冲突,减少编程逻辑 对于大量并发可能产生锁竞争,影响性能
数据同步 简化数据同步流程,避免手动检查 更新逻辑需精确设计,以免误更新非冲突字段
统计计数 有效累加计数,避免重复记录 需要确保更新逻辑正确,避免数据不一致
确保数据一致 支持事务处理,增强数据完整性 对于复杂更新逻辑处理能力有限
简化逻辑 一行命令完成“插入或更新”,代码简洁 对唯一性约束依赖性强,表设计需预先规划


网站公告

今日签到

点亮在社区的每一天
去签到