MySQL：count(*)、count(字段) 实现上区别_技术 _ 頭條網

文章末尾有他著作的《深入理解 MySQL 主从原理 32 讲》，深入透彻理解 MySQL 主从，GTID 相关技术知识。

继上一篇文章：

我们继续来讨论一下 count(*)、count(字段)实现上的区别。注意我们这里都使用 Innodb 做为存储引擎，不讨论其他引擎。因为了有了前面的讨论，更容易看出它们的区别，这里我们有如下注意点：

我们需要做到执行计划一样，这里以全表扫描为例。实际上 count 很可能使用到覆盖索引（Using index），本文主要讨论它们实现的异同。count(*) 和 count(字段) 在结果上可能并不一致。比如 count(字段)，但是某些行本字段为 NULL 的话那么将不会统计行数，下面将会说明这种 NULL 判断的位置。本文还是使用简单的全表扫描来进行对比实现上的区别。首先我们要明确的是 count 使用的是一个 COUNT 计数器。

一、使用示例

在示例中我们也可以看到两个语句的结果实际上并不一致。

<code>mysql> show create table baguai_f \\G*************************** 1. row *************************** Table: baguai_fCreate Table: CREATE TABLE `baguai_f` ( `id` int(11) DEFAULT NULL, `a` varchar(20) DEFAULT NULL, `b` varchar(20) DEFAULT NULL, `c` varchar(20) DEFAULT NULL) ENGINE=InnoDB DEFAULT CHARSET=utf81 row in set (0.00 sec)mysql> select * from baguai_f ;+------+------+------+------+| id | a | b | c |+------+------+------+------+| 1 | g | g | NULL || 1 | g1 | g1 | g1 || 3 | g2 | g2 | g2 || 4 | g | g | NULL || 5 | g | g | NULL || 6 | g3 | g3 | g3 |+------+------+------+------+6 rows in set (0.00 sec)mysql> desc select count(*) from baguai_f where b='g';+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+| 1 | SIMPLE | baguai_f | NULL | ALL | NULL | NULL | NULL | NULL | 6 | 16.67 | Using where |+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+1 row in set, 1 warning (0.00 sec)mysql> desc select count(c) from baguai_f where b='g';+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+| 1 | SIMPLE | baguai_f | NULL | ALL | NULL | NULL | NULL | NULL | 6 | 16.67 | Using where |+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+1 row in set, 1 warning (0.00 sec)mysql> select count(*) from baguai_f where b='g';+----------+| count(*) |+----------+| 3 |+----------+1 row in set (0.00 sec)mysql> select count(c) from baguai_f where b='g';+----------+| count(c) |+----------+| 0 |+----------+1 row in set (0.00 sec)/<code>

这种不一致来自于 b='g' 的 c 列中都是 NULL 值，因此 count(c) 返回为 0。

二、示例中 count(*) 获取数据流程简析

注意在一文中我们已经详细的描述了部分流程，这里不再赘述，如果需要更加详细的了解，自行参考。

1. MySQL 层构建 read_set

这里构建的 read_set 实际上只会包含列b，即一个字段。

2. Innodb 层构建模板

同理根据 read_set 构建的字段模板中只会包含列b。

LOOP：这里开始循环返回每一条数据

3. Innodb 层根据模板返回数据

这里我们可以看看模板的数量和模板对应的具体列名

模板的数量

<code>断点：row_sel_store_mysql_rec查看模板数量：(gdb) p prebuilt->n_template$1 = 1/<code>查看模板对应的字段

<code>断点：row_sel_field_store_in_mysql_format_func查看模板对应的字段：(gdb) p field->name$3 = {m_name = 0x7ffe7c99cf85 "b"}/<code>

显然这里只是将 b 列的值返回给了 MySQL层，这里也很好理解，因为 b 列在 MySQL 层需要继续做过滤操作。

4. MySQL 层过滤条件 b='g'

好了，当前返回给 MySQL 层的数据中只有 b 列的数据，然后施加 b='g' 这个条件进行过滤。

5. MySQL 层过滤后做一个 COUNT 计数操作

对于普通的 select 语句过滤后的数据就可以返回了，但是对于 count 这种操作，这里做的是一个计数操作，其中行会对 count 字段的 NULL 值进行判断，当然这里是 count(*) 也就不存在 NULL 值判断了，下面是这段代码：

<code>bool Item_sum_count::add(){ if (aggr->arg_is_null(false)) return 0; count++; return 0;}/<code>

END LOOP

最终我们只需要返回这个计数就可以了。下面是发送的数据，断点可以设置在 Query_result_send::send_data 中。

<code>$22 = Item::SUM_FUNC_ITEM(gdb) p ((Item*)(items)->first->info)->field_type()$23 = MYSQL_TYPE_LONGLONG(gdb) p ((Item*)(items)->first->info)->val_int()$24 = 3(gdb) p (items)->first->info$26 = (void *) 0x7ffe7c006580(gdb) p ((Item_sum_count*)$26)->count$28 = 3/<code>

我们可以发送的数据实际就是这个计数器，最终值为 3。

三、示例中 count(c) 获取数据流程的不同

实际上整个流程基本一致，但是区别在于：

构建的 read_set 不同，模板个数自然不同，因为需要 2 个字段，即 b、c 两个字段，其中 b 列用于 where 条件过滤，而 b 列用于统计是否有 NULL 值，因此模板数量为 2，如下：

<code>(gdb) p prebuilt->n_template$29 = 2/<code>做 COUNT 计数器的时候会根据 c 列的 NULL 值做实际的过滤，操作只要是 NULL 则 count 计数不会增加 1，这个还是参考这段代码：

<code>bool Item_sum_count::add(){ if (aggr->arg_is_null(false)) //过滤NULL值 return 0; count++; return 0;}/<code>

最终会调入函数 Field::is_null 进行 NULL 值判断，断点可以设置在这里。

四、不同点总结

示例中的语句 count(c) 返回为 0。现在我们很清楚了，这些数据什么时候过滤掉的，总结如下：

Innodb 层返回了全部的行数据。MySQL 层通过 where 条件过滤，剩下了 b='g' 的行。MySQL 层通过 NULL 判断，将剩下的 count(c) 中为 NULL 的行也排除在计数之外。

而 count(*) 则没有第 3 步，这是一个不同。

然后的不同点就是在返回的字段上：

count(c) 很明显除了 where 条件以外，还需要返回 c 列给 MySQL 层count(*) 则不需要返回额外的字段给 MySQL 层，只需要 MySQL 层过滤需要的b列即可。

通过上面的分析，实际上效率没有太大的差别，我觉得同样执行计划，同样返回数据结果的前提下，可能 count(*) 的效率要略微高一点。

五、备用栈帧（下图需点击放大查看）

NULL 值计数过滤栈帧

最后推荐高鹏的专栏《深入理解 MySQL 主从原理 32 讲》，想要透彻了解学习 MySQL 主从原理的朋友不容错过。

一、使用示例

二、示例中 count(*) 获取数据流程简析

三、示例中 count(c) 获取数据流程的不同

四、不同点总结

五、备用栈帧（下图需点击放大查看）

相關文章:

在CentOS 上 调试 MySQL-5.7.x 或者 MySQL-8.0 源码

Mysql -乐观锁和悲观锁

MYSQL 利用 MYSQL Shell 安装 INNODB Cluster 这坑踩得

电力企业信息管理系统(ssm,mysql)

MySQL 数据操作 DML

Mysql 查询天、周，月，季度、年的数据

干货!MYSQL:事务管理，锁机制案例详解

MySQL 聚集索引和二级索引

专治 MySQL 乱码，再也不想看到乱码了

MySQL 派生表优化

03.03 MySQL 派生表优化

02.27 MySQL charset不同导致无法使用索引的坑

MySQL 8.0新特性：持久化自增列

mysql 建立索引的一个规则

使用 TCP Wrappers 保护 MySQL 如何导致服务中断

mysql 索引的使用与优化看这篇就够了

MySQL 的 B+Tree 索引树到底该怎么画？

mysql 数据库整理

MySQL 用 limit 会影响性能吗？

MySQL-mdl锁

关于 mysql 在开发过程中使用的点

MySQL C API 参数 MYSQL

MySQL explain详解

MySQL 优化之EXPLAIN详解(执行计划)

MySQL 用 limit 为什么会影响性能？

MySQL InnoDB的4个特性

MySQL：你知道什么是覆盖索引吗？

MySql Binlog事件介绍篇

MySQL

mysql 中的数据类型

MySQL InnoDB引擎锁的总结

MySQL 事务

「mysql」索引的设计和使用

MySQL：优化嵌套查询和分页查询

「MySQL」mysql中语句执行的顺序以及查询处理阶段的分析

mysql sql语句大全

MySQL 性能调优技巧

MySQL 常用30种SQL查询语句优化方法

07.26 MySQL 高效分页方案

MySQL query rewrite插件简单测试

MySQL 从零开始：02 MySQL 安装

07.07 MySQL——如何快速对比数据？

不像 MySQL 的 MySQL：MySQL 文档存储介绍

「MySQL」关于MySQL中的if和case语句的使用

MySQL-海量数量下的查询效率提升

「mysql」详解在查询时，offset过大影响性能的原因与优化方法

MySQL EXPLAIN详解

12.13 MySQL EXPLAIN详解

第二章 IoC容器和Bean配置

运算里不得不说的python模块—math

Devops度量--DevOps 现状快速检查表

SOP是什么（解读）

还不知道交换机上如何配置DHCP，赶紧过来围观吧，一分钟包你学会

还在手动配置IP地址吗？太Low了，一分钟教会您如何配置DHCP

Python爬虫自学笔记：分析头条文章网页源文件

DNS侦查工具

国人开源的异步 Python ORM：GINO

程序测评：Create React App 3.3中有哪些酷炫新功能？

“明学”的魅力？我只要我觉得：驾驭终端，提高生产力

（必收藏系列）Linux面试题——命令集

五分钟学会如何在 IPFS 上部署网站

「正点原子NANO STM32F103开发板资料连载」第29章 内存管理实验

小白怎么学Web前端开发 如何成为技术达人

如何开发一个web静态服务器

学Java编程还有前景吗 如何才能拿到高薪

Python网络爬虫之配置篇（一）

SpringBoot 整合SpringSecurity示例实现前后分离权限注解+JWT登录认证

Python的运行效率太低？几行代码快速提升！

python的优点是什么？最新Python400集视频（附教程）

MySQL中OOM故障应如何下手-爱可生

像专家一样使用 panic

30种不同的编程语言怎么写“Hello, World”

percona QAN 介绍

面试官：你可以用纯CSS判断鼠标进入的方向吗？

在CentOS 上调试 MySQL-5.7.x 或者 MySQL-8.0 源码

「正点原子NANO STM32F103开发板资料连载」第29章内存管理实验

小白怎么学Web前端开发如何成为技术达人

学Java编程还有前景吗如何才能拿到高薪