MySQL的LEFT JOIN表连接的进阶学习教程

LEFT JOIN的主表

这里所说的主表是指在连接查询里MySQL以哪个表为主进行查询。比如说在LEFT JOIN查询里，一般来说左表就是主表，但这只是经验之谈，很多时候经验主义是靠不住的，为了说明问题，先来个例子，建两个演示用的表categories和posts：

				?

									CREATE TABLE IF NOT EXISTS `categories` (

									`id` int(10) unsigned NOT NULL AUTO_INCREMENT,

									`name` varchar(15) NOT NULL,

									`created` datetime NOT NULL,

									PRIMARY KEY (`id`)

									);

									CREATE TABLE IF NOT EXISTS `posts` (

									`id` int(10) unsigned NOT NULL AUTO_INCREMENT,

									`category_id` int(10) unsigned NOT NULL,

									`title` varchar(100) NOT NULL,

									`content` varchar(200) NOT NULL,

									`created` datetime NOT NULL,

									PRIMARY KEY (`id`),

									KEY `category_id` (`category_id`)

									);

先注意一下每个表的索引情况，以后会用到，记得随便插入一点测试数据，不用太多，但怎么也得两行以上，然后执行以下SQL：

				?

									EXPLAIN SELECT *

									FROM posts

									LEFT JOIN categories ON posts.category_id = categories.id

									WHERE categories.id = ‘一个已经存在的ID'

									ORDER BY posts.created DESC

				?

									table   key     Extra

									categories PRIMARY   Using filesort

									posts   category_id Using where

在explain的结果中，第一行表示的表就是主表，所以说在此查询里categories是主表，而在我们的经验里，LEFT JOIN查询里，左表（posts表）才应该是主表，这产生一个根本的矛盾，MySQL之所以这样处理，是因为在我们的WHERE部分，查询条件是按照categories表的字段来进行筛选的，而恰恰categories表存在合适的索引，所以在查询时把categories表作为主表更有利于缩小结果集。

那explain结果中的Using filesort又是为什么呢？这是因为主表是categories表，从表是posts表，而我们使用从表的字段去ORDER BY，这通常不是一个好选择，最好改成主表字段，如果鉴于需求所限，无法改成主表的字段，那么可以尝试添加如下索引：

				?

									ALTER TABLE `posts` ADD INDEX ( `category_id` , `created` );

再运行SQL时就不会有Using filesort了，这是因为主表categories在通过category_id连接从表posts时，可以进而通过索引直接得到排序后的posts结果。

主观上一旦搞错了主表，可能怎么调整索引都得不到高效的SQL，所以在写SQL时，比如说在写LEFT JOIN查询时，如果希望左表是主表，那么就要保证在WHERE语句里的查询条件尽可能多的使用左表字段，进而，一旦确定了主表，也最好只通过主表字段去ORDER BY。

LEFT JOIN查询效率分析
user表:

				?

									id | name

									---------

									1 | libk

									2 | zyfon

									3 | daodao

									user_action表:

									user_id | action

									---------------

									1 | jump

									1 | kick

									1 | jump

									2 | run

									4 | swim

sql:

				?

									select id, name, action from user as u

									left join user_action a on u.id = a.user_id

									result:

									id | name | action

									--------------------------------

									1 | libk | jump ①

									1 | libk | kick ②

									1 | libk | jump ③

									2 | zyfon | run ④

									3 | daodao | null ⑤

分析：
注意到user_action中还有一个user_id=4, action=swim的纪录，但是没有在结果中出现，
而user表中的id=3, name=daodao的用户在user_action中没有相应的纪录，但是却出现在了结果集中
因为现在是left join，所有的工作以left为准.
结果1，2，3，4都是既在左表又在右表的纪录，5是只在左表，不在右表的纪录

结论：
我们可以想象left join 是这样工作的
从左表读出一条，选出所有与on匹配的右表纪录(n条)进行连接，形成n条纪录(包括重复的行，如：结果1和结果3)，
如果右边没有与on条件匹配的表，那连接的字段都是null.
然后继续读下一条。

引申：
我们可以用右表没有on匹配则显示null的规律, 来找出所有在左表，不在右表的纪录，注意用来判断的那列必须声明为not null的。
如：

				?

									select id, name, action from user as u

									left join user_action a on u.id = a.user_id

									where a.user_id is NULL

(注意:1.列值为null应该用is null 而不能用=NULL
2.这里a.user_id 列必须声明为 NOT NULL 的)

				?

									result:

									id | name | action

									--------------------------

									3 | daodao | NULL

									--------------------------------------------------------------------------------

Tips:
1. on a.c1 = b.c1 等同于 using(c1)
2. INNER JOIN 和 , (逗号) 在语义上是等同的
3. 当 MySQL 在从一个表中检索信息时，你可以提示它选择了哪一个索引。
如果 EXPLAIN 显示 MySQL 使用了可能的索引列表中错误的索引，这个特性将是很有用的。
通过指定 USE INDEX (key_list)，你可以告诉 MySQL 使用可能的索引中最合适的一个索引在表中查找记录行。
可选的二选一句法 IGNORE INDEX (key_list) 可被用于告诉 MySQL 不使用特定的索引。
4. 一些例子：

				?

									mysql> SELECT * FROM table1,table2 WHERE table1.id=table2.id;

									mysql> SELECT * FROM table1 LEFT JOIN table2 ON table1.id=table2.id;

									mysql> SELECT * FROM table1 LEFT JOIN table2 USING (id);

									mysql> SELECT * FROM table1 LEFT JOIN table2 ON table1.id=table2.id

									-> LEFT JOIN table3 ON table2.id=table3.id;

									mysql> SELECT * FROM table1 USE INDEX (key1,key2)

									-> WHERE key1=1 AND key2=2 AND key3=3;

									mysql> SELECT * FROM table1 IGNORE INDEX (key3)

									-> WHERE key1=1 AND key2=2 AND key3=3;

MySQL的LEFT JOIN表连接的进阶学习教程

相关文章

热门资讯