SQL 连接让关系型数据库管理系统名副其实。

连接(join)允许我们将分离的数据表重新构造成驱动应用程序的关系(relationship)。

本文将逐一查看 SQL 中的各种连接及其使用方式。

这里是我们将要讨论的内容:

剧透警告:我们将介绍五种不同类型的连接,但实际上你只需要知道其中两种!)

什么是连接

连接 是一种将两行结合成一行的操作。

这些行通常来自不同的表,但这并不绝对。

在我们着眼于如何写连接之前,我们先看一看连接的结果长啥样。

我们就以一个保存用户信息和他们的地址信息的系统为例吧。

保存用户信息的表里面的行可能长这个样子:

 id |     name     |        email        | age
----+--------------+---------------------+-----
  1 | John Smith   | johnsmith@gmail.com |  25
  2 | Jane Doe     | janedoe@Gmail.com   |  28
  3 | Xavier Wills | xavier@wills.io     |  3
...
(7 rows)

保存地址信息的表里面的行可能是这个样子:

 id |      street       |     city      | state | user_id
----+-------------------+---------------+-------+---------
  1 | 1234 Main Street  | Oklahoma City | OK    |       1
  2 | 4444 Broadway Ave | Oklahoma City | OK    |       2
  3 | 5678 Party Ln     | Tulsa         | OK    |       3
(3 rows)

我们可以写多个独立的查询,既检索用户信息,又检索地址信息。但是在理想情况下,我们可以写 一条查询,然后用同一个结果集(result set)接收所有的用户和他们的地址信息。

这正是连接让我们做的事情!

我们很快就会看到如何写这些连接,但如果我们连接用户信息表和地址信息表,就可以得到一个像这样的结果:

 id |     name     |        email        | age | id |      street       |     city      | state | user_id
----+--------------+---------------------+-----+----+-------------------+---------------+-------+---------
  1 | John Smith   | johnsmith@gmail.com |  25 |  1 | 1234 Main Street  | Oklahoma City | OK    |       1
  2 | Jane Doe     | janedoe@Gmail.com   |  28 |  2 | 4444 Broadway Ave | Oklahoma City | OK    |       2
  3 | Xavier Wills | xavier@wills.io     |  35 |  3 | 5678 Party Ln     | Tulsa         | OK    |       3
(3 rows)

在这里,我们可以在一个不错的结果集中看到用户和他们的地址。

除了产生组合结果集,连接的另一个重要用途就是为查询语句提供额外的信息,便于对结果集进行过滤。

例如,如果我们想给住在 Oklahoma 市的所有用户发送实体邮件,我们就可以使用这个连接在一起的结果集,然后根据 city 列进行过滤。

既然我们已经知道了连接的用途,那就开始写一些吧!

设置数据库

在写查询语句之前,我们需要先设置好数据库。

在这些示例中,我们将使用 PostgreSQL,但是这里展示的查询和概念可以很容易地被翻译到任何其它的现代数据库系统中(比如 MySQL、SQL Server,等等)。

我们可以使用 psql与 PostgreSQL 数据库一起工作,它是 PostgreSQL 的交互式命令行程序。如果你有其它的数据库客户端,你也可以用它们。

首先,创建我们的数据库。[安装]好 PostgreSQL 之后,在终端运行 createdb <database-name>命令,创建一个新的数据库。我管我的数据库叫 fcc

$ createdb fcc

接下来使用命令 psql 启动一个交互式控制台,然后使用 \c <database-name> 连接到我们刚才创建的数据库:

$ psql
psql (11.5)
Type "help" for help.

john=# \c fcc
You are now connected to database "fcc" as user "john".
fcc=#

注意: 为了便于阅读,我已经去掉了这些示例中 psql 的输出,所以如果你的终端显示的内容和这里的不完全相同,也不必担心。

我鼓励你亲自动手跟着这些示例来一遍。如果你完成这些示例,你学到和记住的东西要比只阅读来的收获多得多。

现在看连接!

交叉连接

交叉连接(CROSS JOIN)是我们能做的最简单的连接,它又叫 笛卡尔乘积(Cartesian product)

这种连接将一张表中的每一行与另一张表中的每一行逐一进行连接。

如果我们有两个列表——一个包含 1、2、3,另一个包含 A、B、C。这两个列表的笛卡尔乘积就是这样:

1A, 1B, 1C
2A, 2B, 2C
3A, 3B, 3C

第一个列表中的每一个值都与第二个列表中的每一个值进行了配对。

让我们把这个示例写成一条 SQL 查询。

我们先创建两个非常简单的表,再插入一些数据进去:

CREATE TABLE letters(
  letter TEXT
);

INSERT INTO letters(letter) VALUES ('A'), ('B'), ('C');

CREATE TABLE numbers(
  number TEXT
);

INSERT INTO numbers(number) VALUES (1), (2), (3);

我们的两个表(lettersnumbers)都只有一列:一个简单的文本字段。

现在使用 CROSS JOIN 将它们连接在一起:

SELECT *
FROM letters
CROSS JOIN numbers;
 letter | number
--------+--------
 A      | 1
 A      | 2
 A      | 3
 B      | 1
 B      | 2
 B      | 3
 C      | 1
 C      | 2
 C      | 3
(9 rows)

这是我们能做的最简单的连接,但是即使是在这个简单的示例中,我们也能看见连接在起作用:分开的两行(一行来自 letter,一行来自 numbers)已经被 连接 成一行。

虽然这种连接通常只被当作学术范例进行讨论,但它至少有一个很好的用例:覆盖日期范围。

带日期范围的交叉连接

交叉连接的一个好用例就是从表中读取每一行,然后将其用于某个日期范围内的每一天。

例如你正在构建一个追踪每日任务的应用,如刷牙、吃早饭或洗澡。

如果你想为上周 每天每个任务 都生成一条记录,你可以在某个日期范围上使用 CROSS JOIN

我们可以使用 generate_series 函数产生这个日期范围:

SELECT generate_series(
  (CURRENT_DATE - INTERVAL '5 day'),
  CURRENT_DATE,
  INTERVAL '1 day'
)::DATE AS day;

generate_series 函数接收三个参数。

第一个参数是起始值,我们在示例中使用的是 CURRENT_DATE - INTERVAL '5 day',它返回当前日期减去五天(五天前)的值。

第二个参数是当前日期(CURRENT_DATE)。

第三个参数是阶距(step interval),也就是值每次的增量大小。因为这些是日常任务,所以我们使用一天做为间隔(INTERVAL '1 day')。

把这三个参数放在一起,就会生成一个日期序列:从五天前开始,到今天结束,每次前进一天。

最后,我们通过使用 ::DATE 将这些值的输出转为日期类型,去掉时间部分。我们还使用 AS day 为这一列设置了别名,让输出看起来更友好。

这个查询的输出就是过去五天加今天:

    day
------------
 2020-08-19
 2020-08-20
 2020-08-21
 2020-08-22
 2020-08-23
 2020-08-24
(6 rows)

回到我们的每日任务示例,一起创建一个存放我们想要完成的任务的简单表吧,然后插入几个任务:

CREATE TABLE tasks(
  name TEXT
);

INSERT INTO tasks(name) VALUES
('Brush teeth'),
('Eat breakfast'),
('Shower'),
('Get dressed');

task 表只有一列(name),我们往这个表中插入了四个任务。

现在让我们把任务和生成日期的查询交叉连接在一起吧:

SELECT
  tasks.name,
  dates.day
FROM tasks
CROSS JOIN
(
  SELECT generate_series(
    (CURRENT_DATE - INTERVAL '5 day'),
    CURRENT_DATE,
    INTERVAL '1 day'
  )::DATE    AS day
) AS dates

(因为我们生成日期的查询并不是一个真实的表,所以我们将它写成了子查询。)

这个查询返回了任务名和日期,结果集看起来像这样:

     name      |    day
---------------+------------
 Brush teeth   | 2020-08-19
 Brush teeth   | 2020-08-20
 Brush teeth   | 2020-08-21
 Brush teeth   | 2020-08-22
 Brush teeth   | 2020-08-23
 Brush teeth   | 2020-08-24
 Eat breakfast | 2020-08-19
 Eat breakfast | 2020-08-20
 Eat breakfast | 2020-08-21
 Eat breakfast | 2020-08-22
 ...
 (24 rows)

不出所料,日期范围内的每一天中的每一个任务都对应着一行。

CROSS JOIN 是我们能使用的最简单的连接。但是,为了查看接下来的几种类型的连接,我们需要设置更加真实的表。

准备示例数据(导演和电影)

为了展示接下来的几种连接类型,我们需要使用 电影电影导演 这个例子。

在这种情况下,一部电影有一位导演,但是这不是 必需 的——想像一部新电影被宣布,但是它的导演还未确定。

我们的演员表(directors)将会保存每位演员的姓名,电影表(movie)将会保存每部电影的名字以及一个指向导演的引用(如果有的话)。

咱们先创建那两个表并插入一些数据吧:

CREATE TABLE directors(
  id SERIAL PRIMARY KEY,
  name TEXT NOT NULL
);

INSERT INTO directors(name) VALUES
('John Smith'),
('Jane Doe'),
('Xavier Wills'),
('Bev Scott'),
('Bree Jensen');

CREATE TABLE movies(
  id SERIAL PRIMARY KEY,
  name TEXT NOT NULL,
  director_id INTEGER REFERENCES directors 
);

INSERT INTO movies(name, director_id) VALUES
('Movie 1', 1),
('Movie 2', 1),
('Movie 3', 2),
('Movie 4', NULL),
('Movie 5', NULL);

我们有五位导演和五部电影,其中三部电影是有导演的。ID 为 1 的导演有两部电影,ID 为 2 的导演有一部电影。

全外连接

既然已经有了一些数据,我们就看看全外连接(FULL OUTER JOIN)吧。

FULL OUTER JOINCROSS JOIN 有些类似,但又有两个关键的区别。

第一个区别是 FULL OUTER JOIN 需要有一个 连接条件(join condition)

连接条件声明了两张表的行与行之间是如何关联的,以及将它们连接在一起的条件。

在我们的示例中,movies 表通过 director_id 列引用演员,这一列与 directors 表的 id 列相匹配。我们将把这两列用作连接条件。

这是我们用来连接两张表的 SQL:

SELECT *
FROM movies
FULL OUTER JOIN directors
  ON directors.id = movies.director_id;

注意:我们将匹配电影和导演的连接连接声明为:ON movie.director_id = directors.id

我们的结果集看起来就像一个奇怪的笛卡尔乘积:

  id  |  name   | director_id |  id  |     name
------+---------+-------------+------+--------------
    1 | Movie 1 |           1 |    1 | John Smith
    2 | Movie 2 |           1 |    1 | John Smith
    3 | Movie 3 |           2 |    2 | Jane Doe
    4 | Movie 4 |        NULL | NULL | NULL
    5 | Movie 5 |        NULL | NULL | NULL
 NULL | NULL    |        NULL |    5 | Bree Jensen
 NULL | NULL    |        NULL |    4 | Bev Scott
 NULL | NULL    |        NULL |    3 | Xavier Wills
(8 rows)

我们首先看到的是那些有导演的电影对应的行,这时连接条件的值为真。

然而,我们还能在这些行后面看到 每张表 中剩余的行,只是未匹配上的另一张表的对应值为 NULL

**注意:**如果你不熟悉 NULL 值,可以从 SQL 运算符教程中查看我的解释。

我们还看到了 CROSS JOINFULL OUTER JOIN 的另一个区别:对于每张表,FULL OUTER JOIN 只会返回一行,而 CROSS JOIN 会返回多行。

内连接

下一种连接类型——内连接(INNER JOIN),是最常用的连接类型之一。

内连接 只返回连接条件为真的那些行

在我们的示例中,moviesdirectors 表之间的内连接只会返回指派了导演的电影的记录。

语法与之前的基本一致:

SELECT *
FROM movies
INNER JOIN directors
  ON directors.id = movies.director_id;

我们的结果展示了有导演的那三部电影:

 id |  name   | director_id | id |    name
----+---------+-------------+----+------------
  1 | Movie 1 |           1 |  1 | John Smith
  2 | Movie 2 |           1 |  1 | John Smith
  3 | Movie 3 |           2 |  2 | Jane Doe
(3 rows)

由于内连接只包含满足连接条件的那些行,所以 连接两个表时,谁先谁后并不重要

如果我们反转查询中表的顺序,我们还是会得到相同的结果:

SELECT *
FROM directors
INNER JOIN movies
  ON movies.director_id = directors.id;
 id |    name    | id |  name   | director_id
----+------------+----+---------+-------------
  1 | John Smith |  1 | Movie 1 |           1
  1 | John Smith |  2 | Movie 2 |           1
  2 | Jane Doe   |  3 | Movie 3 |           2
(3 rows)

在这个查询中,由于我们先列出了 directors 表并选取所有的列(SELECT *),所以我们会先看到 directors 表中的列,然后才是 movies 表中的列,但是得到的数据是一样的。

内连接的这个性质非常有用,但是它并不适用于所有的连接类型——比如接下来的这种类型。

左连接与右连接

接下来的两种连接类型用了一个修饰符(LEFTRIGHT),它会决定哪个表的数据被包含到结果集中。

注意: LEFT JOINRIGHT JOIN 也可以被称为 LEFT OUTER JOINRIGHT OUTER JOIN

这两种连接的使用场景是:我们想返回某个特定表中的所有数据,如果关联表中存在相应的数据,也将其返回。

如果关联的数据不存在,我们仍然可以得到“主表”的所有记录。

它是一个针对特定事物的信息和奖励信息(如果存在的话)的查询。

举个例子就好理解了。让我们找出所有的电影和它们的导演,但是我们不关心电影是否有导演——导演就是奖励:

SELECT *
FROM movies
LEFT JOIN directors
  ON directors.id = movies.director_id;

这个查询的形式与之前一样——我们只是将连接声明为了 LEFT JOIN

在这个示例中,movies 表就是“左表”。

如果我们将查询写成一行,看起来会更容易一些:

... FROM movies LEFT JOIN directors ...

左连接返回“左表”中的所有记录

左连接会返回“右表”中 满足连接条件 的所有记录。

“右表”中 不满足连接条件的记录会以 NULL 值返回

 id |  name   | director_id |  id  |    name
----+---------+-------------+------+------------
  1 | Movie 1 |           1 |    1 | John Smith
  2 | Movie 2 |           1 |    1 | John Smith
  3 | Movie 3 |           2 |    2 | Jane Doe
  4 | Movie 4 |        NULL | NULL | NULL
  5 | Movie 5 |        NULL | NULL | NULL
(5 rows)

看着这个结果集,我们就能明白为何这种连接在 所有的这个和部分的那个(如果存在的话) 类型的连接中特别有用了。

右连接

除了调换了关于两表的要求外,右连接(RIGHT JOIN)的工作原理与 LEFT JOIN 一模一样。

在右连接中,“右表”中的所有行全部返回,而“左表”根据连接条件返回。

我们还是使用上面的那个查询,只不过这一次要将 LEFT JOIN 替换成 RIGHT JOIN

SELECT *
FROM movies
RIGHT JOIN directors
  ON directors.id = movies.director_id;
  id  |  name   | director_id | id |     name
------+---------+-------------+----+--------------
    1 | Movie 1 |           1 |  1 | John Smith
    2 | Movie 2 |           1 |  1 | John Smith
    3 | Movie 3 |           2 |  2 | Jane Doe
 NULL | NULL    |        NULL |  5 | Bree Jensen
 NULL | NULL    |        NULL |  4 | Bev Scott
 NULL | NULL    |        NULL |  3 | Xavier Wills
(6 rows)

我们现在的结果集返回了 directors 表的所有行和 movies 数据(如果存在的话)。

我们所做的就是切换“主表”,“主表”就是不管数据存在与否,我们都想查看到所有数据的那个表。

生产应用程序中的左连接与右连接

在生产应用程序中,我只用过 LEFT JOIN,从未用过 RIGHT JOIN

我这么做的原因是:我认为 LEFT JOIN 让查询更易于阅读和理解。

当我写查询语句时,我喜欢从“基础”结果集开始思考,比如所有的电影。然后在它的基础上引入(或去除)一些东西。

因为我喜欢从基础开始,而 LEFT JOIN 恰好满足了这种思路。我想要的是基础表(“左表”)中的所有行和“右表”中满足条件的行。

在实践中,我觉得我没有在生产应用中见过 RIGHT JOINRIGHT JOIN 并没有错,我只是认为它会让查询更难理解。

重写右连接

如果我们想翻转上面的场景,返回所有的导演和满足条件的电影,我们可以将 RIGHT JOIN 重写为 LEFT JOIN

我们只需要翻转两个表在查询语句中的顺序,再把 RIGHT 改成 LEFT 即可:

SELECT *
FROM directors
LEFT JOIN movies
  ON movies.director_id = directors.id;

注意: 我喜欢将被连接的表(“右表”,即上面示例中的 movies)写在连接条件中的第一个((ON movies.director_id = ...),不过这只是我的个人偏好。

使用左连接过滤数据

LEFT JOIN(或 RIGHT JOIN)有两个用例。

第一个用例我们已经讲了:返回一个表中的所有数据,以及另一个表中满足条件的数据。

第二个用例是 在第二个表中的数据不存在的情况下,返回第一个表中的所有行。

这个场景看起来像这样:找出 不属于任何电影 的导演。

为此,我们从 LEFT JOIN 开始,将 directors 作为主表或“左表”:

SELECT *
FROM directors
LEFT JOIN movies
  ON movies.director_id = directors.id;

对于那些不属于任何电影的导演来说,来自 movies 表的列都是 NULL

 id |     name     |  id  |  name   | director_id
----+--------------+------+---------+-------------
  1 | John Smith   |    1 | Movie 1 |           1
  1 | John Smith   |    2 | Movie 2 |           1
  2 | Jane Doe     |    3 | Movie 3 |           2
  5 | Bree Jensen  | NULL | NULL    |        NULL
  4 | Bev Scott    | NULL | NULL    |        NULL
  3 | Xavier Wills | NULL | NULL    |        NULL
(6 rows)

在我们的示例中,ID 为 3、4 和 5 的导演不属于任何一部电影。

要从结果集中过滤出这些行,我们可以加一个 WHERE 子句,只返回电影数据为 NULL 的行:

SELECT *
FROM directors
LEFT JOIN movies
  ON movies.director_id = directors.id
WHERE movies.id IS NULL;
 id |     name     |  id  | name | director_id
----+--------------+------+------+-------------
  5 | Bree Jensen  | NULL | NULL |        NULL
  4 | Bev Scott    | NULL | NULL |        NULL
  3 | Xavier Wills | NULL | NULL |        NULL
(3 rows)

有三部电影没有导演!

使用表的 id 列进行过滤(WHERE movies.id IS NULL)是很普遍的。但是,因为 movies 表的所有列都是 NULL,所以使用其中任何一个都能达到目的。

(由于我们知道 movies 表中的所有列都会是 NULL,所以在上面的那个查询中,我们可以将 SELECT * 替换成 SELECT directors.*,从而只返回所有的导演信息)。

使用左连接查找匹配

在我们之前的查询中,我们找到了那些 属于任何电影的导演。

使用同样的结构,我们可以找到那些 肯定 属于电影的导演。只需要将 WHERE 条件改成寻找电影数据 不是 NULL 的电影数据即可:

SELECT *
FROM directors
LEFT JOIN movies
  ON movies.director_id = directors.id
WHERE movies.id IS NOT NULL;
 id |    name    | id |  name   | director_id
----+------------+----+---------+-------------
  1 | John Smith |  1 | Movie 1 |           1
  1 | John Smith |  2 | Movie 2 |           1
  2 | Jane Doe   |  3 | Movie 3 |           2
(3 rows)

这可能看起来很方便,但我们实际上只是在重新实现 INNER JOIN 而已。

多表连接

我们已经看到如何将两张表连接在一起了,但对于多表连接会怎么样呢?

实际上很简单,但是我们需要第三个表(tickets)来进行举例:

这个表将代表已经售出的电影票:

CREATE TABLE tickets(
  id SERIAL PRIMARY KEY,
  movie_id INTEGER REFERENCES movies NOT NULL
);

INSERT INTO tickets(movie_id) VALUES (1), (1), (3);

tickets 表只有一个 id 和一个电影的引用:movie_id

我们也为 ID 为 1 的电影插入了两张票,为 ID 为 3 的电影插入了一张票。

现在,让我们连接 directorsmovies,然后再连接 moviestickets

SELECT *
FROM directors
INNER JOIN movies
  ON movies.director_id = directors.id
INNER JOIN tickets
  ON tickets.movie_id = movies.id;

因为这些是内连接,所以连接的顺序并不重要。我们可以从 tickets 开始,连接 movies,再连接 directors

它的顺序也取决于你想要查询的什么以及什么让查询最易于理解。

在结果集中,我们将会注意到返回行的范围已经被进一步缩小了:

 id |    name    | id |  name   | director_id | id | movie_id
----+------------+----+---------+-------------+----+----------
  1 | John Smith |  1 | Movie 1 |           1 |  1 |        1
  1 | John Smith |  1 | Movie 1 |           1 |  2 |        1
  2 | Jane Doe   |  3 | Movie 3 |           2 |  3 |        3
(3 rows)

这是因为我们加了另一个 INNER JOIN,实际上它给我们的查询添加了另一个 AND 条件。

我们的查询本质上是在说:“返回所有属于电影的导演,这些电影 也有 电影票售出”

如果我们想找出属于 可能还没有电影票售出 的电影的导演,我们可以将最后一个 INNER JOIN 替换成 LEFT JOIN

SELECT *
FROM directors
JOIN movies
  ON movies.director_id = directors.id
LEFT JOIN tickets
  ON tickets.movie_id = movies.id;

我们可以看到 Movie 2 现在又回到结果集中来了:

 id |    name    | id |  name   | director_id |  id  | movie_id
----+------------+----+---------+-------------+------+----------
  1 | John Smith |  1 | Movie 1 |           1 |    1 |        1
  1 | John Smith |  1 | Movie 1 |           1 |    2 |        1
  2 | Jane Doe   |  3 | Movie 3 |           2 |    3 |        3
  1 | John Smith |  2 | Movie 2 |           1 | NULL |     NULL
(4 rows)

这部电影一张票也没有卖出去,所以它因 INNER JOIN 被之前的结果集中排除掉了。

我将 给读者留一个练习,你如何能找出那些属于一张票也 没有 卖出去的电影的导演呢?

连接的执行顺序

最后,我们并不关心连接是以何种顺序执行的。

SQL 和其它现代编程语言之间的一个关键区别就是 SQL 是一门 声明式 语言。

这意味着我们声明期望的结果,但并不声明执行细节——这些细节留给了给数据库查询规划器(database query planner)。我们只管声明我们想要的连接和条件,查询规划器会处理剩余部分。

但是,现实中的数据库并不会同时连接三张表。相反,它会先连接前两张表得到一个中间结果,然后把这个中间结果集与第三张表连接。

注意: 这个解释有点简单。)

因此,当我们在查询中遇到多表连接时,我们可以将它们看成一连串的两表连接——尽管其中的一个表会变得非常大。

带额外条件的连接

我们将要介绍的最后一个主题是带额外条件的连接。

WHERE 字句类似,我们可以添加任意多的条件到连接中。

例如,如果我们想找出电影和导演的信息,但导演的 名字 不能是 “John Smith”。我们可以用 AND 添加一个额外的条件到我们的连接中:

SELECT *
FROM movies
INNER JOIN directors
  ON directors.id = movies.director_id
  AND directors.name <> 'John Smith';

我们可以在这个连接条件中使用任何放在 WHERE 子句中的运算符。

如果我们将条件放到 WHERE 子句中,也能得到同样的结果:

SELECT *
FROM movies
INNER JOIN directors
  ON directors.id = movies.director_id
WHERE directors.name <> 'John Smith';

这里背后发生的事情有一些细微的差异,但是就本文而言,结果集是一样的。

(如果你不太熟悉过滤 SQL 查询的所有方式,你可以在这里查看之前提到的文章。)

现实中的连接查询

事实上,我发现我自己只通过三种方式使用连接:

内连接

第一个用例是两表之间的关系 肯定 存在的记录,通过 INNER JOIN 实现。

条件如查找 “具有导演的电影” 或 “具有帖子的用户”。

左连接

第二个用例是来自一个表的记录,以及关系存在时来自第二个表的记录,通过 LEFT JOIN 实现。

条件如 “具有导演的电影(如果有的话)” 或 “具有文章的用户(如果有的话)”。

左连接排除数据

第三个常见的用例是 LEFT JOIN 的第二个用例:查找一个表中的记录,但这些记录在另一个表中 没有 关系。

条件如 “没有导演的电影” 或 “没有文章的用户”。

两种非常有用的连接类型

我认为我不曾在生产应用中用过 FULL OUTER JOINRIGHT JOIN,相关用例要么很少,要么查询可以被写成更加清晰的形式(RIGHT JOIN 的情况)。

我偶尔会为一些东西使用 CROSS JOIN,比如分散在某个时间范围内的记录(像我们一开始看到的那样),但是那种场景也不多。

所以,好消息来了!对于你将遇到的 99.9% 的用例,只需要理解 INNER JOINLEFT JOIN 这两种类型的连接就可以解决了。

如果你喜欢这篇文章,可以在 twitter 上关注我,我在那里谈论数据库和所有其它开发相关的话题。

感谢阅读!

John

P.S. 文末小技巧:大多数数据库系统允许你用 JOIN 代替 INNER JOIN——可以让你少打几个字。:)

原文:SQL Joins Tutorial: Cross Join, Full Outer Join, Inner Join, Left Join, and Right Join,作者:John Mosesman