Hierarchical query-层次查询之START WITH CONNECT BY用法

Hierarchical query-层次查询中start with…connect by prior子句用法;

connect by 是结构化查询中用到的,其基本语法是:
select … from tablename start with 条件1
connect by 条件2
where 条件3;
例:
select level,empno,ename,job,mgr  from emp

start with empno=7566 or empno=7788

connect by prior empno=mgr;

简单说来是将一个树状结构存储在一张表里,比如一个表中存在两个字段:
org_id,parent_id那么通过表示每一条记录的parent是谁,就可以形成一个树状结构。
用上述语法的查询可以取得这棵树的所有记录。
其中:
条件1 是根结点的限定语句,也可以放在CONNECT BY后面。它后面所跟的就是递归的种子,也就是递归开始的地方;当然可以放宽限定条件,以取得多个根结点,实际就是多棵树。
条件2 是连接条件,其中用PRIOR表示上一条记录,比如 CONNECT BY PRIOR org_id = parent_id就是说上一条记录的org_id 是本条记录的parent_id,即本记录的父亲是上一条记录。
条件3 是过滤条件,用于对返回的所有记录进行过滤。

简单介绍如下:
早扫描树结构表时,需要依此访问树结构的每个节点,一个节点只能访问一次,其访问的步骤如下:
第一步:从根节点开始;
第二步:访问该节点;
第三步:判断该节点有无未被访问的子节点,若有,则转向它最左侧的未被访问的子节,并执行第二步,否则执行第四步;
第四步:若该节点为根节点,则访问完毕,否则执行第五步;
第五步:返回到该节点的父节点,并执行第三步骤。

扫描整个树结构的过程也即是顺序遍历树的过程。

 1. 树结构的描述

树结构的数据存放在表中,数据之间的层次关系即父子关系,通过表中的列与列间的关系来描述,如EMP表中的EMPNO和MGR。EMPNO表示该雇员的编号,MGR表示领导该雇员的人的编号,即子节点的MGR值等于父节点的EMPNO值。在表的每一行中都有一个表示父节点的MGR(除根节点外),通过每个节点的父节点,就可以确定整个树结构。
在SELECT命令中使用CONNECT BY 和START WITH 子句可以查询表中的树型结构关系。其命令格式如下:
SELECT 。。。 CONNECT BY {PRIOR 列名1=列名2|列名1=PRIOR 裂名2}    [START WITH];
其中:CONNECT BY子句说明每行数据将是按层次顺序检索,并规定将表中的数据连入树型结构的关系中。PRIORY运算符必须放置在连接关系的两列中某一个的前面。对于节点间的父子关系,PRIOR运算符在一侧表示父节点,在另一侧表示子节点,从而确定查找树结构是的顺序是自顶向下还是自底向上。在连接关系中,除了可以使用列名外,还允许使用列表达式。START WITH 子句为可选项,用来标识哪个节点作为查找树型结构的根节点。若该子句被省略,则表示所有满足查询条件的行作为根节点。
START WITH: 不但可以指定一个根节点,还可以指定多个根节点。 指定多个根节点可以用or

2. 关于PRIOR

运算符PRIOR被放置于等号前后的位置,决定着查询时的检索顺序。 PRIOR后的字段也指定一个开始的节点;PRIOR在等号哪侧,哪侧是根节点/父节点。

若prior缺省,则只能查询到符合条件的起始行,并不进行递归查询;
PRIOR被置于CONNECT BY子句中等号的前面时,则强制从根节点到叶节点的顺序检索,即由父节点向子节点方向通过树结构,我们称之为自顶向下的方式。如:
SCOTT@bys1>select level,empno,ename,job,mgr  from emp  start with empno=7566 or empno=7788 connect by prior empno=mgr;

SCOTT@bys1>select level,empno,ename,job,mgr  from emp  connect by prior empno=mgr start with  empno=7566 or empno=7788;

LEVEL      EMPNO ENAME      JOB              MGR
———- ———- ———- ——— ———-
1       7788 SCOTT      ANALYST         7566
2       7876 ADAMS      CLERK           7788
1       7566 JONES      MANAGER         7839
2       7788 SCOTT      ANALYST         7566
3       7876 ADAMS      CLERK           7788
2       7902 FORD       ANALYST         7566
3       7369 SMITH      CLERK           7902

PIROR运算符被置于CONNECT BY 子句中等号的后面时,则强制从叶节点到根节点的顺序检索,即由子节点向父节点方向通过树结构,我们称之为自底向上的方式。例如:

SCOTT@bys1>select level,empno,ename,job,mgr  from emp  start with empno=7788 connect by empno=priormgr;
LEVEL      EMPNO ENAME      JOB              MGR
———- ———- ———- ——— ———-
1       7788 SCOTT      ANALYST         7566
2       7566 JONES      MANAGER        7839
3       7839 KING       PRESIDENT

3. 定义查找起始节点

在自顶向下查询树结构时,不但可以从根节点开始,还可以定义任何节点为起始节点,以此开始向下查找。这样查找的结果就是以该节点为开始的结构树的一枝。

4.使用LEVEL

在具有树结构的表中,每一行数据都是树结构中的一个节点,由于节点所处的层次位置不同,所以每行记录都可以有一个层号。层号根据节点与根节点的距离确定。不论从哪个节点开始,该起始根节点的层号始终为1,根节点的子节点为2, 依此类推。

5.节点和分支的裁剪

在对树结构进行查询时,可以去掉表中的某些行,也可以剪掉树中的一个分支,使用WHERE子句来限定树型结构中的单个节点,以去掉树中的单个节点,但它却不影响其后代节点(自顶向下检索时)或前辈节点(自底向顶检索时)。

6.排序显示

象在其它查询中一样,在树结构查询中也可以使用ORDER BY 子句,改变查询结果的显示顺序,而不必按照遍历树结构的顺序

二、使用WHERE或CONNECT BY子句中增加条件来修剪树枝和节点:

借用一张图:

从图中可以看到,使用WHERE字句删除的只是单个节点,节点下的树结构依然存在。

而在CONNECT BY中通过增加条件,可以删除节点及节点下的树结构。

如下两条SQL语句:

SCOTT@bys1>select level,empno,ename,job,mgr  from emp start with mgr is null connect by prior empno=mgr;
LEVEL      EMPNO ENAME      JOB              MGR
———- ———- ———- ——— ———-
1       7839 KING       PRESIDENT
2       7566 JONES      MANAGER         7839
3       7788 SCOTT      ANALYST         7566
4       7876 ADAMS      CLERK           7788
3       7902 FORD       ANALYST         7566
4       7369 SMITH      CLERK           7902
2       7698 BLAKE      MANAGER         7839
3       7499 ALLEN      SALESMAN        7698
3       7521 WARD       SALESMAN        7698
3       7654 MARTIN     SALESMAN        7698
3       7844 TURNER     SALESMAN        7698
3       7900 JAMES      CLERK           7698
2       7782 CLARK      MANAGER         7839
3       7934 MILLER     CLERK           7782
使用WHERE过滤,可以看到empno=7788的行没显示,empno=7788行的子节点显示了

SCOTT@bys1>select level,empno,ename,job,mgr  from emp where empno!=7566 start with mgr is null connect by prior empno=mgr;

LEVEL      EMPNO ENAME      JOB              MGR
———- ———- ———- ——— ———-
1       7839 KING       PRESIDENT
3       7788 SCOTT      ANALYST         7566
4       7876 ADAMS      CLERK           7788
3       7902 FORD       ANALYST         7566
4       7369 SMITH      CLERK           7902
2       7698 BLAKE      MANAGER         7839
3       7499 ALLEN      SALESMAN        7698
3       7521 WARD       SALESMAN        7698
3       7654 MARTIN     SALESMAN        7698
3       7844 TURNER     SALESMAN        7698
3       7900 JAMES      CLERK           7698
2       7782 CLARK      MANAGER         7839
3       7934 MILLER     CLERK           7782

13 rows selected.
可以用WHERE过滤年根节点的7839 KING,其它子节点的员工可以显示。
SCOTT@bys1>select level,empno,ename,job,mgr  from emp where empno!=7839 start with mgr is null connect by prior empno=mgr;
LEVEL      EMPNO ENAME      JOB              MGR
———- ———- ———- ——— ———-
2       7566 JONES      MANAGER         7839
3       7788 SCOTT      ANALYST         7566
4       7876 ADAMS      CLERK           7788
3       7902 FORD       ANALYST         7566
4       7369 SMITH      CLERK           7902
2       7698 BLAKE      MANAGER         7839
3       7499 ALLEN      SALESMAN        7698
3       7521 WARD       SALESMAN        7698
3       7654 MARTIN     SALESMAN        7698
3       7844 TURNER     SALESMAN        7698
3       7900 JAMES      CLERK           7698
2       7782 CLARK      MANAGER         7839
3       7934 MILLER     CLERK           7782
13 rows selected.

使用CONNECT BY中的条件,empno!=7566;将此条数据和属于它的子节点都过滤了。

SCOTT@bys1>select level,empno,ename,job,mgr  from emp start with mgr is null connect by prior empno=mgr andempno!=7566;
LEVEL      EMPNO ENAME      JOB              MGR
———- ———- ———- ——— ———-
1       7839 KING       PRESIDENT
2       7698 BLAKE      MANAGER         7839
3       7499 ALLEN      SALESMAN        7698
3       7521 WARD       SALESMAN        7698
3       7654 MARTIN     SALESMAN        7698
3       7844 TURNER     SALESMAN        7698
3       7900 JAMES      CLERK           7698
2       7782 CLARK      MANAGER         7839
3       7934 MILLER     CLERK           7782
9 rows selected.
使用CONNECT BY中的条件,empno!=7839;来过滤7839 KING,发现并没有将此节点及所有子节点过滤。–可能是都过滤了语句就没意义了。
SCOTT@bys1>select level,empno,ename,job,mgr  from emp start with mgr is null connect by prior empno=mgr and empno!=7839;

LEVEL      EMPNO ENAME      JOB              MGR
———- ———- ———- ——— ———-
1       7839 KING       PRESIDENT
2       7566 JONES      MANAGER         7839
3       7788 SCOTT      ANALYST         7566
4       7876 ADAMS      CLERK           7788
3       7902 FORD       ANALYST         7566
4       7369 SMITH      CLERK           7902
2       7698 BLAKE      MANAGER         7839
3       7499 ALLEN      SALESMAN        7698
3       7521 WARD       SALESMAN        7698
3       7654 MARTIN     SALESMAN        7698
3       7844 TURNER     SALESMAN        7698
3       7900 JAMES      CLERK           7698
2       7782 CLARK      MANAGER         7839
3       7934 MILLER     CLERK           7782
14 rows selected.

三、关于层次查询的执行计划和性能探讨

有的文档中说到层次查询会多次访问表来执行递归查询。通过执行下面两条SQL语句及执行计划来看,执行计划并没有多次访问。—是语句不够复杂?

在CONNECT BY中加入过滤条件,从执行计划可以看到执行一次全表扫描,然后用CONNECT BY中过滤条件进行过滤。

BYS@bys1>select level,empno,ename,job,mgr  from scott.emp start with mgr is null connect by prior empno=mgr and empno!=7839;
LEVEL      EMPNO ENAME      JOB              MGR
———- ———- ———- ——— ———-
1       7839 KING       PRESIDENT
2       7566 JONES      MANAGER         7839
3       7788 SCOTT      ANALYST         7566
4       7876 ADAMS      CLERK           7788
3       7902 FORD       ANALYST         7566
4       7369 SMITH      CLERK           7902
2       7698 BLAKE      MANAGER         7839
3       7499 ALLEN      SALESMAN        7698
3       7521 WARD       SALESMAN        7698
3       7654 MARTIN     SALESMAN        7698
3       7844 TURNER     SALESMAN        7698
3       7900 JAMES      CLERK           7698
2       7782 CLARK      MANAGER         7839
3       7934 MILLER     CLERK           7782
14 rows selected.
Elapsed: 00:00:00.01

Execution Plan
———————————————————-
Plan hash value: 763482334
————————————————————————————————
| Id  | Operation                               | Name | Rows  | Bytes | Cost (%CPU)| Time     |
————————————————————————————————
|   0 | SELECT STATEMENT                        |      |    14 |   546 |     4  (25)| 00:00:01 |
|*  1 |  CONNECT BY NO FILTERING WITH START-WITH|      |       |       |            |          |
|   2 |   TABLE ACCESS FULL                     | EMP  |    14 |   308 |     3   (0)| 00:00:01 |
————————————————————————————————
Predicate Information (identified by operation id):
—————————————————
1 – access(“MGR”=PRIOR “EMPNO”)
filter(“EMPNO”<>7839 AND “MGR” IS NULL)
Statistics
———————————————————-
0  recursive calls
0  db block gets
7  consistent gets
0  physical reads
0  redo size
1032  bytes sent via SQL*Net to client
419  bytes received via SQL*Net from client
2  SQL*Net roundtrips to/from client
2  sorts (memory)
0  sorts (disk)
14  rows processed

使用WHERE来过滤指定节点的执行计划,同使用仅CONNECT BY过滤类似。

从执行计划可以看到执行一次全表扫描,然后用CONNECT BY中过滤条件进行过滤,再用WHERE中条件过滤。
BYS@bys1>select level,empno,ename,job,mgr  from scott.emp where empno!=7839 start with mgr is null connect by prior empno=mgr;

LEVEL      EMPNO ENAME      JOB              MGR
———- ———- ———- ——— ———-
2       7566 JONES      MANAGER         7839
3       7788 SCOTT      ANALYST         7566
4       7876 ADAMS      CLERK           7788
3       7902 FORD       ANALYST         7566
4       7369 SMITH      CLERK           7902
2       7698 BLAKE      MANAGER         7839
3       7499 ALLEN      SALESMAN        7698
3       7521 WARD       SALESMAN        7698
3       7654 MARTIN     SALESMAN        7698
3       7844 TURNER     SALESMAN        7698
3       7900 JAMES      CLERK           7698
2       7782 CLARK      MANAGER         7839
3       7934 MILLER     CLERK           7782

13 rows selected.
Elapsed: 00:00:00.01
Execution Plan
———————————————————-
Plan hash value: 3008947215
————————————————————————————————-
| Id  | Operation                                | Name | Rows  | Bytes | Cost (%CPU)| Time     |
————————————————————————————————-
|   0 | SELECT STATEMENT                         |      |    14 |   546 |     4  (25)| 00:00:01 |
|*  1 |  FILTER                                  |      |       |       |            |          |
|*  2 |   CONNECT BY NO FILTERING WITH START-WITH|      |       |       |            |          |
|   3 |    TABLE ACCESS FULL                     | EMP  |    14 |   308 |     3   (0)| 00:00:01 |
————————————————————————————————-
Predicate Information (identified by operation id):
—————————————————
1 – filter(“EMPNO”<>7839)
2 – access(“MGR”=PRIOR “EMPNO”)
filter(“MGR” IS NULL)
Statistics
———————————————————-
1  recursive calls
0  db block gets
7  consistent gets
0  physical reads
0  redo size
1004  bytes sent via SQL*Net to client
419  bytes received via SQL*Net from client
2  SQL*Net roundtrips to/from client
2  sorts (memory)
0  sorts (disk)
13  rows processed

标签