从 TPCH 测试学习性能优化技巧之 Q10

一、 查询要求

Q10语句是查询每个国家在某时刻起的三个月内货运存在问题的客户和造成的损失。

Q10语句的特点是:带有分组、排序、聚集操作并存的多表连接查询操作。查询语句没有从语法上限制返回多少条元组,但是TPC-H标准规定,查询结果只返回前10行(通常依赖于应用程序实现)。

二、 Oracle执行

Oracle编写的查询SQL语句如下:

select * from (

select /*+ parallel(n) */

c_custkey,c_name,

sum(l_extendedprice * (1 - l_discount)) as revenue,

c_acctbal,n_name,c_address,c_phone,c_comment

from

customer,orders,lineitem,nation

where

c_custkey = o_custkey

and l_orderkey = o_orderkey

and o_orderdate >= date '1993-05-01'

and o_orderdate < date '1993-05-01' + interval '3' month

and l_returnflag = 'R'

and c_nationkey = n_nationkey

group by

c_custkey,

c_name,

c_acctbal,

c_phone,

n_name,

c_address,

c_comment

order by

revenue desc

) where rownum <=10;

其中/*+ parallel(n) */ 是Oracle的并行查询语法,n是并行数。

脚本执行时间,单位:秒

从 TPCH 测试学习性能优化技巧之 Q10

三、 SPL优化

这里的orders与lineitem主子表关联优化原理与Q3中类似。

SPL脚本如下:

从 TPCH 测试学习性能优化技巧之 Q10

先把orders和lineitem表的连接结果集上的分组汇总运算做完,然后再基于这个结果集继续做外部相关的外键表关联运算。因为最终结果只要取10条记录,可以只针对这10条记录再做剩下的关联计算,所以不必在分组前做,否则计算量会增大。

A8中也可以使用top函数取出前10名,比sort全排序会更快,不过此时数据量已经不大,差别不太明显了。

A8算出来之后,因为customer表对C_CUSTKEY有序,用A8.cursor().joinx@q从customer表中有序匹配快速地把相关记录取出来,再去做其它join,无须遍历customer表,减少数据读取量。

脚本执行时间,单位:秒

从 TPCH 测试学习性能优化技巧之 Q10


分享到:


相關文章: