SPL 簡化 SQL 案例詳解：組內運算技术頭條網

SPL 簡化 SQL 案例詳解：組內運算

在開發數據庫應用時，經常在分組後需要對組內數據進行計算，例如：列出近3年每年都發表過論文的學生名單（按論文發表年分組後列出每年都出現的學生清單），統計全部參加了歷次培訓的員工（按培訓分組後統計每次都有的員工人數），選出每位客戶的高爾夫成績最高的三天（按客戶分組後按天計算成績的Top3）等等。

對於SQL來說，完成這類運算一般較為複雜，需要嵌套多層，往往導致代碼難以理解和維護困難。而SPL非常擅長這類組內計算，並且很容易和JAVA、報表工具集成。下面用一個例子來進行說明。

表sales存儲著多年的訂單數據，部分數據如下：

要求是請根據該表統計出指定年份（例如2015）中，每個月銷售金額均排在前20名的客戶名稱。

解決這個問題的思路是，首先選出2015年銷售數據，按月分組統計，然後循環選出每月銷售前20名的客戶，最後求各組的交集。

這樣的計算在SQL很難直接表達，而SPL則可以很自然地逐步計算，將複雜問題拆分後得出最終結果。

SPL代碼：

A1：從數據庫中讀出銷售表；

A2：=A1.select(year(ORDERDATE)==YEAR)，從銷售數據中取出指定年份的數據。通過網格參數YEAR靈活適應不同的查詢需求，此例中YEAR=2015。當然，這裡的過濾也可以直接通過A1中的SQL來完成。

A3：=A2.group(month(ORDERDATE))，使用group函數，將2015年的數據按照月份分組。這裡需要特別說明的是，SPL的數據分組，是真實的分組，會根據需要將數據實際分為多個組。這和SQL中的情況不同，SQL中的group by命令是直接計算分組的彙總值，並不能保留中間的分組結果。因此也就無法對分組的數據進一步計算了。分組後，A3中的數據如下：