「實戰」助力數據庫開發之接口篇


「實戰」助力數據庫開發之接口篇 - R 連接 Greenplum

R語言是一門用於統計分析和繪圖的語言,在統計分析場景下應用較為廣泛。R語言小巧,使用方便,輕量級內存計算,並且開源。

在很多統計分析場景下,R語言都能輕鬆駕馭,但是由於其主要採用內存進行數據存儲計算的特性,性能會受限於硬件。如果底層能與 Greenplum 搭配使用,在大數據量處理場景下,會更加得力。

R語言連接 Greenplum 有多種方式:JDBC、ODBC 或 DBI,最靠譜的應屬DBI方式( 感官上有點類似 perl ),這也是支持最好、安裝最方便的方式。下面主要介紹該方式連接 Greenplum。

安裝

首先 CRAN 上提供的 DBI PostgreSQL 適配為 RPostgreSQL ( https://cran.r-project.org/web/packages/RPostgreSQL/index.html ),要使用該驅動包,我們本地R機器上必須安裝PostgreSQL的開發包,因為其底層採用的也是libpq。

如果在 CentOS 環境下,可以直接執行如下命令一鍵安裝:

<code>[parallels@centos-7 ~]$ sudo yum install postgresql-devel/<code>

然後我們從 CRAN 下載對應的 DBI PostgreSQL 驅動

<code>install.packages('RPostgreSQL')/<code>
「實戰」助力數據庫開發之接口篇 - R 連接 Greenplum

正常如果不報錯的話,如上基本算安裝完成。

R連接 Greenplum

我們採用R連接 Greenplum,使用最多的可能就是查詢數據了,下面展示一個查詢的例子,其他的用法可以從 CRAN 上的參考手冊( https://cran.r-project.org/web/packages/RPostgreSQL/ )中獲得。

查詢示例

<code>> require(RPostgreSQL)# 獲取驅動> drv  con  dbGetQuery(con, "select * from t1")  id name1  1    a2  2    b3  3    c# 釋放連接> dbDisconnect(con)# 釋放驅動資源> dbUnloadDriver(drv)/<code>

End~


分享到:


相關文章: