對外經濟貿易大學教授曹淑豔:數據科學與大數據技術專業探討

編者按:本文作者在高校大數據教育教學領域擁有相對成熟的教學經驗、獨到的教育觀點及創新的教學方法。作為

全國高校人工智能與大數據創新聯盟常務理事,積極推進大數據教育教學工作,本文內容根據作者在前期"賦能大數據教育專題"分享的內容整理而成,旨在為2020年高校數據科學與大數據技術專業、大數據管理與應用專業、大數據技術與應用專業賦能。

對外經濟貿易大學教授曹淑豔:數據科學與大數據技術專業探討

對外經濟貿易大學教授 曹淑豔

一、大數據專業的認識

(一)大數據專業設置的理由和基礎探討主要是四個方面:

第一,國家的重視。我國十分重視大數據產業的戰略意義、大數據資源對社會發展的作用,具體表現為國務院於2015年出臺了《促進大數據發展行動的綱要》,並將實施國家大數據戰略、推進數據資源開發共享納入"十三五"期間規劃建設的重要目標。從目前來看,國內的大數據產業發展已基本具備一定規模,正有待於形成產業界的共識。從國外情況來看,尤其是美國市場,麥肯錫在報告中預測,在2018年美國大數據人才和高級數據分析專家缺口達到19萬,美國企業還需要150萬提出正確問題、運用大數據分析結果的相關管理人才。同時,85%的500強企業已經或正在籌劃推出大數據項目,未來幾年這些企業在大數據的投資將上漲36%。同時,大數據產業的發展也需要大數據人才的支撐。

第二,大數據相關專業的發展情況。

國內2015年申報新專業,2016年3月教育部批准三所高校設立本科專業,2016年又有38所高校申報在目錄外本科專業,其中既有985、211,以及地方院校,自從2016年3月開始首批設立專業後,全國上下的高校均開始重視起來。可以看出,大數據相關專業發展情況近幾年在國內的勢頭較為迅猛。

第三,高校陸續進行了開設大數據專業的基礎工作。如高校大數據聯盟開辦的相關會議,高校也加強了師資團隊的培訓與建設,探討實踐教學的建設,組建了大數據專業建設小組,與大數據產業協會的聯繫日益緊密,參與了大數據人才培養論壇,探討複合型人才就業前景,等等。這些工作都是目前全國高校在開展的。

第四,學科逐漸交叉。目前很多學科在進行學科建設時也在向大數據方向發展,如數學、統計、信息管理、管理科學與工程等都在向大數據專業靠攏。因此,高校在進行申報時將大數據歸到信息科學與技術學科下,其實它是一門交叉學科,應該是一個融合,用來解決問題時是明確的,要通過數據分析和挖掘來獲得價值。目前看來,就像2000年初設立電子商務專業相似,如今電子商務已成為管理學門類獨立的學科,但有時也無法進行準確歸類。

(二)大數據專業和相近專業的區分和聯繫

主要是與計算機科學技術、統計學、信息管理、數學四個學科之間的聯繫與區別。

與計算機專業的區別和聯繫:如果是一名經驗豐富的軟件工程師,轉型到數據科學領域是很方便的,因為大量的大數據工作都涉及到軟件工程方面的知識,不僅包括設計健全的系統,也包括簡單的軟件。擁有這種計算機專業的學術背景,可能會快速完成實驗任務。因此,大數據科學應用專業的技術支撐主要來源於計算機科學,這是第一點;第二,大數據專業具有前所未有的複合型特徵;第三,以大數據為核心的研究對象強調學生對專業領域數據的理解能力,體現了技術為數據服務的思想,是複合型人才。二者既有聯繫又有區別,聯繫是計算機技術支撐著大數據專業。

與統計學專業的區別:統計學建模使用的數據是結構化數據,大數據的來源是多元、異構的,因此,其中會有一些區別。大數據重視非結構化、半結構化數據的處理,如今大數據強調處理技術平臺、獲取存儲、處理和展示各個環節與計算機深度融合,統計學的方法時大數據環節進行數據分析環節必不可少的,聯繫很緊密,區別也是很清晰的。

與信息管理專業的區別:主要體現在看待數據和信息的角度。信息管理主要強調在理解數據和業務流程的基礎上,通過科學的分析和設計方法來實現管理信息系統,強調利用計算機技術藉助改造升級原有的業務系統,如學校中的人事管理系統、學生管理系統等,而大數據相關理論和技術管理系統側重對數據本身的洞察和理解,相對而言獨立於原有的業務系統,更專注於海量、複雜、多元數據的深度分析處理能力,更依賴於大數據處理平臺和技術,更好地支撐了物聯網、移動互聯網平臺的發展。

與數學的關係:數學知識是為數據科學的數據分析所有研究領域打下堅實基礎的學科,因此是做基礎支撐。大數據是在其基礎上做應用分析。

二、課程體系

新設專業探索前行。這是一個新的專業,有關人才培養方案與課程體系難以成熟,難以有完整的課程體系,需要不斷去探索。如現階段的信息管理專業是在1978年設立的,電子商務專業是2000年初確定的,都是需要一個長時間的探索過程的。我們可以圍繞大數據產業的核心要素,根據各個學校特色進行大數據課程核心體系設計,設計過程中將統計學的一些定量模型和方法納入考慮範圍。

從大數據產業的核心要素進行分析。以往在申報專業之初是依據數據價值的提升路徑來進行課程體系的初步設計,如從數據的獲取、存儲、清洗、形成結構化數據、利用統計學方法進行統計分析、其結果通過利用可視化技術進行展示,進而支持行業應用,這是原來的方法。孫鑫(見圖1)則是從四個方面對大數據產業的核心要素進行劃分,是值得借鑑的。其中,核心要素分為四個層次,數據價值的提升路徑及IT領域的產品佈局來進行佈局設立的。四個層次分別為:數據資源層、基礎能力層、分析展示層及應用層。數據資源的功能主要是負責原始數據的供給與交換,是數據資產作為生產要素的直接表現,根據數據來源不同可以細分為數據資源提供者和數據交易平臺兩種角色。數據基礎能力部分是負責與數據生產加工相關的基礎設施與技術要素的供應,為數據加工和價值提升提供生產工具,包括數據存儲、數據處理和數據庫等多個角色。數據分析和展示部分是負責數據隱含價值的挖掘、數據關聯分析與可視化展現,這是智力要素在數據價值中的集中體現,包括傳統意義上的人工智能BI、可視化和通用數據分析工具、面向非結構化數據提供的語音圖像等媒體識別服務。而數據應用部分是根據數據分析和加工的結果面向電商、金融、交通等細分行業提供精準營銷、信用評估、初期引導等企業或公眾的服務。

對外經濟貿易大學教授曹淑豔:數據科學與大數據技術專業探討

圖1-大數據產業核心要素

圍繞大數據產業核心要素的四個層次,可以看出在數據資源層和基礎能力層主要還是與傳統計算機科學與技術專業的核心課程設置相關聯的。在數據資源提供和數據交易平臺還涉及到信息資源管理、外部技術、軟件體系結構等。在數據基礎能力層主要提供的是數據存儲、數據處理和數據庫,這些主要體現在計算機軟件技術,如各種程序設計語言,體現在大數據上的是R語言、程序設計、數據結構等等。在數據分析和展示時,體現在人工智能、統計學應用、數據挖掘、機器學習、可視化和通用數據分析、可視化和媒體識別服務等。主要的課程涉及到分佈式系統原理、人工智能基礎、應用統計、多元統計分析、機器學習與數據挖掘、數據可視化、雲計算以及相關的大數據分析。在數據應用層建議結合高校的特色來進行設計,以對外經濟貿易大學為例,將數據應用與專業特色、學校背景相結合,申報時分為以下三個方向:貿易金融大數據、網絡營銷大數據、電子商務大數據。如果想做貿易金融大數據,需在學生課程中包括國際貿易背景、財務會計概論、供應鏈管理、風險管理學;要想做網絡營銷大數據,要有計算廣告學、搜索引擎優化、網絡營銷等課程背景;要做電子商務大數據,可能圍繞電子商務概論、電子商務應用基礎、電子商務系統分析與設計、個性化推薦理論和實踐來進行課程體系設計。從大數據產業的四個核心層次來看,進行課程體系梳理時可以看出,數據資源與數據基礎能力依託於傳統的計算機技術多一些,在數據分析和展示層是在統計學支撐下與IT相結合有所創新,在數據應用層體現為各個學校的辦學特色,在應用層方面依靠高校的專業背景來進行相應的課程設計。

進行課程體系設計的目的主要是為了人才培養、沿著什麼領域繼續,學生未來的就業應該是沿著大數據分析師的職業方向走,接著可能會是大數據分析行業專家,這是業務層;技術層是向大數據架構師;管理層是大數據分析總監,再向前走是首席數據官。推薦的就業領域是以下三個方向:貿易金融方向的大數據分析師可以在供應鏈融資公司、P2P信貸徵信平臺、商業銀行等找到自己的位置;網絡營銷方向的大數據分析師可以互聯網廣告、O2O營銷公司、大型網絡媒體企業就職;電子商務方向的大數據分析師應沿循電子商務公司、第三方支付公司、電子商務流公司來做。因此,專業的課程體系設計應與學生的就業領域和職業生涯發展相匹配,於是可能會梳理出一些核心課程,如多元統計分析、統計分析軟件與應用、統計學習理論與基礎、人工智能、商務智能、數據科學導論、數據挖掘、數據可視化、模式識別、雲計算學習中心、大數據分析等等,都應作為課程體系中的核心課程。

三、實踐性教學環節與主要實驗

大數據這一學科實踐性很強,學科交叉線也很強。這裡將實踐性教學環節按實驗性質分為三個層面:

第一是技術基礎類的實驗。包含數據庫、程序設計、雲計算平臺的建設與開發等等。

第二是數據分析及展示類的實驗。包括機器學習、大數據分析與處理、大數據可視化。

第三是綜合應用類實驗。學生學到最後時,應有一門綜合性的課程,如像對外經濟貿易大學這樣的財經背景學校應該設有""金融大數據綜合實驗"、"營銷大數據綜合實驗"或"物流大數據綜合實驗"等課程,這種綜合類應用實驗建議與相關的大數據公司建立產學合作關係,進行人才聯合培養。另外,大數據聯盟平臺也提供了一些機會。

的確,大數據專業是很新的。沒有十分完善的專業課程體系,只能在探索中前進。建設新專業任重而道遠,最後的實踐可能還會遇到問題,需要不斷進行修正。但最後的目標是一致的,即如何將大數據這一新專業建立起來,為企業、市場提供人才。

曹淑豔:

對外經濟貿易大學信息學院教授、信息化處副處長。從事計算機教學及信息系統開發研究工作三十餘年,本科專業是計算機軟件,獲管理學碩士學位,金融學博士。參與了教育部高校文科計算機基礎教學指導委員會《大學計算機教學基本要求》的編寫工作,全國高校人工智能與大數據創新聯盟常務理事,教育部大學計算機基礎教學指導委員會文科分指導委員會副主任委員,全國高校計算機基礎教育研究會文科專業委員會副主任委員,全國高校計算機基礎教育研究會財經專業委員會課程建設委員會副主任委員。


分享到:


相關文章: