中科雲達集群管理解決方案

讓機器實現人的智能,一直是人工智能學者不斷追求的目標,不同學科背景或應用領域的學者,從不同角度,用不同的方法,沿著不同的途徑對智能進行了探索。其中,符號主義、連接主義和行為主義是人工智能發展歷史上的三大技術流派。


人工智能是一種引發諸多領域產生顛覆性變革的前沿技術, 當今的人工智能技術以 機器學習, 特別是深度學習為核心, 在視覺、 語音、 自然語言等應用領域迅速發展, 已 經開始像水電煤一樣賦能於各個行業。世界各國高度重視人工智能發展, 美國白宮接連 發佈數個人工智能政府報告, 是第一個將人工智能發展上升到國家戰略層面的國家, 除此以外, 英國、 歐盟、 日本等紛紛發佈人工智能相關戰略、 行動計劃, 著力構築人工智 能先發優勢。


中科雲達集群管理解決方案

可以看到, 政府部門、 學術界、 工業界等都在積極投入到人工智能高速發展的浪潮中, 人工智能發展形式一片大好。與此同時, 也出現了兩種不同的需求 :

1)針對GPU資源緊缺的團隊希望有個強大的管理平臺系統,對GPU資源進行統一管理,從而提高GPU資源利用率;

2)針對超大數據分佈式訓練問題,使用多GPU進行數據並行訓練是解決大數據量快速訓練問題的首選方案。


中科雲達集群管理解決方案

集群硬件架構


人工智能大數據平臺是中科雲達推出的針對機器學習與深度學習訓練的集群計算平臺,對 GPU 高性能計算資源進行統一的管理和調度,有效滿足用戶在深度學習科研方面的需求,用戶可以快速的在平臺上進行數據處理、算法設計、模型訓練、模型驗證等科研工作,而不用關心底層複雜的集群構建與調度機制以及深度學習框架的安裝部署、性能調優等問題,在充分簡化深度學習訓練方面工作的同時有效提高資源利用率。


中科雲達集群管理解決方案

系統採用輕量級Docker容器技術和Kuberates容器管理方案,實現對CPU、GPU、內存、磁盤等資源的統一管理。針對人工智能領域的特定需求,提供GPU等異構計算資源管理接口,實現對GPU等異構計算資源的虛擬化統一管理。

SCM將多個物理主機虛擬成一個資源池

集群管理功能主要有以下功能:

Ø 新建集群:

用戶可以根據需求從資源池中獲取GPU、CPU、內存等資源創建一個集群。

Ø 查看集群狀態:

用戶可以查看集群的內存使用率、CPU使用率、GPU使用率和運行在本集群下的作業等信息。

Ø 刪除集群:

用戶可以刪除集群,將資源歸還到資源池。


中科雲達(北京)科技有限公司成立於2016年,公司位於北京市國際信息產業基地。公司一直致力於為廣大用戶提供GPU高性能計算、深度學習、虛擬化仿真、定製化服務器、工作站、存儲等軟硬件整體解決方案,並與多家知名技術型領先廠商如超微(Supermicro)、英特爾(Intel)、華碩(ASUS)、英偉達(NVIDIA)等建立了長期的合作關係。公司一貫本著“精誠、精細、精品”的服務宗旨,以及快速完善的售前售後服務體系,得到了教育、科研、政府、軍工、互聯網、設計製造等諸多行業用戶的一致好評。公司以客戶需求為最終導向,從技術分析到產品測試,生產,質檢等各個環節,切實做好每一步的品質管控,爭取為客戶提供最貼切實際應用的定製化整體解決方案。


分享到:


相關文章: