北京2018年2月22日電 /美通社/ -- 近年來,以深度學習為代表的人工智能產業熱潮開始席卷全球。為了緊跟行業發展趨勢、推動人工智能科研與技術創新,中國石油大學(華東)啟動了深度學習平臺的建設,并使用浪潮深度學習管理平臺 AI Station 來搭建管理系統,在實現深度學習環境快速部署的同時,提高了對深度學習訓練任務的管理能力,從而為深度學習技術創新搭建了一個優秀的平臺。
拓展深度學習,滿足計算力需求是燃眉之急
中國石油大學(華東)直屬教育部,是國家“211工程”和“985工程優勢學科創新平臺”高校,2017年被確定為國家“雙一流”建設高校。其中,計算機與通信學院(簡稱:計通學院)依托于學校雄厚的資源和實力,在計算機領域擁有不俗實力,學院也一直在進行深度學習的相關研究和人才培養。在人工智能產業爆發的背景下,學院緊跟行業發展方向,決定建設深度學習平臺,方便學院研究人員和學生使用,加速學院在深度學習領域的研究。
業界普遍認為,深度學習能夠發展迅速的三個要素包括強大的計算力、高效的算法以及足夠大量的訓練數據,其中,計算力的局限在深度學習的發展過程中體現得尤為明顯:深度學習的核心是矩陣預算,也就是浮點運算。深度神經網絡由于層數多、結構復雜、節點數多、訓練數據集大等特點,訓練過程所需的時間特別長,通常以數日、數周、甚至數月來計算,這對計算能力提出了極為苛刻的要求。
對于中國石油大學(華東)計通學院來說,其擁有雄厚的人才儲備和技術研發能力,在深度學習相關算法及模型以及訓練數據方面擁有巨大的優勢,因此滿足計算力的需求就成了學院在搭建深度學習平臺過程中首要解決的問題。另一方面,學院作為研究與教學機構,并不希望投入過多的人力物力在深度學習環境的搭建上,而是更希望將精力用于深度學習算法和模型的研究與構建上,因此學院希望部署一套功能強大、方便易用的深度學習管理系統,來管理深度學習平臺的資源以及訓練任務。
開啟智慧教育新模式,浪潮提供AI端到端解決方案
針對中國石油大學(華東)的需求,浪潮提供了面向人工智能的端到端解決方案。為提升平臺的計算能力,浪潮在硬件選擇上為學校推薦了全新應用優化的旗艦2U雙路機架產品NF5280M4,搭配2塊當時最新架構的GPU卡 NVIDIA Tesla P100,每塊卡能夠提供高達9.3萬億次的單精度計算能力。同時配置256G超大內存和高速SAS硬盤,用戶做深度學習訓練的GB級超大數據集可以全部直接加載到內存中,避免了數據集IO瓶頸,為用戶帶來極致性能。
在至關重要的深度學習管理系統部署方面,浪潮采用了最新的深度學習管理平臺 AI Station 來構建整個深度學習平臺。 AI Station 是一個深度學習集群和訓練任務管理軟件,可以快速部署深度學習環境,管理深度學習訓練任務,為深度學習提供高效便利的運行環境。
軟件采用全容器化運行,應用與用戶之間相互隔離;通過 AI Station 的模板創建容器,可以一鍵生成包含運行環境的容器,省去了用戶自行部署深度學習環境的繁瑣。AI Station 還支持GPU動態調度、按需分配,較大化GPU的利用率,讓用戶完成更多的計算任務。中國石油大學(華東)通過 AI Station 可以管理可視化的訓練任務、管理訓練進程,及時偵測到模型訓練問題,加速訓練過程。
在浪潮 AI Station 的幫助下,中國石油大學(華東)極大地降低了深度學習平臺的搭建時間,使得學校的師生能夠在深度學習技術日新月異的背景下,快速追趕并引領深度學習的技術創新浪潮。AI Station還有效地提升了中國石油大學(華東)深度學習平臺的運行效率,以較低的建設成本實現了較高的運行效率,讓資源得到了充分利用。自深度學習平臺搭建以來,中國石油大學(華東)在深度學習領域取得了多項重要的科研成果,夯實了在人工智能教育與科研領域的優勢。
中國石油大學(華東)計通學院負責人表示:“浪潮 AI Station 表現讓我們印象深刻,幫助我們快速搭建了高性能、使用運維簡捷的深度學習平臺。此外,浪潮的應用研發和調優專家多次親自上門為我院調試 AI Station 及集群,實現了對我院原有設備的整合,其專業的服務和高超的專業技能讓我們非常滿意。希望此次雙方的合作不僅能夠為我院深度學習的科研提供強大助力,也對國內其他高校和科研機構深度學習平臺的建立提供借鑒。”