機器學(xué)習(xí)技術(shù)正在走進(jìn)數(shù)據(jù)中心,它既能改善內(nèi)部IT管理,還能使關(guān)鍵業(yè)務(wù)流程更加智能化。你可能已經(jīng)聽說過深度學(xué)習(xí)的神秘性了,它涉及到一切領(lǐng)域,從系統(tǒng)管理到自動駕駛汽車。到底深度學(xué)習(xí)是一個剛剛在世人面前揭開面紗的非常聰明的新興人工智能,還是僅僅一種營銷宣傳手段,將已有的復(fù)雜機器學(xué)習(xí)算法重新包裝成為新的賣點?
深度學(xué)習(xí)無疑激發(fā)了大眾的想象力,但它其實并不那么復(fù)雜。在技術(shù)層面上,深度學(xué)習(xí)主要指大規(guī)模運行的大型計算密集型神經(jīng)網(wǎng)絡(luò)。這些神經(jīng)網(wǎng)絡(luò)往往是由難以用基于邏輯和規(guī)則的機器學(xué)習(xí)方法進(jìn)行處理的大數(shù)據(jù)集訓(xùn)練而成,如圖像、語音、視頻和其他內(nèi)在具有復(fù)雜模式的密集數(shù)據(jù)。
神經(jīng)網(wǎng)絡(luò)本身并不新。幾乎從現(xiàn)代計算機開創(chuàng)階段起,神經(jīng)網(wǎng)絡(luò)算法已經(jīng)被研究用于復(fù)雜數(shù)據(jù)流中輔助識別隱藏的內(nèi)在模式。在這個意義上,深度學(xué)習(xí)是建立在眾所周知的機器學(xué)習(xí)技術(shù)上的。然而,當(dāng)新興計算復(fù)雜度更高的神經(jīng)網(wǎng)絡(luò)算法與如今的大數(shù)據(jù)集合應(yīng)用到一起,創(chuàng)造出了重大的新機遇。使用低成本的云服務(wù)或商業(yè)scale-out大數(shù)據(jù)結(jié)構(gòu),可以創(chuàng)建這些“深度”模型,并實時應(yīng)用于大規(guī)模應(yīng)用場景中。
敏感的神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)研究起步于上世紀(jì)50年代和60年代,最早是為研究人類大腦如何工作而建模出來的。神經(jīng)網(wǎng)絡(luò)由多層節(jié)點組成,這些節(jié)點相互連接組成一張大網(wǎng),有如大腦中的神經(jīng)元。每個節(jié)點接收輸入信號,接下來,它通過一個預(yù)先定義好的“激活功能”發(fā)出一個輸出信號,并傳給其他節(jié)點,同時確定什么時候節(jié)點應(yīng)該進(jìn)入活躍狀態(tài)。簡單的,你可以認(rèn)為節(jié)點如何工作取決于其興奮程度,當(dāng)一個節(jié)點收到一組輸入后變得興奮時,它可以產(chǎn)生一定程度的輸出信號,并傳遞給它的下游節(jié)點。有趣的是,一個節(jié)點興奮起來后,它的輸出信號可以是正也可以是負(fù);一些節(jié)點激活后實際上會抑制另一些節(jié)點的興奮。節(jié)點通過鏈接互連,每個鏈接有其自己的權(quán)重變量。一個鏈接的權(quán)重會調(diào)整經(jīng)過它傳輸?shù)男盘枴I窠?jīng)網(wǎng)絡(luò)通過逐漸調(diào)整其整個網(wǎng)絡(luò)的鏈接權(quán)重,適應(yīng)和學(xué)習(xí)如何識別模式,最終只有被正確識別的模式會產(chǎn)生一個完整的遍布全網(wǎng)絡(luò)的興奮傳遞。
一般情況下,輸入數(shù)據(jù)被格式化為一個輸入信號,鏈接到第一層外部節(jié)點。這些節(jié)點隨后向一個或多個隱藏層發(fā)送信號,最后輸出層節(jié)點發(fā)出一個“反饋”給外部世界。由于學(xué)習(xí)(也即智能)是隱含在鏈路權(quán)重中的,實際應(yīng)用的核心問題是搞清楚怎么調(diào)節(jié)或訓(xùn)練所有的鏈路權(quán)重以實現(xiàn)正確模式的應(yīng)答。今天,神經(jīng)網(wǎng)絡(luò)主要通過后向傳播的增量學(xué)習(xí)技術(shù),用在訓(xùn)練數(shù)據(jù)中尋找正確的模式來完成學(xué)習(xí)過程。當(dāng)神經(jīng)網(wǎng)絡(luò)生成一種有用的方式識別出正確的樣本時,該方法相應(yīng)的給予鏈路“獎勵”,當(dāng)神經(jīng)網(wǎng)絡(luò)識別出錯誤的樣本時,則給予懲罰。
然而,不可能存在一個能夠適用于任何給定問題的神經(jīng)網(wǎng)絡(luò)架構(gòu)。此時機器學(xué)習(xí)專業(yè)知識就是非常重要的了,因為給定一定數(shù)量的節(jié)點、其激勵功能、一定數(shù)量的隱藏層以及所有節(jié)點的連接關(guān)系(例如是密集連接還是稀疏連接,是否存在內(nèi)部反饋或循環(huán)環(huán)路),可能存在無數(shù)種潛在的神經(jīng)網(wǎng)絡(luò)配置方式。傳統(tǒng)研究中,受限于硬件條件,神經(jīng)網(wǎng)絡(luò)隱藏層的數(shù)量設(shè)置得很少,即使如此,神經(jīng)網(wǎng)絡(luò)已經(jīng)展現(xiàn)出超過人類的,驚人的和熟練的學(xué)習(xí)能力。如今,深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)可能具有數(shù)百層網(wǎng)絡(luò),能夠完全勝任深度奧妙問題的處理。
深度學(xué)習(xí)實際應(yīng)用的關(guān)鍵是搞清楚如何在成百上千個并行計算核心上有效地拓展出大型神經(jīng)網(wǎng)絡(luò),然后用巨量大數(shù)據(jù)集進(jìn)行高效的訓(xùn)練。過去,這需要遠(yuǎn)超企業(yè)數(shù)據(jù)中心規(guī)模的高性能計算設(shè)備HPC來實現(xiàn)。今天,NVIDIA、Mellanox和DataDirectNetworks公司正在推出適合一般企業(yè)數(shù)據(jù)中心規(guī)模的HPC產(chǎn)品。例如NVIDIA的DGX-1,本質(zhì)上它是一臺設(shè)計用于深度學(xué)習(xí),集成了8塊高端GPU運算卡的超融合超級計算機,令人驚訝的是,它只有4U這么大,顯然可以被一般公司所接受。
谷歌的AlphaGo大時代
云計算供應(yīng)商如谷歌,也提供托管的機器學(xué)習(xí)工具。例如,谷歌的AlphaGo圍棋游戲程序最近在最高級別的比賽中戰(zhàn)勝了世界級的圍棋冠軍。圍棋被認(rèn)為是機器無法匹敵人類智慧的最后前沿領(lǐng)域之一,因為圍棋無法用簡單的暴力計算的方式在有限時間內(nèi)求解(完整地在19x19圍棋棋盤上計算最佳落子,需要的計算能力超過了現(xiàn)存最強的計算機能力)。然而,你可以認(rèn)為AlphaGo團隊采取了一個捷徑,通過訓(xùn)練深度學(xué)習(xí)程序,使它下圍棋時能下出任何人類選手曾經(jīng)下過的最好的落子。而且,這個程序能夠通過和自己下圍棋來變得更強。
在其外表之下,AlphaGo主要由2個大型神經(jīng)網(wǎng)絡(luò)鏈接在一起組成(通過一些蒙特卡羅仿真,將“太多可選落子位置需要計算”的大集合縮減到一個可能是較佳落子位置組成的小集合)。第一個神經(jīng)網(wǎng)絡(luò)用百萬局過去的棋譜進(jìn)行訓(xùn)練,因此它能夠確定哪些位置最可能是勝利者一方會下的位置。第二個神經(jīng)網(wǎng)絡(luò)被訓(xùn)練用于估計每一個新位置的價值,原理上講,即給予那些在棋譜終盤時贏者占據(jù)的位置更高的估值。這兩個神經(jīng)網(wǎng)絡(luò)聯(lián)合在一起遞歸使用,通過預(yù)測接下來有限步數(shù)的雙方落子和盤局來選擇當(dāng)前最佳的落子位置。這里的本質(zhì)是,深度學(xué)習(xí)方法通過跟最好的棋手的棋譜學(xué)習(xí),現(xiàn)在已能夠不依賴于暴力計算實時擊敗最好的棋手了。
深度學(xué)習(xí)在企業(yè)IT中如何應(yīng)用呢?
深度學(xué)習(xí)程序甚至?xí)顾脑O(shè)計者和訓(xùn)練者感到吃驚,通過從歷史數(shù)據(jù)中學(xué)習(xí)復(fù)雜的模式,它能夠在超出期望或看上去無關(guān)的場景中工作得很好。但是從根本上說,深度學(xué)習(xí)程序不能真正預(yù)測出一個從未被訓(xùn)練過的模式——它只能從已經(jīng)遇到過的場景中進(jìn)行學(xué)習(xí)。而且,深度學(xué)習(xí)程序不能用邏輯術(shù)語或規(guī)則來說明它所學(xué)到的東西,因此無法簡單地抽象出它的學(xué)習(xí)結(jié)果。
對任何機器學(xué)習(xí)技術(shù),總是要在變得太特殊(例如,需要太精確地記錄歷史數(shù)據(jù),如同查找表一樣過于死板)和保持太一般化(例如,不管輸入是什么,簡單地給出單一最可能的值)中進(jìn)行平衡,以避免無效計算。數(shù)據(jù)學(xué)家的工作就是努力為特定問題找到最佳平衡方式。
在我們擁有大量訓(xùn)練數(shù)據(jù)可用的任何場景下,深度學(xué)習(xí)將毫無置疑是非常有用的。每天,在IT部門,我們產(chǎn)生越來越多的機器數(shù)據(jù)可用于開發(fā)有用的人工智能。例如,在安全應(yīng)用中,神經(jīng)網(wǎng)絡(luò)能夠?qū)W會鑒別可能的入侵或黑客行為的深度模式。神經(jīng)網(wǎng)絡(luò)甚至可以用時間序列數(shù)據(jù)訓(xùn)練,學(xué)習(xí)識別在工作量和資源這兩個關(guān)鍵因素影響下的動態(tài)正常(異常)行為。谷歌很有可能正在研究如何利用AlphaGo類似的人工智能能力,幫助其管理云基礎(chǔ)設(shè)施,避免損耗和最優(yōu)化資源分配。
如果你想要了解更多有關(guān)神經(jīng)網(wǎng)絡(luò)的知識,我建議你花幾分鐘嘗試一些相關(guān)的互動實例。我們都應(yīng)該為有朝一日能夠?qū)⒆约旱拇竽X直接連入數(shù)據(jù)中心網(wǎng)絡(luò)做好準(zhǔn)備。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.guhuozai8.cn/
本文標(biāo)題:深入研究神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)
本文網(wǎng)址:http://www.guhuozai8.cn/html/news/10515319509.html