7月14、15日,首屆大數據應用大會在成都召開。清華大學數據科學研究院·工業大數據研究中心的常務副主任陸薇作了題為《釋放工業大數據價值》的演講。
圖1 陸薇作演講
在首屆中國大數據應用大會上,清華大學數據科學研究院·工業大數據研究中心的常務副主任陸薇所了題為《釋放工業大數據價值》的演講。(大數據文摘記者魏子敏攝)
演講原文如下:
圖2 釋放工業大數據價值
很高興有這樣一個機會和大家分享我們中心對工業大數據的理解和一些工作內容。
圖3 工業大數據研究中心介紹
首先,簡單介紹一下清華大學數據科學研究院工業大數據研究中心。清華大學數據科學研究院成立于2014年春,結合了清華在信息技術,特別是分布式系統和數據管理分析技術方面的優勢,以及工科、經濟、人文、健康等各大數據應用領域的深厚積淀,致力于發揮學科交叉的協同作用,推進大數據系統研究與應用實踐,培養人才,同時也參與貢獻大數據相關國家戰略。
圖4 各國應對第四次工業革命
眾所周知,第四次工業革命以美國的工業互聯網、德國的工業4.0為代表,根據各國制造業不同的發展優勢而各具特點。美國制造業大量外包生產環節,比如波音公司的飛機部件是在全球多個國家制造,但是美國制造企業牢牢占據高知識產權和附加值的產品設計和服務環節,同時把控整個生態鏈的上下游為其服務。因此,美國提出的工業互聯網的智能核心在云不在端,關注利用互聯網技術的資源優化配置作用提升對整個產業生態鏈的效率和價值。德國的情況則正相反,德國制造業優勢在于實體制造,有精良的生產設備和工藝手段。因此,德國提出的工業4.0重點在于智能工廠本身的建設,并以制造為核心,帶動上下游業務發展。
我國工業具有自己的特點。一方面,我國是世界工廠,實體制造比重大,同時低水平、勞動密集、高資源消耗制造的比重也大,產業升級迫在眉睫。另一方面,我國互聯網產業發展具有領先優勢。過去十多年消費互聯網的高速發展使互聯網技術得到長足發展,互聯網思維深入人心。我們需要充分發揮這一優勢,并將之和制造業緊密結合,促進制造業升級和生產性服務業的發展。
因此,我國制訂的“中國制造2025”戰略從我國實際國情和發展需求出發,兼顧智能制造和制造服務,用互聯網技術驅動制造全生命周期從設計、制造到交付、流通、服務、回收各個環節的數字化、互聯化、智能化升級,推動制造全產業鏈智能協同,優化生產要素配置和資源利用,消弭低效中間環節,從而整體提升中國制造業發展水平和世界競爭力。
圖5 第四次工業革命特點
雖然發展重點各有側重,但大數據被公認為是不可或缺的關鍵技術。
德國的《工業4.0十大挑戰與機遇》報告指出,數據的整合分析與使用是實現工業4.0的關鍵能力。工業4.0有兩大關鍵支撐技術。一個是CPS,這是智能工廠比較偏硬的部分,講究用更加智能的基礎設施來降低車間復雜度和提高靈活性。另一個是數字化企業平臺,跨生產”shopfloor”和經營“topfloor”、貫穿CAD/PLM/MES/
ERP等生產、經營信息系統的信息集成與數據融合貫通,建立伴隨產品制造過程的完整信息流,做到全數字化、數據全采集、數據通路全打通、數據流動過程不落地。同時基于對這些數據的分析,使企業可以全面深入把握和優化提升產品質量、生產效率、資源利用率。
美國通用電氣公司的《工業互聯網白皮書》中指出工業互聯網實現的三大要素是智能聯網的機器、人與機器協同工作及先進的數據分析能力。工業互聯網的核心是通過智能聯網的機器感知機器本身狀況、周邊環境以及用戶操作行為,并通過這些數據的深入分析來提供諸如資產性能優化等制造服務。
我國在今年推出“中國制造2025”“互聯網+制造”戰略的時候,也特別強調利用大數據為產業智能化提供支撐。
有一個對工業1.0到工業4.0變遷歷史的總結非常精辟,借用一下:工業1.0是“工廠+機械”,利用機械替代人力,解放了生產力;工業2.0是“工廠+電”,通過電氣化進一步提升生產效率;工業3.0是“工廠+電腦”,通過信息系統替代人工管理生產經營過程。那工業4.0是工廠+什么呢?順著這個思路,3.0完成信息化之后,工廠經營生產的方方面面都已經有數據積累,再進一步的提升自然是基于這些數據進一步分析優化生產經營和探索數據驅動的新業務模式,因此,工業4.0就是“工廠+大數據”。
圖6 工業大數據商業價值實現路徑
圖7 演講大綱
圖8 工業大數據應用前景廣泛
圖9 廣義工業大數據
工業大數據從哪里來?來源于產品生命周期的各個環節,包括市場、設計、制造、服務、再利用各個環節,每個環節都會有大數據。“全”生命周期匯合起來的數據更大。當然,企業外、產業鏈外的“跨界”數據也是工業大數據“不可忽視”的重要來源。
圖10 工業大數據核心-機器數據
圖11 機器數據(物聯網數據)
圖12 工業數據分析特點
圖13 機器大數據核心技術
要利用好機器大數據,需要突破幾類核心技術。
首先是數據怎么管理的問題。海量的機器型數據如時間序列、時空數據等高速采集完成后,需要把它存下來,這涉及到數據有效打包、壓縮、放置的問題。數據存下來是為了被利用,這需要支持快速定位查詢到應用需求的數據,而這又是一個如何建立高效的時空數據索引的問題。
數據存好管好了,下一個問題就是如何支持各種分析。做過實際分析的人都知道,分析絕不僅僅是開發一堆算法的問題。算法只是一小部分工作,大部分的工作是根據對業務問題的理解選取需要的數據,理解數據的特征,然后根據特征設計一個合適的模型和算法。這中間數據特征的理解對機器大數據來說是很難的。因為機器數據不能為人所直觀理解,需要交互特征工程。此外,從模型和算法的層面,機器數據往往是對一個物理世界系統的感知結果,而物理世界有許多機理性的原理存在,比如機械領域涉及力學原理,冶金領域涉及化學原理,因此機器大數據的分析需要有機結合機理模型和數據統計模型。還有一個常常被忽略的問題是數據質量的問題——如何把握數據質量,如何修正數據質量。
再談應用的角度,如何更簡單地訪問數據和使用分析,特別是對領域專家。在多源異質數據,屏蔽數據集成關聯的問題,使得領域專家不需要懂復雜的大數據技術和編程。
圖14 演講大綱
圖15 應用案例-工程機械在線運維系統
圖16 應用案例-風力發電機能效提升
圖17 演講結束
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:干貨|清華陸薇:釋放工業大數據價值
本文網址:http://www.guhuozai8.cn/html/news/10515419715.html