0 引言
隨著企業信息化建設的加強,MES在企業生產信息化建設中的作用越來越重要.MES系統中的數據挖掘主要針對于過程監控中的大量生產的日志數據.通過這些數據分析,對生產過程中的數據變化進行實時監測,以此來得到生產狀態而進行結果判別.
國際MES協會對MES定義為“一個提供信息的系統,以優化從定單到成品的生產活動.使用當前的和精確的實時數據,MES指導廠級活動,并對發生的活動進行響應和匯報,形成對變化條件的迅速響應,并專注于減少無價值的活動,從而驅動有效的廠級操作和過程”.
生產過程是一個復雜的而且具有周期的多樣性的過程,采用傳統的數據分析方法,很難進行建模和處理.粗糙集(RoughSet,RS)就是一種新型的數據處理的軟計算方法,它甚至不需要數據的任何檢驗或者附加的信息(比如數學統計上的概率分布,模糊集理論中的模糊度劃分,神經網絡中一定數量的訓練樣本等),而是直接從已知數據的初始狀態系統出發,通過不可分辨關系和不可分辨類確定給定問題的近似解,從而有效地進行分析和處理不精確、不完整的信息,并有效地進行屬性約簡并進行正確的動態調度.
1 基于粗糙集的數據挖掘算法
粗糙集的方法和模型建立在一種直觀的二維表的基礎上,所以可以采用知識表示系統和決策系統對問題進行描述.由于互信息方法在精度等方面的有可能表現不足,我們可以通過引入粗糙集,得出一種基于關系積理論和知識表示的屬性約簡算法,從而提出一個適用于海量文本數據集的特征選擇方式.利用此方法來進行互信息特征初選,利用屬性約簡算法來消除冗余,獲得具有代表性的特征詞.結果表明,該性約簡算法方法能獲得冗余度小且具有代表性的特征子集.使用關聯規則是數據挖掘中一種重要的方法,最開始是由R.Agrawal等人在1993年提出的,主要用于發現事務數據庫中不同商品之間的聯系,從而找出顧客購買行為模式等行為.此算法的核心就是Apriori算法,即基于兩階段大項集思想的方法,將關聯規則用于數據挖掘算法的設計可以分解為兩個子問題:
(1)找出所有支持度中大于最小支持度的項集(Itemset),并把這些項集稱為大項集(Large Itemset).
(2)使用第1步找到的大項集產生相應的關聯規則.
從關聯規則的支持度和置信度出發,那么在事務數據庫中就存在無窮多的關聯規則和置信度.人們一般只對滿足一定的支持度和置信度的關聯規則非常關注.科學論文中,一般稱滿足一定要求的(如大的支持度和置信度)的關聯規則為強規則.所以,為了找到有意義的關聯規則,需要給定兩個數據:最小支持度和最小置信度.前者稱為用戶規定的關聯規則必須滿足的最小支持度,它表示了一組物品集在統計意義上的最低程度;后者即用戶規定的關聯規則必須要滿足的最小置信度,它直接反應了關聯規則的最低可靠度.
2 數據挖掘算法在MES系統中研究與應用
生產執行過程中的數據挖掘算法是一種新技術,新方法,所以還沒有形成完整的理論體系,它的應用都是針對具體問題展開研究,其廣度和深度需要進一步拓展.
在生產過程中,計算機系統記錄和保存的數據是時間上連續變化的數據經采樣、量化得到.它在本質上是連續的,變化過程受生產狀態約束;其次,生產過程中的行為、特性等元素是由許多過程變量共同決定的,而且任何一個變量的變化都影響其它變量以及生產狀態的變化,所以在空間上,生產過程數據和變量具有高維數、強關聯和非線性等特點.但是與一般商業上的數據不同存在區別,比如零售業數據庫中的的數據是關于商品的名稱和數量的數據,這些數據在本質上是分散的,而且在時間域無約束,在空間域的特點也不同于生產過程數據,所以數據特點不同,采用的挖掘算法不同,特征提取的方法也不同.
預測在數據挖掘算法中具有重要應用領域,對生產過程有著重要的指導意義.在預測研究方法中,確定關鍵因子是非常重要的一環,以前的預測方法所涉及因子比較少,所以它的結論具有一定的局限性.數據挖掘算法的優點就是從海量數據中找到潛在有用且有關聯的信息.
由于各種干擾,生產過程數據中含有大量的噪聲和雜質;生產過程中存在大量的不確定性和機動性,造成生產數據也存在大量的不確定性.因為數據中的噪聲影響算法的有效性和結論的可靠性,所以給數據中的不確定性給知識提取帶來了困難.生產過程不同的部分其特性不同,要求也不一樣,因此對不同部分變量的采樣使用不同的采樣頻率,這使得過程變量具有多標度特點.
本文根據生產執行的全過程,結合粗糙集的屬性約簡改進了Apriori算法,從而使它適合生產過程中的知識發現和數據挖掘.算法Apriori-MES的詳細流程如圖1所示.
圖1 Apriori MES流程圖
3 結束語
本文針對MES系統的特點,運用先前提出的一套Apriori—MES算法,并且將此算法在實際的數據挖掘系統中得到了實現,但是MES系統中尚待研究的問題還有很多,主要有:
(1)從尋求數據挖掘過程中的可視化方法出發,使知識發現的過程能夠被用戶認識,也便于在知識發現的過程中進行人機交互和應用,以及能夠反應不同生產工序之間關系的圖形顯示.
(2)生產過程中不同的過程造成不同的特性,要求也會一樣,因此對不同部分變量的采樣使用了不同的采樣頻率,這使得過程變量具有多標度的特點,目前的數據挖掘算法還不能處理這類數據.
(3)將KDD技術與在線分析處理(OLAP)技術、數據查詢有機的相結合,因為用戶使用數據挖掘系統時,他們的要求具有不確定性,數據查詢可以提供給用戶一個簡單的,靈活多變的分析數據庫結構和數據簡單特征的工具.
(4)在實際應用中,許多算法不能有效的工作是因為巨大的數據量.一個有效的算法必須能存儲這樣巨大的數據,算法運算的時間必須是合理的。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:基于粗糙集的數據挖掘算法在MES/ERP系統的研究與應用
本文網址:http://www.guhuozai8.cn/html/consultation/10820211554.html