一、會計數據處理發展歷程回顧
會計數據是對企業經營活動過程中各種經濟事項進行記錄的符號。在對會計數據進行采集、存儲、加工和傳遞等的過程中所采用的技術稱為會計數據處理技術。會計數據處理技術的發展經歷了四個階段:
一是會計數據手工處理階段, 會計人員依靠算盤、紙張等計算工具對會計數據進行采集、存儲、加工和具時會計數據進行采集、存儲、加工和傳遞等。手工處理階段在會計業務處理過程中表現出好的適應性、靈活性和可靠性,但也表現出低速度、低效率和高差錯率等不足之處。
二是會計數據機械處理階段,即會計人員利用穿孔機、驗孔機、機電設備、電子設備等工具對會計數據進行采集、存儲、加工和傳遞等。會計數據機械處理階段能夠提高會計數據處理的計算速度與正確性,但這些工具存在體系龐大、成本過高、操作困難和穩定性較差等不足。
三是會計數據電子計算機處理階段。計算機的出現,為會計數據處理提供了技術支撐。會計數據的集中存儲和自動處理極大地提高了會計數據處理的工作效率,提高了會計信息的及時性和準確性。這個階段,計茸機技術還是會計數據處理的工具,信息的分享和交換主要通過軟盤、光盤等存儲介質來實現。該階段會計核算和操作流程主要模擬手工方式,只有相關獨立的單機運行的會計核算程序,一種核算程序獨立完成一項會計業務,相互之間沒有聯系。
四是會計數據網絡化處理階段。隨著網絡技術的發展,財務部門,可獨立使用計算機及網絡如內部網(intranet)、外部網(extranet)、因特網(internet)等進行會計數據的處理。
利用分布式數據庫技術、互聯網技術、中間件技術、系統集成技術等現代信息技術,特別是ERP系統的開發與應用,企業會計信息系統實現了業務流程、會計工作流程和信息流程的集成,徹底消除了“信息孤島”現象,極大地提高了整個企業的信息共享性。同時,實現了業務處理和會計處理的集成、財務信息和非財務信息的集成、會計核算與會計管理的集成。
二、物聯網下會計數據處理的革命
(一)會計大數據的特征
隨著信息技術特別是物聯網技術、移動計算技術的發展,會計核算必須收集、處理數量巨大、結構各異的大數據。這些會計大數據除具有一般大數據的4個“V”的特征外,還具有無形性與粘性的特征:
1.數據數童規模大(Volume)。物聯網下產生的數據數量大,它已經不是過去大規模數據(large scale data)、龐大數據(enormous data)、海童數據(massive data)所能夠描述的,而應該是用大數據(big data)來概括。數據規模不是用GB, TB為單位而是用PB為單位來衡量。
2.數據異構的數據((Variety)。物聯網下產生的數據不僅包括數字這樣結構化的數據,還包括聲音、圖像等非結構化的數據。這些數據因為與業務事件的關聯性,從而導致結構化數據與非結構化數據更加復雜,不易處理。
3.數據產生與處理實時性( Velocity)。傳統數據時時間處理要求不高。但是,物聯網下物的行為與人的行為一般都要求在當下完成,因此數據的產生與處理具有實時性。
4.價值密度低(Value)。會計大數據會連續不斷地產生,但有價值的數據卻只是連續產生的數據中的一個片斷或一個部分。以視頻為例,連續不間斷的監控過程中,可能有用的數據僅僅只有一兩秒。因此,大數據的價值密度低。
5.會計數據的無形性與粘性。當前物聯網上企業采集、傳輸、處理的數字信息主要是非價值的數量信息。這些數據可以直接被感應器所感知,從而容易被傳播;而會計數據是無形的數據,它不能夠被感應器所感知。同時,會計數據是直接粘合在業務數據之中,不能夠脫離業務數據而存在。因此,會計數據具有無形性與粘性。
(二)會計大數據的處理問題:物聯網與云計算的發展必須解決的問題
如果說石油是工業社會的血液,那么數據就是信息社會中的血液。但是,大童的大數據如果沒有得到有效利用,就會產生數據泛濫或信息超載。大量優質的數據和劣質數據融合在一起,可能會產生各種各樣的誤差和錯誤。數據不準確就沒有任何價值。如何保證數據的可信性和質童是物聯網需要解決的首要問題。其次,如何時物聯網中所產生的大量數據進行智能挖掘和分析以產生真正的數據價值是物聯網需要解決的核心問題。最后,如何對由于物聯網所產生的大量大數據進行存儲和管理并確保這些大數據的安全,是物聯網下需要解決的基礎問題。
三、構建會計大數據分析平臺及其思路:企業會計云計算建設的核心
隨著會計大數據時代的來臨,企業要向數據分析型企業轉型,必須改變傳統觀念,全員、全方位、全過程地利用數據,建立會計大數據分析平臺。由于篇幅的限制,會計大數據的治理及管理、標準與安全管理等內容不在本文論述,本文主要提出企業推行會計云計算、構建會計大數據分析平臺中需要做到的幾點內容。
(一)大數據不是信息,信息不是智慧:企業必須端正的認識
由于數據蘊含著企業管理決策所需要的信息,通過對企業所擁有的數據進行分析,能夠為企業創造巨大的效益,如對企業內部數據進行挖掘、優化,能幫助企業更精準地找到用戶、降低營梢成本、提高企業銷售率、增加利潤。因此,當前許多企業認為只要是數據就要收集、存儲,就能夠從中獲取收益,這是一個錯誤的認識。數據越多,不一定代表信息越多。數據不代表信息,更不代表智慧。企業大量收集大數據的同時,也面臨著大數據處理、使用、保管和安全等方面的新挑戰。當前,許多企業有很多數據自收集后就存在服務器內,不產生任何價值。如銀行、電信、保險等企業擁有巨量數據,但有很大一部分數據是處于休眠或者是半休眠狀態,不僅未能幫助企業做出有效的管理決策,而且耗費大量存儲和管理成本。
(二)確保會計大數據質量:一個必須堅持的原則
“垃圾的數據只能產生垃圾的信息。”在會計大數據處理過程中經常出現數據不準確、不完整、不及時等數據質量問題。因此,在會計數據處理的過程中必須確保會計大數據的質量。
會計大數據的質量主要包括大數據的準確性、完整性、一致性、時效性、可信性和可解釋性等。數據的準確性是指不包含錯誤或存在偏離期望的值;數據的完整性是指數據不缺屬性值,或僅含聚集數據;數據的一致性是指數據之間不存在差異,相互可內洽;數據的時效性是指數據的及時性;數據的可信性是指反映有多少數據是用戶依賴的;數據可解釋性是指數據是否容易理解。
(三)建立企業大數據中心開發平臺:數據分析平臺建設的基礎
大數據的問題不是單一的一個產品能夠解決的,它需要一整套的解決方案,它要融合很多傳統的、新的技術。要構建大數據分析平臺并從大數據中挖掘出價值,企業首先需要一個可擴展、靈活而可管理的數據基礎架構,也就是企業大數據中心開發平臺。
1.數據中心開發平臺的基本內容。數據中心開發平臺的含義很多,筆者認為,數據中心主要應具備以下特征:
①數據中心是各種數據的集成與交換中心,是集基礎與應用為一體的綜合開發與應用集成平臺。
②數據中心是一種搭建平臺,提供一系列完整語義的數據處理功能,提供對流程、表單、應用程序界面數據等完整的搭建方案(由一系列的程序模塊及數據組成),因而也是關于應用系統的集成設計器和工具箱。
③數據中心是一種強兼容性的數據倉庫,可以在同一個框架下,把來自不同生產廠商、不同格式、不同標準和分布在不同位置的數據統一在一個系統之下,即實現對分布式多源異構數據的管理能力。
④數據中心是一個定義完備的功能倉庫,支持和管理以多種方式(組件、插件、流程、動態庫、程序片斷和腳本)提供的功能,并能時這些功能以一種一致的方式進行調用和執行。
⑤數據中心是一種應用集成系統,采用柔性設計理念,系統能夠被快捷地搭建出來,且能適應需求的變化迅速做出調整。
2.數據中心的體系架構。數據中心的架構是面向服務的系統架構(Service-Oriented Architecture),又稱為SOA架構。在這架構下,無數軟件制造者可將其研制軟件功能以服務形式提供出來,各功能之間是相互獨立的,以一種稱為松藕合的協議機制來組合。數據中心架構通過目錄配置、可視化配置和搭建充分利用功能倉庫和數據倉庫的機制進行管理。
(四)會計大數據的獲取、存儲和計算:一條企業參與會計云計算的主線
1.數據清理、數據集成、數據選擇、教據變換:會計大數據的獲取。
會計有一句名言:財務會計與管理會計影同源分流”,這里的源便是數據。但是,收集來的數據應先經過數據清理、數據集成、數據選擇、數據變換才能進行會計的加工、處理。首先,未經處理會出現數據的不準確,例如收集數據的設備可能出故障;人或計算機的錯誤可能在數據輸入時出現;用戶不希望提交個人信息時,故意強制輸入不正確的值;錯誤也可能在傳輸過程中出現。其次,未經處理會出現數據的不完整。不完整數據的出現可能出于多種原因,如銷售事務數據中顧客的數據不一定總能得到;數據的重復,如多次記入的客戶;數據邏輯上關聯不一致,如地址與郵政編碼。
會計數據預處理主要有數據清理、數據集成、數據選擇、數據變換。有效的“清理”是指消除噪音和刪除不一致數據;集成是指多種數據源可組合在一起;選擇是指從數據庫中提取與分析任務相關的數據;變換是指通過匯總或聚集操作,把數據變換和統一成適合挖掘的形式。
2.關系型數據庫存儲與管理向本原(XML)數據庫存儲與管理轉變:會計大數據的存儲與管理。
數據的存儲與計算是相互依存的。因此,會計大數據的存儲在會計云計算中具有重要的地位。隨著會計大數據時代的來臨,會計數據已從原來數值型為主的數據向非結構性為主的數據轉變。由于非結構性數據存儲與結構性數據存儲技術上存在本質的差異,會計大數據的存儲與管理要從關系型數據庫存儲與管理向本原(XML)數據庫存儲與管理轉變。
①關系型數據庫存儲與管理。關系型數據庫存儲與管理不僅很好地解決了數據的集中和共享問題,而且數據關系模型有嚴格的數學基礎,抽象級別比較高,而且簡單清晰,便于理解和使用。關系型數據庫也能夠解決數據獨立性和抽象問題。用戶在對這種數據庫進行存取時,不需要明確數據的存儲結構并指出存取路徑。
②原生XML數據庫系統(Native XML Database)存儲與管理。關系型數據庫能很好地處理所謂的“表格型數據”,卻對物聯網技術所產生的非結構化的數據無能為力。這就需要比關系型數據庫產品更高級的面向對象關系型數據庫來支持(作者注:“面向對象的數據庫系統<objectoriented database>"<或簡稱“OO數據庫系統”>專門用來解決非結構化的數據存儲問題。由于面向對象的數據庫產品的主要設計思想是試圖用新型數據庫系統來取代現有的數據庫系統,這對許多已經運用數據庫系統多年兼積累了大量工作數據的客戶<尤其是大客戶>來說,無法承受新舊數據間的轉換而帶來的巨大工作量及巨額開支。
另外,面向對象的關系型數據庫系統使查詢語言變得極其復雜,從而使得無論是數據庫的開發商家還是應用客戶都視其復雜的應用技術為畏途。因此,面向對象與關系型數據庫的結合是當前的主要方式)。以非結構化數據為主要特征的會計大數據存儲與管理必須在跨操作平臺、跨軟件系統的Internet平臺上進行,其基礎技術就形可擴展的標識語言(XML, extensiblemarkup language)。如果說以http傳輸協議和超文本標識語言HTML為標志的是第一代Internet技術的話,那么,圍繞著XML所形成的一系列標準和技術將構成新一代的Internet技術。HTML文件中的標識符僅表示該文件應該如何顯示,文件中表達的意義完全需要人通過對文字的閱讀才能理解,機器難以判斷其表達的語義。而XML則不同,它所采用的標識符本身就代表了語義結構,文件的具體語義完全可以通過對語義結構的分解及該結構內變量值或字符的分析由機器來解釋。因此,用通俗的話來概括HTML與XML的差別:0HTML是寫給人看的;而XML則是寫給機器看的。
一般說來,XML有下列重要特性:XML是一種表意而非表形的元語言;XML是Internet的標準語言,具有跨操作平臺、跨區域的特點,是網絡世界里的一種“世界語”;XML是一種可自我描述定義的元語言(self descriptionmeta language),所以它將大量用于制定行業內及行業間數據交換的標準。相對于傳統的關系型數據庫管理系統來說,原生XML數據庫系統存儲與管理是一種結構完全不同、設計思想新穎的全新的數據庫系統。如果用關系型數據庫來處理XML數據,將需要一系列復雜的轉換工作,從而極大地影響應用的速度。當轉換選擇不合理時,很有可能對應用造成致命的傷害。而原生XML數據庫系統則不同,XML數據不經任何轉換而按原結構形狀直接存入數據庫內。時于XML應用,原生XML數據庫系統的速度相對于其他數據庫來說要快得多。
3.數據挖掘:會計大數據的計算。
從某種意義上說,會計實質上是數據分類處理的一門學問。如何從經濟業務數據中獲取決策知識是會計的主要目的。隨著信息技術的發展,數據挖掘技術正是會計大數據處理的核心技術。數據挖掘(Data mining)主要是指從數據庫中提取知識,并對數據進行一定的處理,從而獲得其中隱含的、事先未知的而又可能極為有用的信息。數據挖掘方法主要包括神經網絡法、遺傳算法、決策樹法、搜蓋正例排斥反例法、統計分析法、模糊集法等。
數據挖掘的主要內容可分為四類,即預測建模、關聯分析、聚類分析和異常檢測等。這里主要把它分為兩類:預測任務與描述任務。預測任務是指根據其他屬性的值,預測特定屬性的值;描述任務主要是導出概括數據中潛在聯系的模式(如相關、趨勢、聚類、軌跡和異常)。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文網址:http://www.guhuozai8.cn/html/consultation/1083979825.html