| 當(dāng)前位置：拓步ERP資訊網(wǎng) >>服務(wù)支持 >>ERP技術(shù)支持 >>企業(yè)管理知識(shí)庫(kù)

www.guhuozai8.cn拓步ERP|ERP系統(tǒng)|ERP軟件|ERP管理系統(tǒng)軟件|免費(fèi)ERP系統(tǒng)|免費(fèi)ERP軟件|免費(fèi)進(jìn)銷(xiāo)存軟件|免費(fèi)倉(cāng)庫(kù)管理軟件|免費(fèi)下載專(zhuān)業(yè)資訊網(wǎng)-淺析檔案序列化存儲(chǔ)管理

淺析檔案序列化存儲(chǔ)管理

發(fā)布日期：2013-01-15 10:53:06 來(lái)源：www.guhuozai8.cn 編輯：拓步ERP資訊網(wǎng) 瀏覽：評(píng)論

摘要：檔案管理工作具有重大的意義，但是目前檔案管理工作在信息化進(jìn)程中遇到了大量的問(wèn)題。使用檔案序列化存儲(chǔ)可以有效解決這些問(wèn)題，本文討論了檔案信息化所遭遇的問(wèn)題，以及檔案序列化存儲(chǔ)技術(shù)的應(yīng)用前景和使用困難。 原標(biāo)題：淺析檔案序列化存儲(chǔ)管理 原作者：發(fā)表時(shí)間：2013/1/15 杜健為來(lái)源：萬(wàn)方數(shù)據(jù)

檔案管理工作具有重大的意義，但是目前檔案管理工作在信息化進(jìn)程中遇到了大量的問(wèn)題。使用檔案序列化存儲(chǔ)可以有效解決這些問(wèn)題，本文討論了檔案信息化所遭遇的問(wèn)題，以及檔案序列化存儲(chǔ)技術(shù)的應(yīng)用前景和使用困難。

一、檔案序列化存儲(chǔ)研究的背景

檔案管理系統(tǒng)是整個(gè)國(guó)家文獻(xiàn)信息系統(tǒng)的組成部分之一，在構(gòu)成整個(gè)社會(huì)的科學(xué)能力中占有重要地位，成為社會(huì)信息系統(tǒng)的基石。檔案管理不僅對(duì)各具體單位的工作和生產(chǎn)有意義，對(duì)整個(gè)社會(huì)而言，也很有意義，不僅具有當(dāng)前的、現(xiàn)實(shí)的意義，也具有長(zhǎng)遠(yuǎn)的、歷史的意義。目前有充分的證據(jù)顯示，隨著科技水平的進(jìn)步，檔案管理工作必須要隨之利用科學(xué)的武器武裝自己，加快檔案信息化管理的步伐，才能更好地發(fā)揮檔案管理工作在社會(huì)中的作用。

在檔案信息化進(jìn)程中，很多檔案工作者發(fā)現(xiàn)了這樣的困難，即信息化后的檔案存儲(chǔ)往往呈現(xiàn)碎片狀，難以建立起一個(gè)相對(duì)完整的數(shù)據(jù)結(jié)構(gòu)。尤其是面對(duì)海量數(shù)據(jù)的檔案，例如某些大型國(guó)有企業(yè)的檔案庫(kù)中，大量的檔案在邏輯上緊密相鄰，但是在物理上卻分散在存儲(chǔ)設(shè)備的不同位置，這種數(shù)據(jù)結(jié)構(gòu)對(duì)于檔案的管理和檢索是十分不利的。大量的反饋信息反映出這樣一個(gè)現(xiàn)實(shí)：每年有大量的資源被浪費(fèi)在了對(duì)于分散數(shù)據(jù)的檢索上。筆者結(jié)合實(shí)際以及其他學(xué)科的經(jīng)驗(yàn)，提出了一種序列化存儲(chǔ)并管理檔案的方式，并對(duì)這種方式進(jìn)行了檢驗(yàn)。

二、序列化存儲(chǔ)基本原理

計(jì)算機(jī)科學(xué)中所討論的序列化(Serialization)，其真實(shí)含義為將對(duì)象的狀態(tài)信息轉(zhuǎn)換為可以存儲(chǔ)或傳輸?shù)男问降倪^(guò)程。舉例而言，對(duì)于一條復(fù)雜的數(shù)據(jù)，假定該數(shù)據(jù)牽扯到五個(gè)以上的表。如果我們使用傳統(tǒng)的數(shù)據(jù)庫(kù)存儲(chǔ)方式，數(shù)據(jù)將會(huì)呈現(xiàn)出四個(gè)或者更多的斷點(diǎn)。每次查找，都需要調(diào)用包含下列語(yǔ)句的程序：

USE數(shù)據(jù)庫(kù)名

SELECT表名．信息FROM表1表2

WHERE條件

按照這種方式，每一次的查找，都至少需要調(diào)用一次表查詢(xún)和一次表內(nèi)檢索。假如一次查詢(xún)需要同時(shí)使用四個(gè)表，那么實(shí)際上需要調(diào)用的表查詢(xún)次數(shù)至少為三，表內(nèi)檢索次數(shù)至少為四。這個(gè)結(jié)論的得出前提是每個(gè)表只需要使用一次。事實(shí)上，如果在數(shù)據(jù)庫(kù)建表時(shí)，數(shù)據(jù)庫(kù)已經(jīng)優(yōu)化到了BC范式，每個(gè)表很難做到只被調(diào)用一次。如果使用序列化的技術(shù)，所有的表項(xiàng)，也就是一個(gè)數(shù)據(jù)實(shí)體將會(huì)被表現(xiàn)成為一段序列化的代碼，通過(guò)對(duì)代碼的掃描，可以在一次檢索中完成對(duì)數(shù)據(jù)的增添、刪除、修改以及查詢(xún)。

目前在實(shí)際應(yīng)用中的序列化大部分是在一些程序中的某些過(guò)程中使用的，在這些過(guò)程中，使用各種語(yǔ)言編輯的對(duì)象經(jīng)過(guò)序列化得到了可以直接掃描讀取的序列信息。但是顯而易見(jiàn)，序列化技術(shù)可以不經(jīng)改變地用來(lái)對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)，并有著目前常用的檔案信息化管理方法難以比擬的優(yōu)勢(shì)。

假設(shè)有一條人事檔案，某同志部分基本情況如下：

姓名：張民性別：男民族：漢政治面貌：中共黨員

在傳統(tǒng)的情況下，我們需要建立一個(gè)數(shù)據(jù)表，這個(gè)表至少應(yīng)該有四項(xiàng)，每一項(xiàng)對(duì)應(yīng)一類(lèi)情況。如果在XML文件下，我們需要為張民創(chuàng)建一個(gè)單獨(dú)的標(biāo)記。如圖1所示：

圖1：XML文件保存的檔案條目

可能有檔案工作者提出質(zhì)疑，序列化的檔案條目目前沒(méi)有體現(xiàn)出優(yōu)勢(shì)。但是試想一下，如果檔案條目的內(nèi)容增加，形成了多表存儲(chǔ)，那么XML的簡(jiǎn)單樹(shù)形存儲(chǔ)結(jié)構(gòu)就顯示出了優(yōu)勢(shì)。序列化的XML文件可以被多種平臺(tái)以及軟件API直接讀取，極大地拓展了存儲(chǔ)內(nèi)容的可用性。

三、一種改進(jìn)的檔案序列化存儲(chǔ)方案

上文主要介紹了XML文件對(duì)于要保存的內(nèi)容的序列化存儲(chǔ)，但是XML文件有著自身固有的弱點(diǎn)。如果數(shù)據(jù)量非常大，把全部的檔案內(nèi)容保存在XML文件中，使用起來(lái)確實(shí)方便許多，但是如果在缺乏相應(yīng)工具的時(shí)候，內(nèi)容檢索就比較困難。在本節(jié)中，筆者提出一種改進(jìn)的檔案序列化存儲(chǔ)方案設(shè)想，有充足證據(jù)顯示，這種設(shè)想如果可以被付諸實(shí)踐并不斷完善，那么將會(huì)給檔案管理工作帶來(lái)一次革命。

這種方案的核心思想是使用特征值將一條檔案序列化成為一個(gè)簡(jiǎn)單字符串，字符串的不同位置被預(yù)先賦予特定的含義，這樣通過(guò)一次線性掃描可以獲知檔案條目的全部?jī)?nèi)容。下面的例子可以簡(jiǎn)要地說(shuō)明這種方案的思想。

設(shè)想一條檔案的前12位是如下的一串?dāng)?shù)字：223729014610。如果不加以說(shuō)明，很難有人可以理解到這12位數(shù)字的含義。事實(shí)上，這是姓名代碼解決方案下的筆者的姓名代碼。在我國(guó)目前的高考中通用的姓名代碼收錄了7000個(gè)以上的姓名常用漢字，每一個(gè)漢字由4位數(shù)字形成的代碼表示。這樣，不同的人名可以經(jīng)過(guò)這一次的轉(zhuǎn)換，序列化成為一個(gè)12位的字符串。如果我們約定，每一條人事檔案的前12位代表姓名，那么每次檢索姓名時(shí)，只需要檢索每一條檔案的前12位即可。

同樣，我們可以規(guī)范檔案的內(nèi)容，從而進(jìn)一步規(guī)定，每一條序列化的檔案記錄的固定位置記錄固定內(nèi)容，不同的信息也同樣設(shè)置類(lèi)似于姓名代碼解決方案的對(duì)應(yīng)標(biāo)準(zhǔn)，那么我們就可以做到由一個(gè)簡(jiǎn)單字符串代表很豐富的信息。雖然目前并沒(méi)有應(yīng)用于檔案管理，這種序列化方案在很多領(lǐng)域有著廣泛的應(yīng)用，包括但不限于生物、醫(yī)學(xué)、機(jī)械、統(tǒng)計(jì)等。經(jīng)過(guò)序列化之后，原本復(fù)雜的、可能牽扯幾十個(gè)表的復(fù)雜數(shù)據(jù)庫(kù)將會(huì)在一個(gè)文件中簡(jiǎn)單明了地標(biāo)示清楚。并且，序列化的內(nèi)容在對(duì)檔案的進(jìn)一步利用上會(huì)有更加優(yōu)越的特質(zhì)，在本文的最后一部分將會(huì)介紹。

本文所討論的這種檔案序列化存儲(chǔ)技術(shù)推廣的阻礙主要有三個(gè)：首先，檔案本身難以規(guī)范，導(dǎo)致不同地區(qū)、不同級(jí)別的檔案序列長(zhǎng)度很難保持一致，對(duì)于檢索有不可忽視的阻礙作用。第二，檔案序列化標(biāo)準(zhǔn)難以出臺(tái)。我們很難做到在全國(guó)范圍內(nèi)，以同一個(gè)方式，將檔案內(nèi)容完全以姓名代碼解決方案的形式轉(zhuǎn)變?yōu)樽址蛘咦址�，而這個(gè)轉(zhuǎn)變(事實(shí)上就是序列化)過(guò)程恰恰就是這種技術(shù)轉(zhuǎn)化為實(shí)用的門(mén)檻。這個(gè)轉(zhuǎn)化賦值必須像《漢語(yǔ)拼音方案》一樣全國(guó)通用，所以這個(gè)轉(zhuǎn)化復(fù)制過(guò)程也必須由權(quán)威機(jī)構(gòu)主管，并且調(diào)試之后全國(guó)同行業(yè)統(tǒng)一使用。第三，檢索工具的缺失導(dǎo)致目前這種技術(shù)難以為普通檔案工作者使用。不過(guò)，筆者個(gè)人認(rèn)為技術(shù)難度相對(duì)而言最為簡(jiǎn)單，相關(guān)工具技術(shù)含量并非很高，在明確需求之后兩個(gè)星期內(nèi)筆者本人即可開(kāi)發(fā)出有實(shí)用價(jià)值的工具。

四、序列化后的檔案信息的深入挖掘

上文說(shuō)到，序列化之后的檔案信息可以直接利用于各種軟件和API，這為檔案進(jìn)行數(shù)據(jù)挖掘提供了基礎(chǔ)。數(shù)據(jù)挖掘是對(duì)大規(guī)模數(shù)據(jù)的分析分類(lèi)的過(guò)程，序列分類(lèi)作為數(shù)據(jù)挖掘的重要分支，具有十分廣泛的應(yīng)用前景，其應(yīng)用范圍包括但不限于基因分析、信息檢索、健康監(jiān)測(cè)、金融預(yù)測(cè)等領(lǐng)域。不同的序列分類(lèi)器在面對(duì)不同特征的序列時(shí)，往往具有不同但是良好的分類(lèi)效果。僅舉一例，美國(guó)最大的零售商在對(duì)全年的銷(xiāo)售單據(jù)進(jìn)行了數(shù)據(jù)挖掘之后，發(fā)現(xiàn)了嬰兒用品和酒精類(lèi)飲料的銷(xiāo)售關(guān)系，于是將兩類(lèi)商品放置在一起，第二年兩類(lèi)商品的銷(xiāo)售量都有大幅提升。

檔案作為一類(lèi)海量數(shù)據(jù)，具有極高的數(shù)據(jù)挖掘價(jià)值，統(tǒng)計(jì)學(xué)家和計(jì)算科學(xué)家們相信，對(duì)于檔案進(jìn)行數(shù)據(jù)挖掘，可以得到很多有意義的數(shù)據(jù)和結(jié)果。例如，從事機(jī)械設(shè)計(jì)工作的工程師可能會(huì)更具語(yǔ)言天賦，小學(xué)時(shí)受到過(guò)獎(jiǎng)勵(lì)的學(xué)生在長(zhǎng)大后可能會(huì)更具有從事社會(huì)工作的趨向等。筆者參與過(guò)數(shù)個(gè)數(shù)據(jù)挖掘的項(xiàng)目，深信數(shù)據(jù)挖掘?qū)τ跈n案管理具有非常大的作用，通過(guò)數(shù)據(jù)挖掘?qū)n案進(jìn)行管理，將會(huì)是檔案管理工作的一次飛躍。

在數(shù)據(jù)挖掘這門(mén)學(xué)科中，序列分類(lèi)(sequencclassification)是一個(gè)重要的分支，其中又以基于特征的分類(lèi)(feature based)應(yīng)用最為廣泛，經(jīng)過(guò)序列化的檔案信息可以直接被用來(lái)進(jìn)行特征提取，然后使用經(jīng)典的序列分類(lèi)算法進(jìn)行數(shù)據(jù)挖掘，從而得到我們難以想象的，但是價(jià)值非凡的結(jié)果。

總結(jié)起來(lái)，檔案序列化存儲(chǔ)是一項(xiàng)有著重大應(yīng)用前景的檔案管理技術(shù)，它可以解決目前檔案管理工作中的數(shù)據(jù)分散、結(jié)構(gòu)混亂、空間開(kāi)銷(xiāo)大等問(wèn)題，而且有著極有價(jià)值的應(yīng)用空間。盡管可能有諸多困難，但是筆者相信，隨著檔案研究人員的努力，檔案序列化存儲(chǔ)將會(huì)成為檔案信息化和檔案管理的新方向。

核心關(guān)注：拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用，蘊(yùn)涵了豐富的ERP管理思想，集成了ERP軟件業(yè)務(wù)管理理念，功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理，全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域，是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴(lài)品牌。

轉(zhuǎn)載請(qǐng)注明出處：拓步ERP資訊網(wǎng)http://www.guhuozai8.cn/

本文標(biāo)題：淺析檔案序列化存儲(chǔ)管理

本文網(wǎng)址：http://www.guhuozai8.cn/html/support/1112187026.html

關(guān)鍵詞標(biāo)簽： 淺析檔案序列化存儲(chǔ)管理,檔案管理工作存儲(chǔ)管理序列化信息化進(jìn)程,ERP,ERP系統(tǒng),ERP軟件,ERP系統(tǒng)軟件,ERP管理系統(tǒng),ERP管理軟件,進(jìn)銷(xiāo)存軟件,財(cái)務(wù)軟件,倉(cāng)庫(kù)管理軟件,生產(chǎn)管理軟件,企業(yè)管理軟件,拓步,拓步ERP,拓步軟件,免費(fèi)ERP,免費(fèi)ERP軟件,免費(fèi)ERP系統(tǒng),ERP軟件免費(fèi)下載,ERP系統(tǒng)免費(fèi)下載,免費(fèi)ERP軟件下載,免費(fèi)進(jìn)銷(xiāo)存軟件,免費(fèi)進(jìn)銷(xiāo)存,免費(fèi)財(cái)務(wù)軟件,免費(fèi)倉(cāng)庫(kù)管理軟件,免費(fèi)下載,

本文轉(zhuǎn)自：e-works制造業(yè)信息化門(mén)戶(hù)網(wǎng)

本文來(lái)源于互聯(lián)網(wǎng)，拓步ERP資訊網(wǎng)本著傳播知識(shí)、有益學(xué)習(xí)和研究的目的進(jìn)行的轉(zhuǎn)載，為網(wǎng)友免費(fèi)提供，并盡力標(biāo)明作者與出處，如有著作權(quán)人或出版方提出異議，本站將立即刪除。如果您對(duì)文章轉(zhuǎn)載有任何疑問(wèn)請(qǐng)告之我們，以便我們及時(shí)糾正。聯(lián)系方式：QQ：10877846 Tel：0755-26405298。

上一篇： TDM，引領(lǐng)試驗(yàn)數(shù)據(jù)管理變革

下一篇：分布式遠(yuǎn)程營(yíng)銷(xiāo)系統(tǒng)助力安鋼自動(dòng)化完善銷(xiāo)售管理

相關(guān)文章

服務(wù)支持


	ERP新聞動(dòng)態(tài) 拓步新聞行業(yè)新聞關(guān)注產(chǎn)品觀點(diǎn)縱橫企業(yè)管理企業(yè)應(yīng)用

	ERP解決方案按ERP應(yīng)用行業(yè)分類(lèi) 按ERP企業(yè)規(guī)模分類(lèi) 按ERP管理領(lǐng)域分類(lèi) 按ERP軟件功能分類(lèi) 按ERP系統(tǒng)特性分類(lèi) 用友ERP解決方案金蝶ERP解決方案易飛ERP解決方案速達(dá)ERP解決方案其他ERP解決方案

	ERP顧問(wèn)咨詢(xún) ERP管理咨詢(xún) ERP戰(zhàn)略診斷 ERP流程分析 ERP流程優(yōu)化 ERP風(fēng)險(xiǎn)分析 ERP可行性研究 ERP整體規(guī)劃 ERP選型招標(biāo) ERP實(shí)施監(jiān)理 ERP評(píng)審驗(yàn)收 ERP績(jī)效評(píng)價(jià) ERP基礎(chǔ)知識(shí) ERP課程培訓(xùn) ERP培訓(xùn)教育 ERP視頻教材

	CIO技術(shù)專(zhuān)欄 CIO企業(yè)應(yīng)用 CIO網(wǎng)絡(luò)通信 CIO信息安全 CIO基礎(chǔ)設(shè)施 CIO云計(jì)算

	ERP技術(shù)支持技術(shù)支持知識(shí)庫(kù) 常見(jiàn)問(wèn)題資料庫(kù) 在線學(xué)習(xí)資料庫(kù) 日常辦公資料庫(kù) 企業(yè)管理知識(shí)庫(kù)

	ERP系統(tǒng)價(jià)格拓步ERP系統(tǒng)價(jià)格體系拓步EIS軟件價(jià)格體系合作品牌ERP價(jià)格體系技術(shù)支持服務(wù)價(jià)格體系

	合作品牌用友UFIDA 金蝶KingDee 神州數(shù)碼Digital 速達(dá)SuperData 拓步ERP系統(tǒng)成功案例

	代理加盟合作聯(lián)盟策略代理合作指南代理聯(lián)盟前景聯(lián)盟技術(shù)支持快速搜索ERP軟件資訊

	關(guān)于拓步公司介紹公司愿景企業(yè)文化誠(chéng)聘英才聯(lián)系我們在線留言在線訂購(gòu)意向下載體驗(yàn)登記

日本高清色本免费现在观看-日本高清色图-日本高清色视频在线观看免费-日本高清免费一本视频在线观看-国产精品电影久久-国产精品对白刺激久久久

ERP技術(shù)支持

技術(shù)支持知識(shí)庫(kù)

常見(jiàn)問(wèn)題資料庫(kù)

在線學(xué)習(xí)資料庫(kù)

日常辦公資料庫(kù)

企業(yè)管理知識(shí)庫(kù)

ERP系統(tǒng)教程

ERP免費(fèi)下載

ERP在線咨詢(xún)

即時(shí)聯(lián)系

服務(wù)熱線

快捷互動(dòng)

猜您喜歡