登錄

數(shù)據(jù)標準化

百科 > 信息管理術語 > 數(shù)據(jù)標準化

1.什么是數(shù)據(jù)標準化

數(shù)據(jù)標準化是指研究、制定和推廣應用統(tǒng)一的數(shù)據(jù)分類分級、記錄格式及轉(zhuǎn)換、編碼等技術標準的過程。

2.數(shù)據(jù)標準化的意義[2]

數(shù)據(jù)是信息系統(tǒng)的基礎,數(shù)據(jù)標準化主要包括數(shù)據(jù)交換、數(shù)據(jù)質(zhì)量和數(shù)據(jù)說明文件等幾方面內(nèi)容。數(shù)據(jù)交換即將一種數(shù)據(jù)格式轉(zhuǎn)換成為另外某種數(shù)據(jù)格式的技術。數(shù)據(jù)質(zhì)量涉及數(shù)據(jù)要素的描述、分類,編碼等方面的內(nèi)容。每個用戶都希望獲得現(xiàn)時的、完整而準確的數(shù)據(jù)。每個部門對數(shù)據(jù)的精度、流通性、完整性要求不同。數(shù)據(jù)質(zhì)量標準對需要空間數(shù)據(jù)的一些要素進行描述,包括空間數(shù)據(jù)精度、屬性數(shù)據(jù)精度、邏輯一致性、數(shù)據(jù)完整性和層次關系等內(nèi)容。

數(shù)據(jù)標準化主要體現(xiàn)在對數(shù)據(jù)信息的分類和編碼。對數(shù)據(jù)信息的分類是指根據(jù)一定的分類指標形成相應的若干層次目錄,構成一個有層次的逐級展開的分類體系。數(shù)據(jù)的編碼設計是在分類體系基礎上進行的,數(shù)據(jù)編碼要堅持系統(tǒng)性、惟一性、可行性、簡單性、一致性、穩(wěn)定性、可操作性和標準化的原則,統(tǒng)一安排編碼結構和碼位。數(shù)據(jù)標準是數(shù)據(jù)共享和系統(tǒng)集成的重要前提,數(shù)據(jù)標準化可以節(jié)省費用,提高效率和方便應用,有利于系統(tǒng)推廣應用,實現(xiàn)數(shù)據(jù)共享,減少數(shù)據(jù)采集費用。

3.數(shù)據(jù)標準化與數(shù)據(jù)共享[2]

數(shù)據(jù)可以在多個級別上共享,在最低級,多個記錄使用相同的數(shù)據(jù)項。在中級,多個應用使用相同的文件或數(shù)據(jù)項組合,多個數(shù)據(jù)項構成數(shù)據(jù)庫,一個系統(tǒng)可以包含許多單獨的數(shù)據(jù)庫。在數(shù)據(jù)共享的最高級,每一個完整的數(shù)據(jù)庫可以用于許多部門,同時也可以供其他行業(yè)乃至全社會使用。

應用數(shù)據(jù)庫技術組織數(shù)據(jù)是實現(xiàn)數(shù)據(jù)共享的惟一的途徑。數(shù)據(jù)庫可以使數(shù)據(jù)與使用它們的各個應用程序相互獨立,互不依賴。不論程序改變還是數(shù)據(jù)改變都不引起另一方的改變,能夠很容易重新組織數(shù)據(jù),加入新的數(shù)據(jù)。同樣,在數(shù)據(jù)結構、數(shù)據(jù)內(nèi)容或數(shù)據(jù)存儲的物理介質(zhì)發(fā)生改變,都不需要重寫程序。

數(shù)據(jù)標準化是數(shù)據(jù)共享的前提,數(shù)據(jù)標準化的程度與數(shù)據(jù)共享的能力成正比。數(shù)據(jù)標準化能夠使各個應用系統(tǒng)對客觀實體的分類和描述手段一致,或者提供相應的轉(zhuǎn)換接口。在理解一致的前提下,應用標準數(shù)據(jù)編碼系統(tǒng)和統(tǒng)一的邏輯描述方式,使共享數(shù)據(jù)庫中成為可能。

4.企業(yè)數(shù)據(jù)標準化[3]

企業(yè)信息化是指利用計算機網(wǎng)絡技術,通過對信息資源的深度開發(fā)和廣泛利用,不斷提高生產(chǎn)和經(jīng)營管理水平、提高相關決策的效率和質(zhì)量,從而提高企業(yè)經(jīng)濟效益與核心競爭力的過程。無疑,企業(yè)信息化是解決企業(yè)生產(chǎn)和管理中突出問題的有效措施,是促進企業(yè)高效生產(chǎn)、管理創(chuàng)新及體制創(chuàng)新的重要途徑,是帶動企業(yè)各項工作水平提升的重要突破口。信息化中關鍵的問題就是對信息資源的開發(fā)和利用,所謂的信息資源,歸根結底就是各類相關的“信息”,本質(zhì)上就是數(shù)據(jù),即有一定格式的、代表某些特殊意義的數(shù)據(jù)或數(shù)據(jù)集合。因此,企業(yè)信息化就是對企業(yè)數(shù)據(jù)集合進行數(shù)字化設計、實施、應用及管理,如何保證數(shù)據(jù)的規(guī)范化和標準化是企業(yè)信息化成敗最為關鍵的因素。數(shù)據(jù)標準化工作是企業(yè)進行信息化建設最基礎的工作,是信息化系統(tǒng)整體化和數(shù)據(jù)共享的基本保證。

計算機系統(tǒng)是一套數(shù)據(jù)處理系統(tǒng),要應用計算機處理各項業(yè)務,被處理的數(shù)據(jù)必須標準化、規(guī)范化,沒有標準化、規(guī)范化的數(shù)據(jù),再大的投資也將付諸東流,業(yè)界流行的企業(yè)信息化是“三分技術、七分管理、十二分數(shù)據(jù)”,就是這個道理。只有實現(xiàn)數(shù)據(jù)的標準和統(tǒng)一,業(yè)務流程才能通暢流轉(zhuǎn);只有實現(xiàn)數(shù)據(jù)的有效積累,決策才有據(jù)可循;只有數(shù)據(jù)準確,才能保證系統(tǒng)的完善。數(shù)據(jù)標準化、規(guī)范化是實現(xiàn)信息集成和共享的前提,在此基礎上才談得上信息的準確、完整和及時。沒有數(shù)據(jù)標準化,信息共享就無從談起,而數(shù)據(jù)標準化離不開業(yè)務模型的標準化、基礎數(shù)據(jù)的標準化和文檔的標準化,只有解決了這些方面的標準化,并實現(xiàn)信息資源的規(guī)范管理,才能從根本上消除各業(yè)務系統(tǒng)的“信息孤島”。以往許多企業(yè)信息化系統(tǒng)的失敗,在很大程度上是由于數(shù)據(jù)標準化工作的失誤造成的,或者是根本就沒有有效地進行數(shù)據(jù)標準化工作。

企業(yè)信息化的最大效益來自信息的最廣泛共享、最快捷的流通和對信息進行深層次的挖掘。因此,如何將分散、孤立的各類信息變成網(wǎng)絡化的信息資源,將眾多“孤島式”的信息系統(tǒng)進行整合,實現(xiàn)信息的快捷流通和共享,是企業(yè)信息化過程中亟待解決的問題。在企業(yè)信息化建設過程中,建設高質(zhì)量的數(shù)據(jù)標準化體系,是開發(fā)企業(yè)信息資源、建立全面支持企業(yè)信息化運行的IT資源平臺的基本工作。數(shù)據(jù)標準化體系的設計目標是規(guī)范、標準、可控、支持高效數(shù)據(jù)處理和深層數(shù)據(jù)分析的數(shù)據(jù)結構以及穩(wěn)定、統(tǒng)一的數(shù)據(jù)應用體系及管理架構。

(1)數(shù)據(jù)標準化體系建設

數(shù)據(jù)標準化體系建設需要綜合運用關鍵成功因素法、企業(yè)系統(tǒng)規(guī)劃法等分析方法,一方面使用戰(zhàn)略目標集轉(zhuǎn)換法和關鍵成功因素法,自上而下分析企業(yè)數(shù)據(jù)類別;另一方面借助系統(tǒng)規(guī)劃和業(yè)務流程優(yōu)化思想,梳理部分業(yè)務流程,自下而上提取基礎數(shù)據(jù);進而,提取并識別概念數(shù)據(jù)庫、邏輯數(shù)據(jù)庫、數(shù)據(jù)類、數(shù)據(jù)元素,建立數(shù)據(jù)模型,遵循關系數(shù)據(jù)庫規(guī)范設計數(shù)據(jù)庫結構,最終實現(xiàn)信息的全面性和數(shù)據(jù)的規(guī)范性。

目前企業(yè)信息化過程中數(shù)據(jù)標準化建設有兩種:全面標準化和漸進式標準化。全面標準化首先實施獨立的、全面的數(shù)據(jù)標準化項目,可以在整個企業(yè)范圍內(nèi)基本完成“信息資源規(guī)劃(IRP)”工作,建立長期穩(wěn)定的主題數(shù)據(jù)庫體系,各子系統(tǒng)的建設在上述穩(wěn)定的“信息資源平臺”的基礎上建設;漸進式標準化則首先建立企業(yè)的數(shù)據(jù)標準化框架,配合試點子系統(tǒng)的運行,完成與試點子系統(tǒng)相關的業(yè)務數(shù)據(jù)以及部分管理數(shù)據(jù)的標準化工作,其后在遵循統(tǒng)一原則的前提下,各子系統(tǒng)項目分別完成相關的數(shù)據(jù)標準化工作,并將標準化成果納入企業(yè)數(shù)據(jù)資源平臺中。一般情況下,數(shù)據(jù)標準化體系建設應采取漸進式,數(shù)據(jù)標準化進程與信息化項目建設進程同步進行,在保證建設速度的同時堅持標準化原則,以支持企業(yè)信息資源充分共享與各子系統(tǒng)的整合,實現(xiàn)“速度與標準并重”,同時確保數(shù)據(jù)標準化的實用性,防止數(shù)據(jù)標準化空洞或流于形式。

(2)建立數(shù)據(jù)模型

數(shù)據(jù)模型包括兩個層面:①邏輯模型,也稱信息模型或概念模型,按照用戶的觀點對數(shù)據(jù)和信息進行建模,通常用實體和關系來表示,不依賴于某一個DBMS支持的數(shù)據(jù)模型;②物理模型,面向?qū)嶋H的數(shù)據(jù)庫,表現(xiàn)為數(shù)據(jù)結構(用于描述系統(tǒng)的靜態(tài)特性,研究與數(shù)據(jù)類型、內(nèi)容、性質(zhì)有關的對象,例如關系模型中的域、屬性、關系等)、數(shù)據(jù)操作(主要有檢索和更新兩大類操作,數(shù)據(jù)模型必須定義這些操作的確切含義、操作符號、操作規(guī)則以及實現(xiàn)操作的語言)以及數(shù)據(jù)的約束條件(一組完整性規(guī)則的集合。完整性規(guī)則是給定數(shù)據(jù)模型中數(shù)據(jù)及其聯(lián)系所具有的制約和存儲規(guī)則,用以限定符合數(shù)據(jù)模型的數(shù)據(jù)庫狀態(tài)以及狀態(tài)的變化,以保證數(shù)據(jù)的正確、有效、相容)。此外,數(shù)據(jù)模型還應該提供定義完整性約束條件的機制。

建立數(shù)據(jù)模型的步驟如下:從實際業(yè)務中抽取各類實體→定義各個實體自身的屬性→定義各個實體之間關系,設計出實體-關系圖(E-R圖)→根據(jù)E—R圖把邏輯模型轉(zhuǎn)換為符合相關模型類型的物理模型→建立物理模型數(shù)據(jù)結構→定義物理模型數(shù)據(jù)的操作→定義和檢查物理模型的完整性。

數(shù)據(jù)模型應該具有以下幾個主要的特性:①先進性,數(shù)據(jù)模型應該符合當前的技術標準,適應企業(yè)3~5年的發(fā)展需要,就是說在3~5年之內(nèi)具有先進性;②可擴展性,數(shù)據(jù)模型必須具有可擴展性,根據(jù)企業(yè)的需要對模型進行擴展,支持企業(yè)的可持續(xù)發(fā)展;③可靠性,設計的數(shù)學模型必須準確可靠,能夠保證基于這些數(shù)據(jù)模型的信息系統(tǒng)的安全可靠運行;④一致性,設計的數(shù)學模型在整個企業(yè)范圍內(nèi)是完全一致的。

(3)建立數(shù)據(jù)編碼標準

在信息化推進過程中,除了建立合理、完整的數(shù)據(jù)模型外,數(shù)據(jù)編碼這項基礎工作也是非常復雜的,其復雜程度超過軟件廠商的想象,許多軟件的應用并不是軟件本身的問題,也不是用戶不想應用,而是不能正確收集到全部的基礎數(shù)據(jù),其中編碼是最大的問題。經(jīng)驗表明,企業(yè)應用信息化等是否成功,只要了解其數(shù)據(jù)編碼工作是否真正做好即可,數(shù)據(jù)編碼工作做好了,其它方面的問題就比較容易解決。

數(shù)據(jù)編碼是建立企業(yè)信息的基礎,關系到信息系統(tǒng)的整體效果和成敗。必須對企業(yè)的所有管理對象進行編碼,并且要做到每一個管理對象的編碼都是唯一的。計算機系統(tǒng)嚴格按代碼管理,各種代碼始終貫穿于所有信息中,如供應商在計算機中有供應商代碼,合同有合同代碼,商品有商品代碼和商品條碼,商品分類有商品分類碼,人員有人員編碼,部門有部門編碼,而且代碼與代碼之問有很大的關聯(lián),因此在建立數(shù)據(jù)編碼標準時要充分考慮這些因素,使代碼與代碼之間進行協(xié)調(diào)統(tǒng),在以后信息系統(tǒng)的數(shù)據(jù)準備中,嚴格依據(jù)所制定代碼按照標準化、規(guī)范化進行管理和執(zhí)行。要進行編碼的管理對象大致包括下列各項:①產(chǎn)品系列編碼,包括產(chǎn)品編碼、原料編碼、輔料編碼、半成品編碼、在制品編碼、包裝材料編碼等;②對外系列編碼,包括客戶編碼、供應商編碼等;③倉庫系列編碼,包括倉庫編碼、庫區(qū)編碼、庫位編碼等;④組織系列編碼,包括部門編碼、人員編碼、職務編碼等,⑤設備系列編碼,包括設備編碼、備品備件編碼等;⑥財務系列編碼,包括科目編碼;⑦工藝流程與裝置編碼等。

編碼的分類與取值是否科學合理直接關系到信息處理、檢索和傳輸?shù)淖詣踊脚c效率,信息編碼是否規(guī)范和標準影響和決定了信息的交流與共享等性能。因此,編碼必須遵循科學性、系統(tǒng)性、可擴展性、兼容性和綜合性等基本原則,從系統(tǒng)工程的角度出發(fā),把局部問題放在系統(tǒng)整體中考慮,達到全局優(yōu)化效果。遵循國際標準、國家標準、行業(yè)標準企業(yè)標準的原則,建立適合和滿足本企業(yè)管理需要的信息編碼體系和標準。只有信息分類編碼標準、統(tǒng)一,各信息系統(tǒng)才能夠有效地集成和共享。在編碼過程中,要遵循以下三個原則:首先要樹立整個企業(yè)一體化的思想,要求所有的編碼要站在整個企業(yè)的角度進行;其次,編碼既要考慮到現(xiàn)有的需求,也要結合未來的需求;第三,編碼要規(guī)范化。

(4)信息系統(tǒng)集成標準化

數(shù)據(jù)標準化也是信息系統(tǒng)集成項目中非常重要的一點,信息系統(tǒng)集成是一項具有知識密集、資料密集、工作量大等特點的系統(tǒng)工程,包括主要信息指標體系標準化、信息系統(tǒng)開發(fā)標準化、信息交換接口標準化等標準化工作。

①信息指標體系標準化信息指標體系是指一定范圍內(nèi)所有信息的標準,按其內(nèi)在聯(lián)系所組成的、科學的有機整體,它應具有目標性、集合性、可分解性、相關性、適應性和整體性等特征。在管理層次和管理部門眾多的情況下,只有統(tǒng)一和規(guī)范指標體系,才能使各系統(tǒng)和各個層次開發(fā)和實施的信息系統(tǒng)能夠?qū)崿F(xiàn)數(shù)據(jù)和信息的兼容與共享。

②信息系統(tǒng)開發(fā)標準化信息系統(tǒng)開發(fā)標準化主要指在系統(tǒng)開發(fā)中遵守統(tǒng)一的系統(tǒng)設計規(guī)范、程序開發(fā)規(guī)范和項目管理規(guī)范。系統(tǒng)設計規(guī)范定字段、數(shù)據(jù)庫、程序和文檔的命名規(guī)則和編制方法,應用程序界面的標準和風格等。程序開發(fā)規(guī)范對應用程序進行模塊劃分、標準程序流程的編寫、對象或變量命名、數(shù)據(jù)校驗及出錯處理等過程和方法做出規(guī)定。項目管理規(guī)范規(guī)定項目開發(fā)過程中各類問題(如設計問題、程序問題等)的處理規(guī)范和修改規(guī)則,文檔的編寫維護,在信息系統(tǒng)開發(fā)過程中,必須遵守軟件工程的設計規(guī)范,實現(xiàn)信息系統(tǒng)開發(fā)標準化。

③信息交換接口標準化目前有許多企業(yè)使用的各種應用系統(tǒng),大多是在不同的操作系統(tǒng)、數(shù)據(jù)庫系統(tǒng)、程序設計語言、硬件平臺和網(wǎng)絡環(huán)境下開發(fā)與運行的,這些應用系統(tǒng)在開發(fā)時并沒有考慮到企業(yè)數(shù)據(jù)的集成,造成企業(yè)內(nèi)部數(shù)據(jù)比較散亂,容易出現(xiàn)數(shù)據(jù)不一致的現(xiàn)象??梢哉f信息系統(tǒng)的質(zhì)量與接口的標準化密切相關,接口標準化已成為企業(yè)數(shù)據(jù)信息標準化的重要一環(huán)。信息交換接口標準化對信息系統(tǒng)內(nèi)部和信息系統(tǒng)之間各種軟件和硬件的接口與聯(lián)系方式,以及信息系統(tǒng)輸入和輸出的格式制定規(guī)范和標準,包括網(wǎng)絡的互聯(lián)標準和通信協(xié)議、各種數(shù)據(jù)庫的數(shù)據(jù)交換格式,不同信息系統(tǒng)之間數(shù)據(jù)的轉(zhuǎn)換方式等。

總之,兩化融合建設是一項長期的系統(tǒng)工程,兩化融合的出發(fā)點和落腳點是實現(xiàn)信息共享和管理信息化。沒有標準化,就不能實現(xiàn)信息共享;沒有卓有成效的信息管理,就沒有成功高效的業(yè)務流程,更建立不起來全企業(yè)的清潔生產(chǎn)管理與信息化的兩化融合系統(tǒng)。標準化是企業(yè)兩化融合建設的基礎性工作,直接影響兩化融合成敗,只有管好數(shù)據(jù)、用好數(shù)據(jù)。保證數(shù)據(jù)的唯一性、完整性、準確性、及時性,才能使兩化融合系統(tǒng)真正發(fā)揮出應有的作用。企業(yè)進行兩化融合工作,在加快基礎設施建設和信息系統(tǒng)建設的同時,必須同樣加強相關的標準化工作,不僅要為兩化融合提供硬件基礎,更要為兩化融合提供軟件保障。標準化是兩化融合的基礎,只有實現(xiàn)了標準化,才能充分保障兩化融合的健康,才能保障企業(yè)兩化融合建設的經(jīng)濟效益、支持企業(yè)的戰(zhàn)略發(fā)展。

評論  |   0條評論