數(shù)據(jù)挖掘
目錄
1.數(shù)據(jù)挖掘概述
數(shù)據(jù)挖掘(Data Mining,DM)又稱數(shù)據(jù)庫中的知識發(fā)現(xiàn)(Knowledge Discover in Database,KDD),是目前人工智能和數(shù)據(jù)庫領(lǐng)域研究的熱點問題,所謂數(shù)據(jù)挖掘是指從數(shù)據(jù)庫的大量數(shù)據(jù)中揭示出隱含的、先前未知的并有潛在價值的信息的非平凡過程。數(shù)據(jù)挖掘是一種決策支持過程,它主要基于人工智能、機器學習、模式識別、統(tǒng)計學、數(shù)據(jù)庫、可視化技術(shù)等,高度自動化地分析企業(yè)的數(shù)據(jù),做出歸納性的推理,從中挖掘出潛在的模式,幫助決策者調(diào)整市場策略,減少風險,做出正確的決策。
2.數(shù)據(jù)挖掘常用的方法
利用數(shù)據(jù)挖掘進行數(shù)據(jù)分析常用的方法主要有分類、回歸分析、聚類、關(guān)聯(lián)規(guī)則、特征、變化和偏差分析、Web頁挖掘等, 它們分別從不同的角度對數(shù)據(jù)進行挖掘。
①分類。分類是找出數(shù)據(jù)庫中一組數(shù)據(jù)對象的共同特點并按照分類模式將其劃分為不同的類,其目的是通過分類模型,將數(shù)據(jù)庫中的數(shù)據(jù)項映射到某個給定的類別。它可以應用到客戶的分類、客戶的屬性和特征分析、客戶滿意度分析、客戶的購買趨勢預測等,如一個汽車零售商將客戶按照對汽車的喜好劃分成不同的類,這樣營銷人員就可以將新型汽車的廣告手冊直接郵寄到有這種喜好的客戶手中,從而大大增加了商業(yè)機會。
②回歸分析?;貧w分析方法反映的是事務數(shù)據(jù)庫中屬性值在時間上的特征,產(chǎn)生一個將數(shù)據(jù)項映射到一個實值預測變量的函數(shù),發(fā)現(xiàn)變量或?qū)傩蚤g的依賴關(guān)系,其主要研究問題包括數(shù)據(jù)序列的趨勢特征、數(shù)據(jù)序列的預測以及數(shù)據(jù)間的相關(guān)關(guān)系等。它可以應用到市場營銷的各個方面,如客戶尋求、保持和預防客戶流失活動、產(chǎn)品生命周期分析、銷售趨勢預測及有針對性的促銷活動等。
③聚類。聚類分析是把一組數(shù)據(jù)按照相似性和差異性分為幾個類別,其目的是使得屬于同一類別的數(shù)據(jù)間的相似性盡可能大,不同類別中的數(shù)據(jù)間的相似性盡可能小。它可以應用到客戶群體的分類、客戶背景分析、客戶購買趨勢預測、市場的細分等。
④關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則是描述數(shù)據(jù)庫中數(shù)據(jù)項之間所存在的關(guān)系的規(guī)則,即根據(jù)一個事務中某些項的出現(xiàn)可導出另一些項在同一事務中也出現(xiàn),即隱藏在數(shù)據(jù)間的關(guān)聯(lián)或相互關(guān)系。在客戶關(guān)系管理中,通過對企業(yè)的客戶數(shù)據(jù)庫里的大量數(shù)據(jù)進行挖掘,可以從大量的記錄中發(fā)現(xiàn)有趣的關(guān)聯(lián)關(guān)系,找出影響市場營銷效果的關(guān)鍵因素,為產(chǎn)品定位、定價與定制客戶群,客戶尋求、細分與保持,市場營銷與推銷,營銷風險評估和詐騙預測等決策支持提供參考依據(jù)。
⑤特征。特征分析是從數(shù)據(jù)庫中的一組數(shù)據(jù)中提取出關(guān)于這些數(shù)據(jù)的特征式,這些特征式表達了該數(shù)據(jù)集的總體特征。如營銷人員通過對客戶流失因素的特征提取,可以得到導致客戶流失的一系列原因和主要特征,利用這些特征可以有效地預防客戶的流失。
⑥變化和偏差分析。偏差包括很大一類潛在有趣的知識,如分類中的反常實例,模式的例外,觀察結(jié)果對期望的偏差等,其目的是尋找觀察結(jié)果與參照量之間有意義的差別。在企業(yè)危機管理及其預警中,管理者更感興趣的是那些意外規(guī)則。意外規(guī)則的挖掘可以應用到各種異常信息的發(fā)現(xiàn)、分析、識別、評價和預警等方面。
⑦Web頁挖掘。隨著Internet的迅速發(fā)展及Web 的全球普及, 使得Web上的信息量無比豐富,通過對Web的挖掘,可以利用Web 的海量數(shù)據(jù)進行分析,收集政治、經(jīng)濟、政策、科技、金融、各種市場、競爭對手、供求信息、客戶等有關(guān)的信息,集中精力分析和處理那些對企業(yè)有重大或潛在重大影響的外部環(huán)境信息和內(nèi)部經(jīng)營信息,并根據(jù)分析結(jié)果找出企業(yè)管理過程中出現(xiàn)的各種問題和可能引起危機的先兆,對這些信息進行分析和處理,以便識別、分析、評價和管理危機。
3.數(shù)據(jù)挖掘的功能
數(shù)據(jù)挖掘通過預測未來趨勢及行為,做出前攝的、基于知識的決策。數(shù)據(jù)挖掘的目標是從數(shù)據(jù)庫中發(fā)現(xiàn)隱含的、有意義的知識,主要有以下五類功能。
1、自動預測趨勢和行為
數(shù)據(jù)挖掘自動在大型數(shù)據(jù)庫中尋找預測性信息,以往需要進行大量手工分析的問題如今可以迅速直接由數(shù)據(jù)本身得出結(jié)論。一個典型的例子是市場預測問題,數(shù)據(jù)挖掘使用過去有關(guān)促銷的數(shù)據(jù)來尋找未來投資中回報最大的用戶,其它可預測的問題包括預報破產(chǎn)以及認定對指定事件最可能作出反應的群體。
2、關(guān)聯(lián)分析
數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫中存在的一類重要的可被發(fā)現(xiàn)的知識。若兩個或多個變量的取值之間存在某種規(guī)律性,就稱為關(guān)聯(lián)。關(guān)聯(lián)可分為簡單關(guān)聯(lián)、時序關(guān)聯(lián)、因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián)網(wǎng)。有時并不知道數(shù)據(jù)庫中數(shù)據(jù)的關(guān)聯(lián)函數(shù),即使知道也是不確定的,因此關(guān)聯(lián)分析生成的規(guī)則帶有可信度。
3、聚類
數(shù)據(jù)庫中的記錄可被化分為一系列有意義的子集,即聚類。聚類增強了人們對客觀現(xiàn)實的認識,是概念描述和偏差分析的先決條件。聚類技術(shù)主要包括傳統(tǒng)的模式識別方法和數(shù)學分類學。80年代初,Mchalski提出了概念聚類技術(shù)牞其要點是,在劃分對象時不僅考慮對象之間的距離,還要求劃分出的類具有某種內(nèi)涵描述,從而避免了傳統(tǒng)技術(shù)的某些片面性。
4、概念描述
概念描述就是對某類對象的內(nèi)涵進行描述,并概括這類對象的有關(guān)特征。概念描述分為特征性描述和區(qū)別性描述,前者描述某類對象的共同特征,后者描述不同類對象之間的區(qū)別。生成一個類的特征性描述只涉及該類對象中所有對象的共性。生成區(qū)別性描述的方法很多,如決策樹方法、遺傳算法等。
5、偏差檢測
數(shù)據(jù)庫中的數(shù)據(jù)常有一些異常記錄,從數(shù)據(jù)庫中檢測這些偏差很有意義。偏差包括很多潛在的知識,如分類中的反常實例、不滿足規(guī)則的特例、觀測結(jié)果與模型預測值的偏差、量值隨時間的變化等。偏差檢測的基本方法是,尋找觀測結(jié)果與參照值之間有意義的差別。
4.數(shù)據(jù)挖掘常用技術(shù)
2、決策樹
3、遺傳算法
4、近鄰算法
5、規(guī)則推導
5.數(shù)據(jù)挖掘的流程
1、數(shù)據(jù)挖掘環(huán)境
數(shù)據(jù)挖掘是指一個完整的過程,該過程從大型數(shù)據(jù)庫中挖掘先前未知的,有效的,可實用的信息,并使用這些信息做出決策或豐富知識. 數(shù)據(jù)挖掘環(huán)境可示意如下圖:
數(shù)據(jù)挖掘環(huán)境框圖.gif
2、數(shù)據(jù)挖掘過程圖
下圖描述了數(shù)據(jù)挖掘的基本過程和主要步驟
數(shù)據(jù)挖掘的基本過程和主要步驟
3、數(shù)據(jù)挖掘過程工作量
在數(shù)據(jù)挖掘中被研究的業(yè)務對象是整個過程的基礎(chǔ),它驅(qū)動了整個數(shù)據(jù)挖掘過程,也是檢驗最后結(jié)果和指引分析人員完成數(shù)據(jù)挖掘的依據(jù)和顧問.圖2各步驟是按一定順序完成的,當然整個過程中還會存在步驟間的反饋.數(shù)據(jù)挖掘的過程并不是自動的,絕大多數(shù)的工作需要人工完成.圖3給出了各步驟在整個過程中的工作量之比.可以看到,60%的時間用在數(shù)據(jù)準備上,這說明了數(shù)據(jù)挖掘?qū)?shù)據(jù)的嚴格要求,而后挖掘工作僅占總工作量的10%.
圖3數(shù)據(jù)挖掘過程工作量比例
4、數(shù)據(jù)挖掘過程簡介
過程中各步驟的大體內(nèi)容如下:
(1). 確定業(yè)務對象
清晰地定義出業(yè)務問題,認清數(shù)據(jù)挖掘的目的是數(shù)據(jù)挖掘的重要一步.挖掘的最后結(jié)構(gòu)是不可預測的,但要探索的問題應是有預見的,為了數(shù)據(jù)挖掘而數(shù)據(jù)挖掘則帶有盲目性,是不會成功的.
(2). 數(shù)據(jù)準備
1)、數(shù)據(jù)的選擇
搜索所有與業(yè)務對象有關(guān)的內(nèi)部和外部數(shù)據(jù)信息,并從中選擇出適用于數(shù)據(jù)挖掘應用的數(shù)據(jù).
2)、數(shù)據(jù)的預處理
研究數(shù)據(jù)的質(zhì)量,為進一步的分析作準備.并確定將要進行的挖掘操作的類型.
3)、數(shù)據(jù)的轉(zhuǎn)換
將數(shù)據(jù)轉(zhuǎn)換成一個分析模型.這個分析模型是針對挖掘算法建立的.建立一個真正適合挖掘算法的分析模型是數(shù)據(jù)挖掘成功的關(guān)鍵.
(3). 數(shù)據(jù)挖掘
對所得到的經(jīng)過轉(zhuǎn)換的數(shù)據(jù)進行挖掘.除了完善從選擇合適的挖掘算法外,其余一切工作都能自動地完成.
(4). 結(jié)果分析
解釋并評估結(jié)果.其使用的分析方法一般應作數(shù)據(jù)挖掘操作而定,通常會用到可視化技術(shù).
(5). 知識的同化
將分析所得到的知識集成到業(yè)務信息系統(tǒng)的組織結(jié)構(gòu)中去.
5、數(shù)據(jù)挖掘需要的人員
數(shù)據(jù)挖掘過程的分步實現(xiàn),不同的步會需要是有不同專長的人員,他們大體可以分為三類.
業(yè)務分析人員:要求精通業(yè)務,能夠解釋業(yè)務對象,并根據(jù)各業(yè)務對象確定出用于數(shù)據(jù)定義和挖掘算法的業(yè)務需求.
數(shù)據(jù)分析人員:精通數(shù)據(jù)分析技術(shù),并對統(tǒng)計學有較熟練的掌握,有能力把業(yè)務需求轉(zhuǎn)化為數(shù)據(jù)挖掘的各步操作,并為每步操作選擇合適的技術(shù).
數(shù)據(jù)管理人員:精通數(shù)據(jù)管理技術(shù),并從數(shù)據(jù)庫或數(shù)據(jù)倉庫中收集數(shù)據(jù).
從上可見,數(shù)據(jù)挖掘是一個多種專家合作的過程,也是一個在資金上和技術(shù)上高投入的過程.這一過程要反復進行牞在反復過程中,不斷地趨近事物的本質(zhì),不斷地優(yōu)先問題的解決方案。數(shù)據(jù)重組和細分添加和拆分記錄選取數(shù)據(jù)樣本可視化數(shù)據(jù)探索聚類分析神經(jīng)網(wǎng)絡、決策樹數(shù)理統(tǒng)計、時間序列結(jié)論綜合解釋評價數(shù)據(jù)知識數(shù)據(jù)取樣數(shù)據(jù)探索數(shù)據(jù)調(diào)整模型化評價。
6.數(shù)據(jù)挖掘與傳統(tǒng)分析方法的區(qū)別
數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析(如查詢、報表、聯(lián)機應用分析)的本質(zhì)區(qū)別是數(shù)據(jù)挖掘是在沒有明確假設的前提下去挖掘信息、發(fā)現(xiàn)知識.數(shù)據(jù)挖掘所得到的信息應具有先未知,有效和可實用三個特征.
先前未知的信息是指該信息是預先未曾預料到的,既數(shù)據(jù)挖掘是要發(fā)現(xiàn)那些不能靠直覺發(fā)現(xiàn)的信息或知識,甚至是違背直覺的信息或知識,挖掘出的信息越是出乎意料,就可能越有價值.在商業(yè)應用中最典型的例子就是一家連鎖店通過數(shù)據(jù)挖掘發(fā)現(xiàn)了小孩尿布和啤酒之間有著驚人的聯(lián)系.
7.數(shù)據(jù)挖掘和數(shù)據(jù)倉庫
大部分情況下,數(shù)據(jù)挖掘都要先把數(shù)據(jù)從數(shù)據(jù)倉庫中拿到數(shù)據(jù)挖掘庫或數(shù)據(jù)集市中(見圖1)。從數(shù)據(jù)倉庫中直接得到進行數(shù)據(jù)挖掘的數(shù)據(jù)有許多好處。就如我們后面會講到的,數(shù)據(jù)倉庫的數(shù)據(jù)清理和數(shù)據(jù)挖掘的數(shù)據(jù)清理差不多,如果數(shù)據(jù)在導入數(shù)據(jù)倉庫時已經(jīng)清理過,那很可能在做數(shù)據(jù)挖掘時就沒必要在清理一次了,而且所有的數(shù)據(jù)不一致的問題都已經(jīng)被你解決了。
數(shù)據(jù)挖掘庫可能是你的數(shù)據(jù)倉庫的一個邏輯上的子集,而不一定非得是物理上單獨的數(shù)據(jù)庫。但如果你的數(shù)據(jù)倉庫的計算資源已經(jīng)很緊張,那你最好還是建立一個單獨的數(shù)據(jù)挖掘庫。
當然為了數(shù)據(jù)挖掘你也不必非得建立一個數(shù)據(jù)倉庫,數(shù)據(jù)倉庫不是必需的。建立一個巨大的數(shù)據(jù)倉庫,把各個不同源的數(shù)據(jù)統(tǒng)一在一起,解決所有的數(shù)據(jù)沖突問題,然后把所有的數(shù)據(jù)導到一個數(shù)據(jù)倉庫內(nèi),是一項巨大的工程,可能要用幾年的時間花上百萬的錢才能完成。只是為了數(shù)據(jù)挖掘,你可以把一個或幾個事務數(shù)據(jù)庫導到一個只讀的數(shù)據(jù)庫中,就把它當作數(shù)據(jù)集市,然后在他上面進行數(shù)據(jù)挖掘。
8.數(shù)據(jù)挖掘和在線分析處理(OLAP)
一個經(jīng)常問的問題是,數(shù)據(jù)挖掘和OLAP到底有何不同。下面將會解釋,他們是完全不同的工具,基于的技術(shù)也大相徑庭。
OLAP是決策支持領(lǐng)域的一部分。傳統(tǒng)的查詢和報表工具是告訴你數(shù)據(jù)庫中都有什么(what happened),OLAP則更進一步告訴你下一步會怎么樣(What next)、和如果我采取這樣的措施又會怎么樣(What if)。用戶首先建立一個假設,然后用OLAP檢索數(shù)據(jù)庫來驗證這個假設是否正確。比如,一個分析師想找到什么原因?qū)е铝速J款拖欠,他可能先做一個初始的假定,認為低收入的人信用度也低,然后用OLAP來驗證他這個假設。如果這個假設沒有被證實,他可能去察看那些高負債的賬戶,如果還不行,他也許要把收入和負債一起考慮,一直進行下去,直到找到他想要的結(jié)果或放棄。
也就是說,OLAP分析師是建立一系列的假設,然后通過OLAP來證實或推翻這些假設來最終得到自己的結(jié)論。OLAP分析過程在本質(zhì)上是一個演繹推理的過程。但是如果分析的變量達到幾十或上百個,那么再用OLAP手動分析驗證這些假設將是一件非常困難和痛苦的事情。
數(shù)據(jù)挖掘與OLAP不同的地方是,數(shù)據(jù)挖掘不是用于驗證某個假定的模式(模型)的正確性,而是在數(shù)據(jù)庫中自己尋找模型。他在本質(zhì)上是一個歸納的過程。比如,一個用數(shù)據(jù)挖掘工具的分析師想找到引起貸款拖欠的風險因素。數(shù)據(jù)挖掘工具可能幫他找到高負債和低收入是引起這個問題的因素,甚至還可能發(fā)現(xiàn)一些分析師從來沒有想過或試過的其他因素,比如年齡。
數(shù)據(jù)挖掘和OLAP具有一定的互補性。在利用數(shù)據(jù)挖掘出來的結(jié)論采取行動之前,你也許要驗證一下如果采取這樣的行動會給公司帶來什么樣的影響,那么OLAP工具能回答你的這些問題。
而且在知識發(fā)現(xiàn)的早期階段,OLAP工具還有其他一些用途??梢詭湍闾剿鲾?shù)據(jù),找到哪些是對一個問題比較重要的變量,發(fā)現(xiàn)異常數(shù)據(jù)和互相影響的變量。這都能幫你更好的理解你的數(shù)據(jù),加快知識發(fā)現(xiàn)的過程。
9.數(shù)據(jù)挖掘,機器學習和統(tǒng)計
數(shù)據(jù)挖掘利用了人工智能(AI)和統(tǒng)計分析的進步所帶來的好處。這兩門學科都致力于模式發(fā)現(xiàn)和預測。
數(shù)據(jù)挖掘不是為了替代傳統(tǒng)的統(tǒng)計分析技術(shù)。相反,他是統(tǒng)計分析方法學的延伸和擴展。大多數(shù)的統(tǒng)計分析技術(shù)都基于完善的數(shù)學理論和高超的技巧,預測的準確度還是令人滿意的,但對使用者的要求很高。而隨著計算機計算能力的不斷增強,我們有可能利用計算機強大的計算能力只通過相對簡單和固定的方法完成同樣的功能。
一些新興的技術(shù)同樣在知識發(fā)現(xiàn)領(lǐng)域取得了很好的效果,如神經(jīng)元網(wǎng)絡和決策樹,在足夠多的數(shù)據(jù)和計算能力下,他們幾乎不用人的關(guān)照自動就能完成許多有價值的功能。
數(shù)據(jù)挖掘就是利用了統(tǒng)計和人工智能技術(shù)的應用程序,他把這些高深復雜的技術(shù)封裝起來,使人們不用自己掌握這些技術(shù)也能完成同樣的功能,并且更專注于自己所要解決的問題。
10.軟硬件發(fā)展對數(shù)據(jù)挖掘的影響
使數(shù)據(jù)挖掘這件事情成為可能的關(guān)鍵一點是計算機性能價格比的巨大進步。在過去的幾年里磁盤存儲器的價格幾乎降低了99%,這在很大程度上改變了企業(yè)界對數(shù)據(jù)收集和存儲的態(tài)度。如果每兆的價格是¥10,那存放1TB的價格是¥10,000,000,但當每兆的價格降為1毛錢時,存儲同樣的數(shù)據(jù)只有¥100,000!
計算機計算能力價格的降低同樣非常顯著。每一代芯片的誕生都會把CPU的計算能力提高一大步。內(nèi)存RAM也同樣降價迅速,幾年之內(nèi)每兆內(nèi)存的價格由幾百塊錢降到現(xiàn)在只要幾塊錢。通常PC都有64M內(nèi)存,工作站達到了256M,擁有上G內(nèi)存的服務器已經(jīng)不是什么新鮮事了。
在單個CPU計算能力大幅提升的同時,基于多個CPU的并行系統(tǒng)也取得了很大的進步。目前幾乎所有的服務器都支持多個CPU,這些SMP服務器簇甚至能讓成百上千個CPU同時工作。
基于并行系統(tǒng)的數(shù)據(jù)庫管理系統(tǒng)也給數(shù)據(jù)挖掘技術(shù)的應用帶來了便利。如果你有一個龐大而復雜的數(shù)據(jù)挖掘問題要求通過訪問數(shù)據(jù)庫取得數(shù)據(jù),那么效率最高的辦法就是利用一個本地的并行數(shù)據(jù)庫。
所有這些都為數(shù)據(jù)挖掘的實施掃清了道路,隨著時間的延續(xù),我們相信這條道路會越來越平坦。
11.數(shù)據(jù)挖掘在企業(yè)危機管理中的應用
危機管理是管理領(lǐng)域新出現(xiàn)的一個熱點研究領(lǐng)域,它是以市場競爭中危機的出現(xiàn)為研究起點,分析企業(yè)危機產(chǎn)生的原因和過程,研究企業(yè)預防危機、應付危機、解決危機的手段和策略,以增強企業(yè)的免疫力、應變力和競爭力,使管理者能夠及時準確地獲取所需要的信息,迅速捕捉到企業(yè)可能發(fā)生危機的一切可能事件和先兆,進而采取有效的規(guī)避措施,在危機發(fā)生之前對其進行控制,趨利避害,從而使企業(yè)能夠適應迅速變化的市場環(huán)境,保持長久的競爭優(yōu)勢。但是由于危機產(chǎn)生的原因復雜,種類繁多,許多因素難以量化,而且危機管理中帶有大量不確定因素的半結(jié)構(gòu)化問題和非結(jié)構(gòu)化問題,很多因素由于沒有歷史數(shù)據(jù)和相應的統(tǒng)計資料,很難進行科學地計算和評估,因此需要應用其它技術(shù)和方法來加強企業(yè)的危機管理工作。
隨著計算機技術(shù)、網(wǎng)絡技術(shù)、通訊技術(shù)、Internet技術(shù)的迅速發(fā)展和電子商務、辦公自動化、管理信息系統(tǒng)、Internet 的普及等,企業(yè)業(yè)務操作流程日益自動化,企業(yè)經(jīng)營過程中產(chǎn)生了大量的數(shù)據(jù),這些數(shù)據(jù)和由此產(chǎn)生的信息是企業(yè)的寶貴財富,它如實地記錄著企業(yè)經(jīng)營的本質(zhì)狀況。但是面對如此大量的數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)分析方法,如數(shù)據(jù)檢索、統(tǒng)計分析等只能獲得數(shù)據(jù)的表層信息,不能獲得其內(nèi)在的、深層次的信息,管理者面臨著數(shù)據(jù)豐富而知識貧乏的困境。如何從這些數(shù)據(jù)中挖掘出對企業(yè)經(jīng)營決策有用的知識是非常重要的,數(shù)據(jù)挖掘便是為適應這種需要應運而生的。
數(shù)據(jù)挖掘是一種新的信息處理技術(shù),其主要特點是對企業(yè)數(shù)據(jù)庫中的大量業(yè)務數(shù)據(jù)進行抽取、轉(zhuǎn)換、分析和其他模型化處理,從中提取輔助經(jīng)營決策的關(guān)鍵性數(shù)據(jù),它在企業(yè)危機管理中得到了比較普遍的應用,具體可以應用到以下幾個方面。
1.利用Web頁挖掘搜集外部環(huán)境信息
信息是危機管理的關(guān)鍵因素。在危機管理過程中,可以利用Web 頁挖掘技術(shù)對企業(yè)外部環(huán)境信息進行收集、整理和分析,盡可能地收集政治、經(jīng)濟、政策、科技、金融、各種市場、競爭對手、供求信息、消費者等與企業(yè)發(fā)展有關(guān)的信息,集中精力分析處理那些對企業(yè)發(fā)展有重大或潛在重大影響的外部環(huán)境信息,抓住轉(zhuǎn)瞬即逝的市場機遇,獲得企業(yè)危機的先兆信息,采取有效措施規(guī)避危機,促使企業(yè)健康、持續(xù)地發(fā)展。
2.利用數(shù)據(jù)挖掘分析企業(yè)經(jīng)營信息
利用數(shù)據(jù)挖掘技術(shù)、數(shù)據(jù)倉庫技術(shù)和聯(lián)機分析技術(shù),管理者能夠充分利用企業(yè)數(shù)據(jù)倉庫中的海量數(shù)據(jù)進行分析,并根據(jù)分析結(jié)果找出企業(yè)經(jīng)營過程中出現(xiàn)的各種問題和可能引起危機的先兆,如經(jīng)營不善、觀念滯后、產(chǎn)品失敗、戰(zhàn)略決策失誤、財務危機等內(nèi)部因素引起企業(yè)人、財、物、產(chǎn)、供、銷的相對和諧平衡體遭到重大破壞,對企業(yè)的生存、發(fā)展構(gòu)成嚴重威脅的信息,及時做出正確的決策,調(diào)整經(jīng)營戰(zhàn)略,以適應不斷變化的市場需求。
3.利用數(shù)據(jù)挖掘識別、分析和預防危機
危機管理的精髓在于預防。利用數(shù)據(jù)挖掘技術(shù)對企業(yè)經(jīng)營的各方面的風險、威脅和危險進行識別和分析,如產(chǎn)品質(zhì)量和責任、環(huán)境、健康和人身安全、財務、營銷、自然災害、經(jīng)營欺詐、人員及計算機故障等,對每一種風險進行分類,并決定如何管理各類風險;準確地預測企業(yè)所面臨的各種風險,并對每一種風險、威脅和危險的大小及發(fā)生概率進行評價,建立各類風險管理的優(yōu)先次序,以有限的資源、時間和資金來管理最嚴重的一種或某幾類風險;制定危機管理的策略和方法,擬定危機應急計劃和危機管理隊伍,做好危機預防工作。
4.利用數(shù)據(jù)挖掘技術(shù)改善客戶關(guān)系管理
客戶滿意度歷來就是衡量一個企業(yè)服務質(zhì)量好壞的重要尺度,特別是當客戶的反饋意見具有廣泛效應的時候更是如此。目前很多企業(yè)利用營銷中心、新聞組、 BBS以及呼叫中心等收集客戶的投訴和意見,并對這些投訴和意見進行分析,以發(fā)現(xiàn)客戶關(guān)系管理中存在的問題,如果有足夠多的客戶都在抱怨同一個問題,管理者就有理由對其展開調(diào)查,為企業(yè)及時捕捉到發(fā)生危機的一切可能事件和先兆,從而挽救客戶關(guān)系,避免經(jīng)營危機。
5.利用數(shù)據(jù)挖掘進行信用風險分析和欺詐甄別
客戶信用風險分析和欺詐行為預測對企業(yè)的財務安全是非常重要的,使用企業(yè)信息系統(tǒng)中數(shù)據(jù)庫的數(shù)據(jù),利用數(shù)據(jù)挖掘中的變化和偏差分析技術(shù)進行客戶信用風險分析和欺詐行為預測,分析這些風險為什么會發(fā)生?哪些因素會導致這些風險?這些風險主要來自于何處?如何預測到可能發(fā)生的風險?采取何種措施減少風險的發(fā)生?通過評價這些風險的嚴重性、發(fā)生的可能性及控制這些風險的成本,匯總對各種風險的評價結(jié)果,進而建立一套信用風險管理的戰(zhàn)略和監(jiān)督體系,設計并完善信用風險管理能力,準確、及時地對各種信用風險進行監(jiān)視、評價、預警和管理,進而采取有效的規(guī)避和監(jiān)督措施,在信用風險發(fā)生之前對其進行預警和控制,趨利避害,做好信用風險的防范工作。
6.利用數(shù)據(jù)挖掘控制危機
危機一旦爆發(fā),來勢迅猛,損失嚴重,因此危機發(fā)生以后,要采取有力的措施控制危機,管理者可以利用先進的信息技術(shù)如基于Web 的挖掘技術(shù)、各種搜索引擎工具、E-mail自動處理工具、基于人工智能的信息內(nèi)容的自動分類、聚類以及基于深層次自然語言理解的知識檢索、問答式知識檢索系統(tǒng)等快速地獲取危機管理所需要的各種信息,以便向客戶、社區(qū)、新聞界發(fā)布有關(guān)的危機管理信息,并在各種媒體尤其是公司的網(wǎng)站上公布企業(yè)的詳細風險防御和危機管理計劃,使全體員工能夠及時獲取危機管理信息及危機最新的進展情況。這樣企業(yè)的高層管理人員、公關(guān)人員、危機管理人員和全體員工就能隨時有準備地應付任何復雜情況和危急形勢的壓力,對出現(xiàn)的危機立即做出反應,使危機的損失降到最低。
危機就是危險和機遇,企業(yè)的每一次危機既包含了導致失敗的根源,又蘊藏著成功的種子,發(fā)現(xiàn)、培育,進而收獲潛在的成功機會,就是危機管理的精髓;而錯誤地估計形勢,并令事態(tài)進一步惡化,則是不良危機管理的典型特征。企業(yè)應加強危機管理工作,利用先進的數(shù)據(jù)挖掘技術(shù)加強企業(yè)的危機管理工作,以便準確及時地獲取所需要的危機信息,迅速捕捉到企業(yè)可能發(fā)生危機的一切事件和征兆,進而采取有效的規(guī)避措施,在危機發(fā)生之前對其進行控制,趨利避害,從而使企業(yè)能夠適應迅速變化的市場環(huán)境,保持長久的競爭優(yōu)勢,實現(xiàn)可持續(xù)發(fā)展戰(zhàn)略。