登錄

知識工程

1.知識工程的提出

1977年美國斯坦福大學(xué)計(jì)算機(jī)科學(xué)家費(fèi)根鮑姆教授(B.A.Feigenbaum)在第五屆國際人工智能會議—提出知識工程的新概念。他認(rèn)為,“知識工程是人工智能的原理和方法,對那些需要專家知識才能解決的應(yīng)用難題提供求解的手段。恰當(dāng)運(yùn)用專家知識的獲取、表達(dá)和推理過程的構(gòu)成與解釋,是設(shè)計(jì)基于知識的系統(tǒng)的重要技術(shù)問題?!边@類以知識為基礎(chǔ)的系統(tǒng),就是通過智能軟件而建立的專家系統(tǒng)。

人們對知識工程的理解,一般局限于專家系統(tǒng)范圍內(nèi)。在費(fèi)根鮑姆教授近著《第五代計(jì)算機(jī):人工智能和日本計(jì)算機(jī)對世界的挑戰(zhàn)》(1983年9月)中提到,“知識工程”一詞在日本人那里很吃香,因?yàn)樵谌毡?,工程技術(shù)人員有很高的地位;但是在英國,工程技術(shù)人員不享受這樣的榮譽(yù),人們主張使用“專家系統(tǒng)”這個(gè)詞。我們認(rèn)為,知識工程是一門以知識為研究對象的新興學(xué)科,它將具體智能系統(tǒng)研究中那些共同的基本問題抽出來,作為知識工程的核心內(nèi)容,使之成為指導(dǎo)具體研制各類智能系統(tǒng)的一般方法和基本工具,成為一門具有方法論意義的科學(xué)。在1984年8月全國第五代計(jì)算機(jī)專家討論會上,史忠植提出:“知識工程是研究知識信息處理的學(xué)科,提供開發(fā)智能系統(tǒng)的技術(shù),是人工智能、數(shù)據(jù)庫技術(shù)、數(shù)理邏輯、認(rèn)知科學(xué);心理學(xué)等學(xué)科交叉發(fā)展的結(jié)果”

知識工程可以看成是人工智能在知識信息處理方面的發(fā)展,研究如何由計(jì)算機(jī)表示知識,進(jìn)行問題的自動求解。知識工程的研究使人工智能的研究從理論轉(zhuǎn)向應(yīng)用,從基于推理的模型轉(zhuǎn)向基于知識的模型,包括了整個(gè)知識信息處理的研究,知識工程已成為一門新興的邊緣學(xué)科。

21 世紀(jì)人類全面進(jìn)入信息時(shí)代。信息科學(xué)技術(shù)促進(jìn)了勞動資料信息屬性的發(fā)展,從而促使科學(xué)技術(shù)與生產(chǎn)力比過去更加緊密地凝結(jié)在一起,構(gòu)成我們這個(gè)時(shí)代社會經(jīng)濟(jì)發(fā)展的新的特征,具有劃時(shí)代的意義。它以計(jì)算機(jī)、網(wǎng)絡(luò)和通信相結(jié)合的形式,體現(xiàn)在變革社會協(xié)作方式的推動力量中。信息化的必然趨勢是智能化,它將使世界經(jīng)濟(jì)從工業(yè)化階段進(jìn)入知識經(jīng)濟(jì)階段,即將物質(zhì)生產(chǎn)和知識生產(chǎn)結(jié)合起來,充分利用知識和信息資源,提高產(chǎn)品的知識含量。知識和技術(shù)密集型產(chǎn)業(yè)將取代勞動密集型產(chǎn)業(yè)。

2005 年陸汝鈐提出知件的概念。通過知件的形式,我們可以把軟件中的知識含量分離出來,使軟件和知件成為兩種不同的研究對象和兩種不同的商品,使硬件、軟件和知件在IT產(chǎn)業(yè)中三足鼎立。知件就是獨(dú)立的、計(jì)算機(jī)可操作的、商品化的、可被某一類軟件調(diào)用的知識模塊。發(fā)展知識經(jīng)濟(jì)必然導(dǎo)致知識產(chǎn)業(yè)的建立,其關(guān)鍵要研究知件工程。

把知識產(chǎn)業(yè)看成是通過計(jì)算機(jī)、網(wǎng)絡(luò)等現(xiàn)代信息設(shè)備大規(guī)模地生產(chǎn)知識的產(chǎn)業(yè),可以把它分成三個(gè)層次:它的核心部分是知件產(chǎn)業(yè);包含核心部分在內(nèi)的中間部分是通過計(jì)算機(jī)和網(wǎng)絡(luò)生產(chǎn)知識的產(chǎn)業(yè);包含中間部分在內(nèi)的最廣義定義是知識的生產(chǎn)、加工處理和傳播產(chǎn)業(yè)。

知識產(chǎn)業(yè)的興起是后工業(yè)化社會的特征。在后工業(yè)化社會中,社會的主要功能從生產(chǎn)(制造)貨物轉(zhuǎn)向了知識經(jīng)濟(jì),理論知識、技術(shù)和信息成了商品的主要形式。當(dāng)前許多人把知識產(chǎn)業(yè)與知識服務(wù)緊密相聯(lián)。

2.知識工程的發(fā)展

(1)1965至1974年——實(shí)驗(yàn)性系統(tǒng)時(shí)期

DENDRAL系統(tǒng)標(biāo)志著“專家系統(tǒng)”的誕生

(2)1975至1980年——MYCIN時(shí)期

MYCIN專家系統(tǒng)是規(guī)范性計(jì)算機(jī)專家系統(tǒng)的代表

(3)1980年以來——知識工程的“產(chǎn)品”在產(chǎn)業(yè)部門開始應(yīng)用的時(shí)期

3.知識管理與知識工程的比較[1]

1、知識管理與知識工程的學(xué)科學(xué)派對比分析

知識管理的研究非常熱,知識管理的概念也非常多,不同的概念認(rèn)知反映出不同的學(xué)派。厄爾分析了知識管理的七個(gè)學(xué)派,包括系統(tǒng)學(xué)派、制圖學(xué)派、工程學(xué)派、商業(yè)學(xué)派、組織學(xué)派、空間學(xué)派和戰(zhàn)略學(xué)派。賓尼把知識管理分為溝通型、分析型、資產(chǎn)管理型、過程型、開發(fā)型和創(chuàng)新型六種類型 。左美云把知識管理研究歸納為三個(gè)學(xué)派,包括技術(shù)學(xué)派、行為學(xué)派和綜合學(xué)派 ;吳金??偨Y(jié)出知識管理的四大學(xué)派,包括IT技術(shù)學(xué)派、組織行為學(xué)派、戰(zhàn)略管理學(xué)派、知識工程學(xué)派。盛小平總結(jié)了八個(gè)學(xué)派,包括認(rèn)識論學(xué)派、戰(zhàn)略管理學(xué)派、知識創(chuàng)新學(xué)派、空間學(xué)派、信息技術(shù)學(xué)派、組織行為學(xué)派、知識工程學(xué)派和綜合學(xué)派。這些學(xué)派總體上分為兩類,一類是企業(yè)知識管理學(xué)派,關(guān)注知識的轉(zhuǎn)化與共享,重點(diǎn)關(guān)注隱性知識顯性化,以提高企業(yè)核心競爭力為目標(biāo),如文獻(xiàn),屬于管理科學(xué)。第二類是圖書館知識管理學(xué)派,以知識的序化為目標(biāo),提高知識組織的有序性,從而提高知識服務(wù)水平,屬于圖書館學(xué)。知識管理的研究集中在企業(yè)管理、圖書館學(xué)與情報(bào)學(xué)領(lǐng)域。圖書館的知識管理分為兩類,一類是以知識序化為目標(biāo)的知識管理,一類是以知識共享與轉(zhuǎn)化為目標(biāo)的知識管理。前者重視資源的建設(shè),管理的核心是資源。后者把圖書館作為一個(gè)具體的機(jī)構(gòu)進(jìn)行知識管理,管理的核心是人。但無論哪種學(xué)派,重組織輕技術(shù)是知識管理的典型特點(diǎn)。

知識工程在國內(nèi)的研究集中在計(jì)算機(jī)科學(xué)與人工智能領(lǐng)域,如中科院的陸汝鈐研究員對知識工程、知識科學(xué)進(jìn)行深入研究,中科院的史忠植研究員對知識發(fā)現(xiàn)進(jìn)行了深入研究 ,北京科技大學(xué)的楊炳儒教授主要從邏輯的角度對知識工程進(jìn)行深入研究,浙江大學(xué)潘云鶴教授等從形象思維方面人手,運(yùn)用心象思維理論,研究了語義知識與圖形圖像之間的轉(zhuǎn)換 ,石純一等教授研究了基于Agent的KQML(Knowledge Query and Manipulation Language,知識查詢操作語言)知識操作。無論哪派知識工程,重技術(shù)輕組織是知識工程的共同特征。知識工程的根本目的是為了解決人工智能特別是專家系統(tǒng)中知識獲取的問題。

把知識工程包含于知識管理或把知識管理包含于知識工程都是不可取的,知識管理更多地關(guān)注人的因素,屬于管理范疇;知識工程更多地關(guān)注技術(shù)的實(shí)現(xiàn),屬于技術(shù)范疇。因此,無論從目標(biāo)、處理手段與方法、應(yīng)用領(lǐng)域、學(xué)科范疇等各個(gè)方面來講,知識管理與知識工程都有著很大的不同,是完全不同的兩個(gè)研究領(lǐng)域。

2、知識管理與知識工程核心內(nèi)容對比分析

知識管理主要包括知識轉(zhuǎn)化與知識序化。知識轉(zhuǎn)化是知識共享的過程,同時(shí)知識共享也是知識轉(zhuǎn)化的前提。知識管理中的知識轉(zhuǎn)化包括四個(gè)方面,從隱性知識到隱性知識的社會化過程;從隱性知識到顯性知識的外化過程;從顯性知識到顯性知識的綜合過程;從顯性知識到隱性知識的內(nèi)化過程,這些轉(zhuǎn)化主要是知識存在形態(tài)以及附著主體的變化。知識管理中的知識組織以知識的序化為主,包括分類、檢索、排序等操作。傳統(tǒng)的知識組織借助文獻(xiàn)單元的方法,依據(jù)檢索語言中的結(jié)構(gòu)模式,采用分類法、標(biāo)題法、單元詞法、關(guān)鍵詞法和敘詞法,并在這些方法的基礎(chǔ)上編制出各種目錄、索引、文獻(xiàn)等。以關(guān)鍵詞或主題詞來實(shí)現(xiàn)知識從物理層次的文獻(xiàn)單元向認(rèn)知層次的知識單元轉(zhuǎn)化是不現(xiàn)實(shí)的,因?yàn)樵~單元不足以完整地反映知識,能夠完整地反映知識應(yīng)該至少是句子層次的。知識地圖揭示知識源以及知識之間的關(guān)系,它指向知識而不包含知識本身,是一個(gè)向?qū)Ф皇且粋€(gè)知識的集合 。所以知識地圖實(shí)際上是知識的索引。但是知識地圖不具備地理坐標(biāo)這一基本屬性。

知識管理不僅是獲取、組織與檢索信息的問題,還涉及數(shù)據(jù)挖掘、文本聚類、數(shù)據(jù)庫與文檔等問題。知識與人類認(rèn)知的密切相關(guān)性,決定了知識管理定位在錯(cuò)綜復(fù)雜的結(jié)構(gòu)化的內(nèi)容處理上。知識管理中的知識組織以自然語言的方式描述知識,知識的粒度并不統(tǒng)一,有大有小,大到一篇文獻(xiàn),小到一個(gè)知識點(diǎn)。

知識工程是以知識為處理對象,借用工程化的思想,利用人工智能的原理、方法和技術(shù),設(shè)計(jì)、構(gòu)造和維護(hù)知識型系統(tǒng)的一門學(xué)科,人們一般認(rèn)為知識工程是人工智能的一個(gè)應(yīng)用分支 。知識工程包括知識獲取、知識表示與知識利用三大過程。知識獲取有三種方式:非自動知識獲取、知識抽取、機(jī)器學(xué)習(xí)知識。非自動知識獲取由知識工程師通過閱讀有關(guān)文獻(xiàn)或與領(lǐng)域?qū)<医涣?,獲取原始知識并進(jìn)行分析、歸納、整理,形成用自然語言表述的知識條目輸入到數(shù)據(jù)庫中。知識抽取是對蘊(yùn)含于文本文獻(xiàn)中的知識進(jìn)行識別、理解、篩選、格式化,把文獻(xiàn)的每個(gè)知識點(diǎn)抽取出來,以一定形式存人知識庫中。機(jī)器學(xué)習(xí)知識通過機(jī)器的視覺、聽覺等途徑,直接感知外部世界,輸入自然信息,獲取感性和理性知識,或者根據(jù)系統(tǒng)運(yùn)行經(jīng)驗(yàn)從已有的知識或?qū)嵗醒堇[、歸納出新知識,補(bǔ)充到知識庫中。非自動知識獲取效率較低,機(jī)器學(xué)習(xí)知識難度太大,而知識抽取是知識獲取的最有效方式。知識抽取是知識獲取的三種方式之一,知識獲取是知識工程的三大步驟之一(包括知識獲取、知識表示與知識利用),因此知識抽取是知識工程的最有效方式。

本體研究的出現(xiàn)為知識工程的研究注入了新的活力,但是本體在知識工程中究竟扮演什么樣的角色呢?本體是知識表示的一種方式?本體工程將取代知識工程?本體(ontology)其實(shí)就是一種充分復(fù)雜的詞表,有了本體固然可以解決很多問題,但本體如何來獲取仍然是一大難點(diǎn),正如知識獲取一直是人工智能的瓶頸問題。本體的獲取有三種方式:手工構(gòu)建、詞表轉(zhuǎn)換、自動獲取。而本體論(Ontology)是一種認(rèn)知論。本體的表示語言比知識表示語言更具體,具有更強(qiáng)的可操作性。

知識表示有九種方法,分別為:介謂詞邏輯表示、產(chǎn)生式表示法、框架表示法、腳本表示法、過程表示法、語義網(wǎng)表示法、Petri網(wǎng)表示法、面向?qū)ο蟊硎痉ā?。不同的知識類型使用不同的表示方法。如規(guī)則適宜用產(chǎn)生式表示法,實(shí)驗(yàn)過程適宜用過程表示法,概念特征適宜用面向?qū)ο蟊硎痉?,概念之間的關(guān)系適宜用語義網(wǎng)表示法。知識利用包括知識搜索以及知識推理。知識搜索確定在什么情況下需要什么樣的知識,搜索到的知識是否滿足當(dāng)前的需求。找到了適當(dāng)?shù)闹R后,進(jìn)行推理,得到結(jié)果。

3、知識管理與知識工程的外圍要素對比分析

知識管理注重人與人之間的知識傳遞,而知識工程更注重知識本身的操作。知識管理(KM,Knowledge Management)的目標(biāo)是建立供人使用的知識庫,而知識工程(KE,Knowledge Engineering)的目標(biāo)是建立供計(jì)算機(jī)使用的知識庫。知識管理的核心是無序知識有序化、隱性知識顯性化、泛化知識本體化 。知識工程主要涉及知識獲取、知識表示與知識利用三大過程,其中知識獲取一直是知識工程的難點(diǎn),也是人工智能的瓶頸。知識管理主要從管理學(xué)的角度出發(fā),重點(diǎn)關(guān)注隱性知識顯性化,技術(shù)性不強(qiáng),管理的結(jié)果主要是人用。知識工程是從工程學(xué)的角度出發(fā),重點(diǎn)關(guān)注知識獲取與知識表示,技術(shù)性很強(qiáng),結(jié)果既可以人用,也可以機(jī)用,主要是機(jī)用。知識管理圍繞著人轉(zhuǎn),知識管理的用戶是人,計(jì)算機(jī)是輔助管理工具,人是知識管理中的本體。知識工程圍繞著計(jì)算機(jī)轉(zhuǎn),知識工程的用戶是計(jì)算機(jī)(系統(tǒng)),人與計(jì)算機(jī)是實(shí)現(xiàn)的工具,計(jì)算機(jī)是知識工程中的本體。

知識工程中的知識組織以計(jì)算機(jī)可理解的方式描述知識,知識的粒度比較小,以知識元(或稱知識點(diǎn))為單位。如知識庫CYC,IBM深藍(lán)計(jì)算機(jī)所使用的棋譜等。知識元與知識元之間的鏈接構(gòu)成知識鏈。關(guān)于知識鏈的概念主要有三種用法。第一種用法為知識元與知識之間的鏈接,如知識發(fā)現(xiàn)過程中所用到的多個(gè)知識元之間形成的鏈接。第二種用法是文獻(xiàn)知識鏈接,如清華同方的中國知網(wǎng),萬方數(shù)據(jù)的知識鏈接門戶,不同的知識節(jié)點(diǎn)之間的粒度差異性很大,如從作者到文獻(xiàn)、從作者到機(jī)構(gòu)之間的鏈接,知識鏈接不能直接進(jìn)行知識發(fā)現(xiàn)。第三種用法是對知識的處理過程所形成的動作鏈,如知識獲取、知識重組、知識存儲、知識傳播等過程所形成的鏈。第一種知識鏈強(qiáng)調(diào)知識的可數(shù)性,第二種知識鏈中的知識節(jié)點(diǎn)范疇更大一些,第三種知識鏈中的知識可大可小。前兩種知識鏈?zhǔn)遣煌R元素之間形成的鏈,是元素與元素之間的關(guān)系,而第三種知識鏈?zhǔn)菄@單個(gè)知識元素進(jìn)行的操作所形成的鏈,是動作與動作之間的關(guān)系。知識網(wǎng)格不同于知識網(wǎng)絡(luò),網(wǎng)格是一種充分利用網(wǎng)絡(luò)資源的計(jì)算技術(shù),這種技術(shù)解決的根本問題是計(jì)算資源(包括存儲與運(yùn)算,尤其是運(yùn)算),所以知識網(wǎng)格并不是指由不同的知識元邏輯放在一起,形成格狀。

4、知識管理與知識工程的發(fā)展趨勢探析

知識管理應(yīng)當(dāng)以隱性知識顯性化、無序知識有序化、泛化知識本體化為目標(biāo)。知識工程,旨在建立面向?qū)ο笾R庫和邏輯命題知識庫,以最貼近自然的方式來描述自然界的事物,以人們可認(rèn)知、計(jì)算機(jī)可理解的方式描述事物之間的規(guī)律,以便能夠有效地解決信息泛濫、信息爆炸等問題,可以對重復(fù)的信息進(jìn)行濾重、篩選,得到最能反映事物本質(zhì)及自然規(guī)律的清晰有序的知識。韓客松等認(rèn)為知識發(fā)現(xiàn)是知識管理的最高層次:初級階段是知識庫(你知道你有什么),中級階段是知識共享(你知道你沒有什么),高級階段是知識發(fā)現(xiàn)(你不知道你有什么)。

知識工程也在向著知識表達(dá)清晰化、數(shù)據(jù)組織有序化、內(nèi)容存儲本體化的方向發(fā)展,隨著自然語言處理的新進(jìn)展、面向?qū)ο蠓椒ǖ某墒鞈?yīng)用,特別是本體論思想的引入,為知識工程的發(fā)展指明了方向,為知識工程的實(shí)施注入了新的活力。知識表示的方式已經(jīng)比較成熟,能夠覆蓋絕大多數(shù)知識類型。知識工程的關(guān)鍵仍是知識獲取,非自動知識獲取太慢,很難滿足工程化需要。全自動知識獲取又太難,在自然語言處理無法取得重大突破以前,亦很難進(jìn)行工程化實(shí)施。因此,半自動知識獲取的方式具有更強(qiáng)的可操作性,構(gòu)建部分知識庫與學(xué)習(xí)規(guī)則,然后分析語料庫,邊分析邊抽取,然后再改進(jìn)規(guī)則,不斷改進(jìn)算法與豐富知識庫。

5、知識技術(shù)的未來發(fā)展

知識管理不包括關(guān)于知識處理的全部,而知識工程也不包括知識處理的全部。知識管理與知識工程各有分工,各負(fù)其責(zé)。如果認(rèn)為知識管理與知識工程有交叉的話,那就是在知識庫的構(gòu)建上。知識管理中構(gòu)建的知識庫一般用自然語言,而知識工程中構(gòu)建的知識庫一般用人工語言。盡管表示方式與使用對象都有所不同,但構(gòu)建知識庫都是關(guān)鍵一環(huán)。知識庫構(gòu)建的前提是知識獲取,知識獲取的有效方式是知識抽取,知識抽取的目標(biāo)是形成以知識元為單位的知識庫。知識獲取是知識工程要解決的關(guān)鍵問題,因此,知識抽取是知識工程的關(guān)鍵一環(huán)。另一方面,知識抽取實(shí)現(xiàn)一種知識序化,是以不同粒度組織知識,而知識組織是知識管理的關(guān)鍵一環(huán)。因此,知識抽取既有利于知識工程的知識獲取問題,又有利于知識管理的知識組織。知識管理與知識工程都涉及知識組織。

無論是知識管理還是知識工程,通過分析獲取知識必然成為研究的重點(diǎn)。獲取知識之后,對知識本身的分析以及知識之間的關(guān)系分析必然會成為新的研究熱點(diǎn),通過分析獲取知識主要指知識抽取,知識本身的分析包括知識表示、知識轉(zhuǎn)化與知識映射,知識之間的關(guān)系分析體現(xiàn)在知識挖掘、知識發(fā)現(xiàn)上。情報(bào)學(xué)家正好介于知識管理與知識工程之間 。

對人的管理不如管理學(xué)家,對計(jì)算機(jī)的研究又不如計(jì)算機(jī)學(xué)家,因此情報(bào)學(xué)對知識管理的定位更多的定位于知識服務(wù) 。情報(bào)學(xué)家在走知識管理與知識工程的交叉路,既做知識序化又做知識轉(zhuǎn)化。單純的信息可能會產(chǎn)生情報(bào),單純的知識很難產(chǎn)生情報(bào),大多數(shù)情報(bào)是信息與知識共同作用的結(jié)果,即通過知識對新信息進(jìn)行分析,分析出處境與機(jī)遇,為決策提供方案,這才是情報(bào)活動的本質(zhì)。因此如何獲取知識并有效的利用知識成為知識處理的關(guān)鍵。涉及知識處理的技術(shù)很多,包括知識組織、知識管理、知識服務(wù)、知識發(fā)現(xiàn)、知識挖掘、知識檢索等等,但知識處理的核心是知識的獲取、表示與利用。這些處理過程有些是人工的,如隱性知識顯性化;有些是計(jì)算機(jī)自動化的,如從文獻(xiàn)中抽取知識;還有一些是人機(jī)交互的,如知識表示。解決知識的來、去以及中間分析過程是知識處理的三大過程,也是核心所在。知識處理一定會在總結(jié)學(xué)術(shù)文獻(xiàn)特征規(guī)律的基礎(chǔ)上,以學(xué)術(shù)文獻(xiàn)為主要處理對象,并適當(dāng)借助自然語言處理技術(shù),深入文獻(xiàn)內(nèi)容結(jié)構(gòu)及語義表達(dá)進(jìn)行分析,以知識元為處理單位進(jìn)行抽取、組織并利用,從而實(shí)現(xiàn)知識的自動化處理,提高分析過程的知識維度與智能成分,推動圖書情報(bào)學(xué)的飛速發(fā)展

評論  |   0條評論