時間:2023-03-20 16:07:19
序論:好文章的創(chuàng)作是一個不斷探索和完善的過程,我們?yōu)槟扑]十篇計算機數(shù)據(jù)庫論文范例,希望它們能助您一臂之力,提升您的閱讀品質(zhì),帶來更深刻的閱讀感受。
2計算機數(shù)據(jù)庫的恢復(fù)技術(shù)探析
2.1恢復(fù)技術(shù)的內(nèi)涵
數(shù)據(jù)庫的恢復(fù)技術(shù),又稱“修復(fù)技藝”,是指當計算機數(shù)據(jù)庫系統(tǒng)存在故障而引起數(shù)據(jù)丟失等現(xiàn)象時再次對毀損、丟失的數(shù)據(jù)信息進行修復(fù)的操作技術(shù)。為降低由于操作不當?shù)热藶橐蛩匾约跋到y(tǒng)本身的緣故而造成損失的可能性,同時也是出于減少客戶自身損失的考慮,所以進行數(shù)據(jù)庫系統(tǒng)的恢復(fù)備份必不可少。
2.2恢復(fù)技術(shù)的基本形式
數(shù)據(jù)庫的恢復(fù)技術(shù)主要可以按照普通恢復(fù)、全盤恢復(fù)、郵件恢復(fù)和批日志恢復(fù)等進行歸類。首先,普通恢復(fù)就是說在數(shù)據(jù)修復(fù)環(huán)節(jié),對之前已經(jīng)備份完畢的數(shù)據(jù)信息進行簡要補充,或者采用經(jīng)過遠程控制的分步備份方式對數(shù)據(jù)進行簡單修復(fù)的形式。由于未涉及到使用者之前的日志文檔等的備份,所以它并不是對所有數(shù)據(jù)的完全恢復(fù)。其次,全盤恢復(fù)的形式。這種形式是當進行數(shù)據(jù)庫的恢復(fù)操作時,涉及到了整個計算機數(shù)據(jù)庫中的備份數(shù)據(jù)以及使用者處理個人事務(wù)的備份文檔等。因此,這種恢復(fù)手段即便可能耗費大量的功夫,但其可以使電腦數(shù)據(jù)庫中發(fā)生的損失降到最低;另外,它也可以使計算機恢復(fù)到之前某個還原點的狀態(tài)。還有,就是批日志恢復(fù)的形式。此恢復(fù)技術(shù)形式最大的優(yōu)勢就在于:它可以降低恢復(fù)數(shù)據(jù)時所占用的儲存空間,相比之下,其操作步驟也比普通恢復(fù)和全盤恢復(fù)更為簡便。郵件恢復(fù)要求相關(guān)處理人員必須具備良好的實際操作能力,它也是一項針對管理者的技術(shù)性的恢復(fù)形式。除此之外,務(wù)必要維護好所需處理的數(shù)據(jù)信息,更有效地提高數(shù)據(jù)恢復(fù)的安全性、科學(xué)性。
2.3恢復(fù)技術(shù)的主要方法
計算機數(shù)據(jù)庫主要的修復(fù)方式可分為轉(zhuǎn)儲并建立相關(guān)日志、依照實際情況進行判斷解決兩種。第一,轉(zhuǎn)儲并建立相關(guān)日志文檔。它要求帶有一定的周期性并循環(huán)拷貝數(shù)據(jù)庫中的全部數(shù)據(jù),然后再把所備份的信息儲存到其他介質(zhì)中。因其簡易的操作方法,這種數(shù)據(jù)庫的修復(fù)方法一直以來都是最為常見的一種。第二,根據(jù)具體狀況進行操作處理。如果計算機數(shù)據(jù)庫存在著某些問題或故障,可以依照以下兩種情況做出判斷、進行處理。一,假設(shè)計算機數(shù)據(jù)庫因受到的損壞過于嚴重而無法繼續(xù)使用,這時候就應(yīng)當啟用一張新磁盤,并在其中拷貝一份實時數(shù)據(jù),之后再借助日志庫的重做處理進行新數(shù)據(jù)庫數(shù)據(jù)的更新操作。這樣不光能夠恢復(fù)到之前的樣子,同時又令現(xiàn)有的數(shù)據(jù)庫數(shù)據(jù)得到更新升級;二,若是數(shù)據(jù)庫未遭到損壞或程度較輕的話,再或者只是其中某幾項數(shù)據(jù)不再可依賴的話,是完全沒有必要拷貝已存檔的數(shù)據(jù)庫內(nèi)容的,只要通過日志庫中撤銷處理的執(zhí)行便能夠那些沒有考慮好便做出的改動,進而讓數(shù)據(jù)庫恢復(fù)到正常的工作狀態(tài)。
二、計算機數(shù)據(jù)庫在信息管理中的應(yīng)用現(xiàn)狀
就目前技術(shù)的發(fā)展結(jié)構(gòu)而言,在計算機數(shù)據(jù)庫技術(shù)實際運行過程中,整體技術(shù)維度和技術(shù)運行機制也在發(fā)生改變。第一,計算機數(shù)據(jù)庫技術(shù)的應(yīng)用范圍在逐漸擴展。在實際生產(chǎn)生活中,應(yīng)用計算機數(shù)據(jù)庫技術(shù)的頻率和市場前景越來越大,無論是工業(yè)、農(nóng)業(yè)以及文化產(chǎn)業(yè)等,都將其視為有效的信息處理工具[2]。因此,計算機數(shù)據(jù)庫技術(shù)的安全性和適配性尤為重要,各行業(yè)也在自身發(fā)展進程中不斷摸索和技術(shù)優(yōu)化,真正建立切實有效的管控模型和管理機制,確保管理維度的實效性,也為信息結(jié)構(gòu)優(yōu)化奠定堅實基礎(chǔ)[3]。第二,計算機數(shù)據(jù)庫技術(shù)的安全性也在探索中逐漸得到強化,也突顯出計算機數(shù)據(jù)管理項目的具體要求,只有優(yōu)化其安全價值,才能更好的建構(gòu)高度機密性以及敏感性數(shù)據(jù)管理維度,保證了信息備份管理以及恢復(fù)功能的有效性,對于數(shù)據(jù)信息的復(fù)制和備份,要在優(yōu)化信息維度的基礎(chǔ)上,真正實現(xiàn)了數(shù)據(jù)庫的安全性升級。
三、計算機數(shù)據(jù)庫技術(shù)在信息管理中的應(yīng)用優(yōu)化路徑
(一)優(yōu)化計算機數(shù)據(jù)庫技術(shù)在信息管理中的安全性
要保證數(shù)據(jù)完整性,就要從安全應(yīng)用以及安全管控模型出發(fā),建構(gòu)系統(tǒng)化管理維度和管控要求,保證數(shù)據(jù)在得到共享的同時,相應(yīng)的數(shù)據(jù)信息也是安全準確的。因此,技術(shù)人員要結(jié)合計算機數(shù)據(jù)庫技術(shù)的相關(guān)要求,提升信息完整度和安全性[4]。
(二)優(yōu)化計算機數(shù)據(jù)庫技術(shù)在信息管理中的實踐性
在實際信息管理和信息控制過程中,要積極落實理論和實踐的融合機制,確保管理維度和管理效果的最優(yōu)化。伴隨著計算機技術(shù)的高速發(fā)展,將數(shù)據(jù)庫原理和數(shù)據(jù)庫管理技術(shù)模型進行深度管控,是提升數(shù)據(jù)科學(xué)性以及合理性的重要路徑,也是研究數(shù)據(jù)分析機制以及計算機數(shù)據(jù)庫技術(shù)應(yīng)用模型的重要參數(shù),因此,要保證理論聯(lián)系實踐,建構(gòu)計算機數(shù)據(jù)庫技術(shù)應(yīng)用整體。
(三)優(yōu)化計算機數(shù)據(jù)庫技術(shù)在信息管理中的技術(shù)性
對于計算機數(shù)據(jù)庫技術(shù)來說,最基本的就是技術(shù)參數(shù),因此,要保證計算機數(shù)據(jù)庫技術(shù)在信息管理中得到推廣,最基本的就是要保證技術(shù)模型的安全性和準確性,并且積極落實計算機共享體系。計算機數(shù)據(jù)庫技術(shù)最根本的要求就是要規(guī)避數(shù)據(jù)庫被非法入侵,確保其技術(shù)安全和信息共享安全。但是,在實際管理機制中,信息的絕對安全存在風險。提升計算機數(shù)據(jù)庫技術(shù)的技術(shù)安全性,能更好的落實信息應(yīng)用價值,確保信息維度得到有效優(yōu)化。因此,相關(guān)項目技術(shù)人員要利用加密技術(shù)對非共享信息進行系統(tǒng)化管控,提高管控效果的同時,積極落實技術(shù)性管理要求,借助權(quán)限管理機制、數(shù)據(jù)加密技術(shù)以及強制存取控制技術(shù)等措施,進一步優(yōu)化計算機數(shù)據(jù)庫技術(shù)的技術(shù)安全性[5]。
四、結(jié)束語
總而言之,在信息管理過程中積極應(yīng)用計算機數(shù)據(jù)庫技術(shù),能在滿足共享需求的基礎(chǔ)上,充分發(fā)揮信息的實用性價值,確保信息得到充分利用,也為實踐優(yōu)化提供動力,確保技術(shù)模型以及信息管理維度之間形成有效的控制機制,也為數(shù)據(jù)應(yīng)用研究奠定堅實基礎(chǔ),保證計算機數(shù)據(jù)庫技術(shù)和信息管理之間的優(yōu)化契合。
作者:陳文杰 單位:
參考文獻:
[1]王瑜.探究計算機數(shù)據(jù)庫安全管理與實現(xiàn)途徑[J].建筑工程技術(shù)與設(shè)計,2016,15(11):2074-2074.
[2]溫林芝.試析計算機數(shù)據(jù)庫安全管理技術(shù)與方法[J].數(shù)字技術(shù)與應(yīng)用,2015,15(04):183-183.
2關(guān)系數(shù)據(jù)庫技術(shù)在計算機網(wǎng)絡(luò)設(shè)計中的基本原理
在計算機網(wǎng)絡(luò)技術(shù)發(fā)展的過程中,數(shù)據(jù)庫技術(shù)存在著眾多的種類,其中根據(jù)數(shù)據(jù)庫模型的運行模式可以分為:網(wǎng)狀模型數(shù)據(jù)庫技術(shù)、層次模型數(shù)據(jù)庫技術(shù)以及關(guān)系數(shù)據(jù)模型數(shù)據(jù)庫技術(shù)。這些數(shù)據(jù)庫技術(shù)在不同的計算機網(wǎng)絡(luò)設(shè)計活動中有各自的優(yōu)勢,其中關(guān)系數(shù)據(jù)模型數(shù)據(jù)庫技術(shù),以其完美的數(shù)據(jù)連結(jié)技術(shù)和高度的數(shù)據(jù)模型適應(yīng)性,成為計算機網(wǎng)絡(luò)設(shè)計活動中通用的一種數(shù)據(jù)庫技術(shù)。其在運行過程中展示出的完善的數(shù)據(jù)連結(jié)性,能夠在計算機網(wǎng)絡(luò)設(shè)計活動中,對任何相關(guān)的計算機網(wǎng)絡(luò)數(shù)據(jù)進行關(guān)聯(lián),并能夠在一定數(shù)據(jù)基礎(chǔ)上對多種數(shù)據(jù)進行綜合性的關(guān)系鏈接。這種數(shù)據(jù)信息服務(wù)的全面性和數(shù)據(jù)鏈接服務(wù)形式的多樣性,能夠極大的滿足計算機網(wǎng)絡(luò)設(shè)計活動中多樣化的數(shù)據(jù)信息需求,所以在具體的計算機網(wǎng)絡(luò)設(shè)計活動中成為使用者首選的數(shù)據(jù)庫類型,被廣泛的應(yīng)用于計算機網(wǎng)絡(luò)設(shè)計中。計算機網(wǎng)絡(luò)設(shè)計活動是一個復(fù)雜、系統(tǒng)的工程性活動,在其運行活動中要求下屬的各個模塊都要最大程度上的兼具數(shù)據(jù)信息服務(wù)的全面性和便捷性。在關(guān)系數(shù)據(jù)庫中這一系統(tǒng)要求被很好的體現(xiàn)了出來,關(guān)系數(shù)據(jù)庫擁有自己管理信息交互平臺,能夠基于C語言等網(wǎng)絡(luò)編程語言與使用者進行數(shù)據(jù)庫信息的交流,提高了數(shù)據(jù)庫使用的便捷性和全面性。在計算機數(shù)據(jù)庫軟件系統(tǒng)結(jié)構(gòu)中包含著兩個數(shù)據(jù)庫訪問系統(tǒng),一個是開放數(shù)據(jù)庫連接性(ODBC),一個是數(shù)據(jù)訪問對象(DAO),這兩個數(shù)據(jù)庫訪問系統(tǒng)相互獨立,能夠單獨向用戶提供數(shù)據(jù)信息服務(wù)。其中ODBC不僅能夠基于SQL語言與使用者進行數(shù)據(jù)信息交互,而且對C語言和SQL數(shù)據(jù)庫之間的訪問機制進行了定義,讓使用者可以通過C語言這樣一種計算機網(wǎng)絡(luò)設(shè)計活動中常見的語言形式與數(shù)據(jù)庫進行信息交互,保證了關(guān)系數(shù)據(jù)庫對計算機網(wǎng)絡(luò)設(shè)計活動數(shù)據(jù)信息交互,讓計算機網(wǎng)絡(luò)設(shè)計人員能夠通過其最常用的信息交互方式與關(guān)系數(shù)據(jù)庫進行交流,保證了關(guān)系數(shù)據(jù)庫與計算機網(wǎng)絡(luò)設(shè)計活動積極、有效的互動。DAO為計算機網(wǎng)絡(luò)設(shè)計提供了數(shù)據(jù)庫機制,這一機制是從關(guān)系數(shù)據(jù)庫的整體出發(fā)對關(guān)系數(shù)據(jù)庫內(nèi)部組成部分和內(nèi)容的一種規(guī)范。當一個關(guān)系數(shù)據(jù)庫體系結(jié)構(gòu)由多個DAO構(gòu)成時,DAO自身的數(shù)據(jù)庫管理機制就會發(fā)揮作用,從DAO自身的數(shù)據(jù)資源特點出發(fā),對關(guān)系數(shù)據(jù)庫整體進行協(xié)同管理,保證整個關(guān)系數(shù)據(jù)庫的數(shù)據(jù)信息服務(wù)的高效進行。DAO的這種自我管理機制和其自身的數(shù)據(jù)訪問對象本質(zhì)是相互分離的,在具體的管理活動中自我管理機制和數(shù)據(jù)訪問對象能夠進行各自獨立的管理,讓每一個DAO都可以在保證自身數(shù)據(jù)訪問對象性質(zhì)的基礎(chǔ)上,同時實現(xiàn)自身和DAO群體的管理,這種各自獨立的數(shù)據(jù)訪問對象管理和運行管理,在保證DAO數(shù)據(jù)服務(wù)對象專業(yè)性的同時,也方便了自身的升級改造。而且在關(guān)系數(shù)據(jù)庫運行活動中,DAO可以鏈接相應(yīng)的網(wǎng)絡(luò)數(shù)據(jù)庫,實現(xiàn)數(shù)據(jù)資源的網(wǎng)絡(luò)化共享和管理。
3關(guān)系數(shù)據(jù)庫在計算機網(wǎng)絡(luò)設(shè)計中的優(yōu)勢
關(guān)系數(shù)據(jù)庫在計算機網(wǎng)絡(luò)設(shè)計中具有強大的數(shù)據(jù)存儲功能,以及簡便的數(shù)據(jù)轉(zhuǎn)換功能等強大的優(yōu)勢,以下將對關(guān)系數(shù)據(jù)庫在計算機網(wǎng)絡(luò)設(shè)計中的優(yōu)勢進行詳細的闡述。
3.1強大的數(shù)據(jù)存儲功能
強大的數(shù)據(jù)存儲功能,是關(guān)系數(shù)據(jù)庫在計算機網(wǎng)絡(luò)設(shè)計活動中運用的主要優(yōu)勢。隨著計算機網(wǎng)絡(luò)設(shè)計應(yīng)用范圍的不斷擴大,計算機網(wǎng)絡(luò)設(shè)計活動的內(nèi)容含量越來越大,內(nèi)容的組成形式也變得越來越復(fù)雜,面對計算機網(wǎng)絡(luò)設(shè)計活動這樣一種發(fā)展趨勢,相應(yīng)的關(guān)系數(shù)據(jù)庫的數(shù)據(jù)儲存能力和數(shù)據(jù)管理能力變得極為重要。關(guān)系數(shù)據(jù)庫的應(yīng)用,不僅能夠?qū)τ嬎銠C網(wǎng)絡(luò)設(shè)計活動中需求和產(chǎn)生的大量計算機網(wǎng)絡(luò)設(shè)計數(shù)據(jù)進行及時的存儲,而且能夠借助內(nèi)部管理機制的幫助,對這些數(shù)據(jù)進行有效、準確的規(guī)劃和管理。關(guān)系數(shù)據(jù)庫的應(yīng)用讓計算機網(wǎng)絡(luò)設(shè)計活動的數(shù)據(jù)管理環(huán)節(jié),成為計算機網(wǎng)絡(luò)設(shè)計環(huán)節(jié)的一個效率增長點。在具體的操作活動中計算機網(wǎng)絡(luò)設(shè)計人員,可以利用數(shù)據(jù)庫強大的數(shù)據(jù)存儲功能將設(shè)備參數(shù)輸入到網(wǎng)絡(luò)拓撲結(jié)構(gòu)中,進而借助網(wǎng)絡(luò)拓撲結(jié)構(gòu)對關(guān)系數(shù)據(jù)庫進行高效、快捷的操作。如果不能有效的利用關(guān)系數(shù)據(jù)庫的輔助作用,有效管理復(fù)雜的數(shù)據(jù)信息,那么計算機網(wǎng)絡(luò)設(shè)計勢必會陷入困境中。
3.2簡便的數(shù)據(jù)轉(zhuǎn)換功能
關(guān)系數(shù)據(jù)庫在計算機網(wǎng)絡(luò)設(shè)計活動中的優(yōu)勢,還體現(xiàn)在不同數(shù)據(jù)之間的轉(zhuǎn)換功能。在計算機網(wǎng)絡(luò)設(shè)計活動中,因為設(shè)計活動本身可能會涉及到社會經(jīng)濟的各個領(lǐng)域,自身的設(shè)計形式也會因為網(wǎng)絡(luò)設(shè)計目標的不同而大相徑庭,在計算機網(wǎng)絡(luò)設(shè)計活動中,計算機網(wǎng)絡(luò)設(shè)計的數(shù)據(jù)從呈現(xiàn)形式和傳遞方式上都是有本質(zhì)上的不同的,所以在對計算機網(wǎng)絡(luò)設(shè)計數(shù)據(jù)進行管理的時候,不同數(shù)據(jù)之間的轉(zhuǎn)換是一個關(guān)鍵性的問題,只有解決了計算機網(wǎng)絡(luò)設(shè)計活動中的數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)轉(zhuǎn)換效率的問題,才能促進計算機網(wǎng)絡(luò)設(shè)計活動高效進行。關(guān)系數(shù)據(jù)庫在計算機網(wǎng)絡(luò)設(shè)計活動中的應(yīng)用在一定程度上解決了這一關(guān)鍵性問題,因為關(guān)系數(shù)據(jù)庫本身存在的關(guān)聯(lián)性,就是要從兩組不同數(shù)據(jù)中尋找共同點,并基于這些共同點建立二者之間的普遍聯(lián)系,關(guān)系數(shù)據(jù)庫的這種工作機制,在不同形式的數(shù)據(jù)之間的轉(zhuǎn)換活動中也有積極的作用。數(shù)據(jù)的兩種不同呈現(xiàn)形式本質(zhì)上也是兩種不同數(shù)據(jù)之間聯(lián)系的一種體現(xiàn),二者之間本質(zhì)內(nèi)容和內(nèi)在邏輯的聯(lián)系是普遍存在的。關(guān)系數(shù)據(jù)庫可以根據(jù)這一特點,結(jié)合自身的工作機制,對二者進行本質(zhì)上的聯(lián)系,這樣一種在計算機網(wǎng)絡(luò)設(shè)計活動中復(fù)雜無比的問題,在關(guān)系數(shù)據(jù)庫的參與下立刻變得可實現(xiàn)、可操作。關(guān)系數(shù)據(jù)庫的存在只是解決了計算機網(wǎng)絡(luò)設(shè)計活動數(shù)據(jù)轉(zhuǎn)化能力的有無問題,只有強化計算機網(wǎng)絡(luò)設(shè)計活動中數(shù)據(jù)轉(zhuǎn)化能力的效率和便捷性,才能在網(wǎng)絡(luò)設(shè)計的實際工作中起到更加積極的效果。所以在關(guān)系數(shù)據(jù)庫的建立健全活動中,對其自身的數(shù)據(jù)轉(zhuǎn)換能力的強化,是關(guān)系數(shù)據(jù)庫發(fā)展完善的未來方向。這一改進必須要將關(guān)系數(shù)據(jù)庫的數(shù)據(jù)轉(zhuǎn)化能力與關(guān)系數(shù)據(jù)庫的信息交互系統(tǒng)結(jié)合起來,保證使用者對關(guān)系數(shù)據(jù)庫的數(shù)據(jù)轉(zhuǎn)換能力有更加直接的參與和應(yīng)用,同時要結(jié)合計算機網(wǎng)絡(luò)設(shè)計活動發(fā)展的實際,對網(wǎng)絡(luò)設(shè)計活動中可能會涉及到的數(shù)據(jù)呈現(xiàn)形式進行系統(tǒng)、詳細的統(tǒng)計,并在關(guān)系數(shù)據(jù)庫中對這些數(shù)據(jù)的呈現(xiàn)形式進行廣泛的應(yīng)用。具體而言,就是要在關(guān)系數(shù)據(jù)庫中,對計算機網(wǎng)絡(luò)設(shè)計活動中可能會涉及到的數(shù)據(jù)呈現(xiàn)形式進行定義,并設(shè)置相應(yīng)的數(shù)據(jù)轉(zhuǎn)化機制,在對數(shù)據(jù)信息進行存儲時,盡量選擇應(yīng)用范圍最廣的數(shù)據(jù)呈現(xiàn)形式進行存儲,以最大限度的保證計算機網(wǎng)絡(luò)設(shè)計活動的數(shù)據(jù)需求,同時也要定義好各種數(shù)據(jù)呈現(xiàn)形式的轉(zhuǎn)化機制,在使用者產(chǎn)生特殊的數(shù)據(jù)呈現(xiàn)形式需求時,能夠運用相應(yīng)的數(shù)據(jù)轉(zhuǎn)換機制,進行數(shù)據(jù)呈現(xiàn)形式的轉(zhuǎn)換,以保證計算機網(wǎng)絡(luò)設(shè)計活動的高效進行。
1如何優(yōu)化Parse
1.1SQL語句的Parse處理步驟:
1)計算語句值
2)共享池中有無與此語句值相同的語句?
3)共享池中有與此語句字符完全匹配的語句?
4)準備要運行的SQL語句
5)為新語句在共享池中創(chuàng)建空間
6)將語句存放在共享池中
7)修改共享池圖,標明語句的值和在共享池中的位置
8)執(zhí)行準備好的SQL語句
最理想的是,語句只執(zhí)行1、2、3和8步來進行處理。不經(jīng)過2、3步來測試被傳給Oracle的語句要使用1~8步進行處理。只經(jīng)過1、2、3、8的SQL語句要比經(jīng)過1~8步的語句更為有效。
1.2在共享池中重用SQL語句
當SQL語句被傳遞給Oracle處理時,其秘訣是重復(fù)使用已經(jīng)在共享池中的語句,而不是讓Oracle在接受語句時去準備新的語句。前面表明,如果Oracle接受了一個與共享池中的語句相一致的語句,就重用共享池中的語句。
Oracle提供在數(shù)據(jù)庫中存儲代碼的能力。當應(yīng)用系統(tǒng)開始運行時,從數(shù)據(jù)庫中讀取代碼(可用PL/SQL語句編制)并像其它語句那樣傳遞到共享池中去處理。從數(shù)據(jù)庫中取出的代碼是編譯過的并駐留在共享池中。
可以利用數(shù)據(jù)庫中存儲的程序代碼設(shè)計應(yīng)用系統(tǒng),檢查所有的事務(wù)處理以及主要的通用的過程,研究現(xiàn)有的應(yīng)用系統(tǒng)并把主要的處理程序轉(zhuǎn)換為數(shù)據(jù)庫中存儲的程序代碼。在Oracle中存儲代碼可以通過過程、程序包、函數(shù)、觸發(fā)器等來實現(xiàn)。
2如何優(yōu)化Execute和Fetch
2.1避免無計劃的全表掃描
全表掃描連續(xù)從表讀取所有數(shù)據(jù),而不管數(shù)據(jù)是否與查詢有關(guān)。避免不必要的全表掃描有兩個充足理由:1)全表掃描沒有選擇性
2)過全表掃描讀取的數(shù)據(jù)很快從SGA的緩沖區(qū)移走(如果正在掃描的表不是“高速存儲”的表)
在基于規(guī)則優(yōu)化的情況下,如果下列任何條件在SGA語句出現(xiàn),就要對一個表進行全表掃描。
1)該表無索引
2)對返回的行無任何限定條件(如無Where語句)
3)對數(shù)據(jù)表與任何索引主列相對應(yīng)的行無限定條件。例如,在City-State-Zip列上創(chuàng)建了三列復(fù)合索引,那么僅對State列有限定條件的查詢不能使用這個索引,因為State不是索引的主列。
4)對索引主列的行有限定條件,但條件或者是NULL或者是不相等。例如,City列上存在索引,在所有下列情況下都不會使用索引。
Wherecityisnull
Wherecityisnotnull
Wherecity!=’liaoning’
5)對索引主列的行有限定條件,但條件在表達式里使用。例如,如果在City列上索引,那么限定條件
WhereCity=’liaoning’
可以使用索引。然而,如果限定條件是
WhereUPPER(City)=’liaoning’
那么不會使用City列上的索引,因為City列在UPPER函數(shù)里。如果將City列與文本字符串聯(lián)結(jié)在一起,也不會使用索引。例如,如果限定條件是
WhereCity||’x’like‘liaoning%’
那么不會使用City列上的索引。
6)對索引主列的行有限定條件,但條件使用Like操作以及值以‘%’開始或者值是一個賦值變量。例如,在所有下列情況下都不會使用索引:
WhereCitylike‘%aonin%’
WhereCitylike:City_Bind_Variable
如果表小、索引列無選擇性,基于開銷的優(yōu)化器可能決定使用全表掃描。
2.2只使用選擇性索引
索引的選擇性是指索引列里不同值的數(shù)目與表中記錄數(shù)的比。如果表有1000個記錄,表索引列有950個不同值,那么這個索引的選擇性就是950/1000或者0.95。最好的可能性選擇是1.0。依據(jù)非空值列的唯一索引,通常其選擇性為1.0。
如果使用基于開銷的最優(yōu)化,優(yōu)化器不應(yīng)該使用選擇性不好的索引。
索引的選擇性是指索引列里不同值的數(shù)目與表中記錄數(shù)的比。如果表有1000個記錄,表索引列有950個不同值,那么這個索引的選擇性就是950/1000或者0.95。最好的可能性選擇是1.0。依據(jù)非空值列的唯一索引,通常其選擇性為1.0。
索引的選擇性是指索引列里不同值的數(shù)目與表中記錄數(shù)的比。如果表有1000個記錄,表索引列有950個不同值,那么這個索引的選擇性就是950/1000或者0.95。最好的可能性選擇是1.0。依據(jù)非空值列的唯一索引,通常其選擇性為1.0。
2.3管理多表聯(lián)結(jié)
Oracle提供了3個聯(lián)結(jié)操作:NESTEDLOOPS、HASHJOIN和MERGEJOIN。MERGEJOIN是一組操作,在所有行被處理完之前,它不返任何記錄給下一操作。NESTEDLOOPS和HASH是行操作,因此會很快將第一批記錄返回給下一個操作。
在每個聯(lián)結(jié)選項里,必須執(zhí)行一些步驟以獲取最好的聯(lián)結(jié)性能。如果沒有適當?shù)貎?yōu)化聯(lián)結(jié)操作,那么聯(lián)結(jié)所需的時間也許隨著表的增長而呈指數(shù)級地增長。
2.4管理包含視圖的SQL語句
如果查詢包含視圖,優(yōu)化器有兩種執(zhí)行查詢的方法:首先解決視圖然后執(zhí)行查詢,或者把視圖文本集成到查詢里去。如果首先執(zhí)行視圖,那么首先完成全部的結(jié)果集,然后用其余的查詢條件做過濾器。
首先解決視圖會導(dǎo)致查詢性能下降的問題,這取決于所涉及表的相對大小。如果視圖被集成到查詢里,那么查詢的條件也可以應(yīng)用于視圖里,并且可以使用一個小一些的結(jié)果集。然而在一些情況下,也許可以通過視圖分離組操作提高查詢性能。
如果一個視圖包含集合的操作(如Groupby、SUM、COUNT或者DISTINCT),那么視圖不能被集成到查詢里去。
不使用組或者沒有集合操作的視圖的SQL語法可以被集成到大的查詢里去。
2.5優(yōu)化子查詢
當使用自查詢時,也許會碰到幾個獨特的問題。涉及子查詢的查詢潛在問題如下:
?也許在執(zhí)行完查詢的剩余部分前執(zhí)行子查詢(與執(zhí)行分組功能的視圖相似)。
?子查詢也許要求特定的提示,但這些提示不直接與調(diào)用該子查詢的查詢有關(guān)
?可以作為單個查詢執(zhí)行的子查詢也許被代替寫成幾個不同的子查詢。
?也許在使用notin子句或者notexists子句時,不能在最有效的方式下進行子查詢的存在查詢。
1)當執(zhí)行子查詢時
如果一個查詢包含子查詢,那么優(yōu)化器有兩種完成查詢的方法:首先完成子查詢,然后完成查詢(“視圖的方法”),或者將子查詢集成到查詢里去(“聯(lián)結(jié)”的方法)。如果首先解決子查詢,那么整個子查詢的結(jié)果集將首先被計算,并且用查詢條件的剩余部分做過濾器。如果沒有使用子查詢?nèi)ミM行存在檢查,那么“聯(lián)結(jié)”方法將通常要比“視圖”方法完成得好。
如果一個子查詢包括集合操作,如groupby,SUM或者DISTINCT,那么不能集成子查詢到查詢的其余部分里去。非集成的子查詢限制了提供給優(yōu)化器的選項。
2)如何組合子查詢
一個查詢可以包含多個子查詢,使用的子查詢越多,集成或者重寫它們到大的聯(lián)結(jié)里就越困難。既然有多個子查詢使集成困難,就應(yīng)該盡可能地組合多個子查詢。
3)怎樣進行存在檢查
有時子查詢不返回行(記錄),但可以進行數(shù)據(jù)正確性檢查。在相關(guān)表里的記錄或者存在或者不存在的邏輯檢查,稱為存在檢查。可以使用exists和notexists子句提高存在檢查的性能。
2.6管理對非常巨大的表的訪問
隨著表增長到比SGA的數(shù)據(jù)塊高速緩沖區(qū)存儲器的空間顯著大時,需要從另一個角度優(yōu)化對這個表的查詢。
1)問題
當表和它的索引小的時候,在SGA里可以有高度的數(shù)據(jù)共享。多用戶讀表或索引范圍掃描可以反復(fù)使用同一個塊。隨著表的增長,表的索引也在增長。隨著表和它的索引增長到比SGA里提供的空間大時,范圍掃描需要的下一行將在SGA里找到的可能性變小,數(shù)據(jù)庫的命中率將減小。最后,每一個邏輯讀將要求一個單獨的物理讀。對使用非常大的表的優(yōu)化方法著眼于特別的索引技術(shù)和有關(guān)索引的選擇。
2)管理數(shù)據(jù)接近
在訪問非常大的表期間,如果傾向于繼續(xù)使用索引,那么應(yīng)該關(guān)注數(shù)據(jù)接近,即邏輯相關(guān)記錄的物理關(guān)系。為了使數(shù)據(jù)最大限度地接近,應(yīng)該連續(xù)往表里插入記錄。記錄按通常在表的范圍掃描里使用的列排序。
3)避免沒有幫助的索引掃描
如果要對大表使用索引掃描,那么不能假定索引掃描將比全表掃描執(zhí)行得更好。不緊跟表訪問的索引唯一掃描或范圍掃描執(zhí)行得比較好,但緊跟通過RowID的表訪問的索引范圍掃描也許執(zhí)行得差。隨著表增長到比數(shù)據(jù)塊高速緩沖存儲器大得多,最終,索引掃描和全表掃描間的平衡點打破。
4)創(chuàng)建充分索引的表
如果表中的數(shù)據(jù)相當穩(wěn)定,充分索引一個表是很有用的。創(chuàng)建一個復(fù)合索引,它包括所有在查詢期間通常選擇的列。在查詢期間,查詢要求的所有數(shù)據(jù)可以通過索引訪問提供,不需要任何表訪問。
5)并行選項
可以把一個數(shù)據(jù)庫任務(wù),比如Select語句,分為多個單元的工作,由多個Oracle進程同時執(zhí)行。這種能夠允許數(shù)據(jù)庫的單個查詢活動由多個協(xié)調(diào)的進程透明地進行處理的能力,稱為并行查詢選項(PQO)。
并行選項調(diào)用多個進程來利用空閑的系統(tǒng)資源,以減少完成任務(wù)所需要的時間。并行選項并不減少處理過程所要求的資源數(shù)量,而是把處理的任務(wù)分散給多個CPU。為了從并行選項中得到最大的好處,應(yīng)該使CPU和磁盤上的I/O不要滿負荷使用。因為并行的目的是使更多的CPU和磁盤同時參與處理數(shù)據(jù)庫的命令,一個缺乏CPU和I/O資源的服務(wù)程序是不能從并行選項中得到好處的。
2.7使用UNIONALL而不是UNION
最常用的集操作是UNION操作,UNION操作使多個記錄集聯(lián)結(jié)成為單個集。UNION操作的數(shù)學(xué)定義是返回記錄的單個集并且沒有重復(fù)的行,所以在合并結(jié)果集里,Oracle只返回不同的記錄。
當UNION操作用作SQL語句的一部分時,唯一性要求強迫Oracle移走重復(fù)的記錄。Oracle的移走重復(fù)記錄的功能是SORTUNIQUE操作,它與使用DISTINCT子句時執(zhí)行的操作類似。
UNIONALL操作允許重復(fù)。UNIONALL不要求SORTUNIQUE操作,從而節(jié)省了開銷。UNIONALL是一個行操作,所以當其變?yōu)橛行Ь头祷亟o用戶。而UNION包括SORTUNIQUE集操作,在全部記錄的集的排序結(jié)束前,不返回任何記錄給用戶。
當UNIONALL操作產(chǎn)生巨大的結(jié)果集時,不需要任何排序便返回記錄給應(yīng)用的事實意味著第一行檢索的響應(yīng)時間更快,并且在許多情況下,可以不用臨時段完成操作。
在有些情況下,UNIONALL和UNION不返回同樣的結(jié)果。如果在應(yīng)用環(huán)境中,結(jié)果集并不包含任何重復(fù)的記錄,則可以把UNION轉(zhuǎn)換成UNIONALL。
2.8避免在SQL里使用PL/SQL功能調(diào)用
對于增加PL/SQL的使用,許多用戶試圖利PL/SQL功能的優(yōu)勢產(chǎn)生可重復(fù)使用的代碼。其中一個強迫重復(fù)使用PL/SQL功能的方法是在SQL語句里使用。例如,可以創(chuàng)建一個將國際貨幣轉(zhuǎn)換為US$的函數(shù)。這個函數(shù)稱為US$。示例如下:
selecttransaction_type,US$(amount,currency)
frominternational_transaction
whereUS$(amount,currency)>1000;
執(zhí)行前面的SQL語句沒有所期望的那樣好。在測試時,它的性能大約比下面得出相同結(jié)果的SQL語句慢大約幾十倍。
selecttransaction_type,
amount*exchange_rateUS$
fromexchange_rateer,international_transactionit
whereer.currency=it.currency
andamount*exchange_rate>1000;
響應(yīng)時間不同的原因是混合PL/SQL和SQL時,Oracle使用的機制不同。在SQL查詢里嵌入PL/SQL功能時,在執(zhí)行時,Oracle將調(diào)用分成兩部分:用帶有賦值變量的SQL語句代替功能調(diào)用以及對每一個函數(shù)調(diào)用的無名PL/SQL塊。
selecttransaction_type,:a1
frominternational_transaction
where:a1>1000
和
BEGIN
:a1:=US$(:amount,:currency);
END
對在international_transaction表里的每一行,將執(zhí)行在前面示例里顯示的無名塊兩次。無名塊調(diào)用導(dǎo)致查詢響應(yīng)時間的劇增。應(yīng)該避免在SQL語句里使用PL/SQL功能調(diào)用。
參考文獻
[1]甕正科,王新英著.Oracle8.XForWindowsNT實用教程[M].北京:清華大學(xué)出版社,1999.
[2]薩師萱,王珊著.數(shù)據(jù)庫系統(tǒng)概論[M].北京:高等教育出版社,2000.2.
關(guān)鍵詞地理信息系統(tǒng),數(shù)據(jù)庫訪問,空間數(shù)據(jù)庫引擎(SDE),C/S模式,ODBC.
引言
近年來,網(wǎng)絡(luò)技術(shù)得到迅速的發(fā)展,這就為信息資源的共享提供了技術(shù)上的可能.作為信息密集型的地理信息系統(tǒng)(GIS)上升到網(wǎng)絡(luò)平臺可謂適逢其時.但從目前的應(yīng)用情況來看,除了國外極少的公司擁有網(wǎng)絡(luò)版的GIS之外,在國內(nèi)還處于試驗研制的階段.因此,盡快地研制出我國自主版權(quán)的網(wǎng)絡(luò)GIS的原型和產(chǎn)品,并在技術(shù)手段上達到國際先進水平,是擺在我們面前的一項迫切的任務(wù).
1網(wǎng)絡(luò)計算的幾種模式及特點
(1)傳統(tǒng)的集中式.這是一種主機-終端模式,所有的計算任務(wù)和數(shù)據(jù)管理任務(wù)都集中在主機上,終端只是主機輸入/輸出設(shè)備的延長.這種模式的優(yōu)點是容易管理,缺點是對主機的性能要求很高,也浪費了作為終端的計算機的計算能力,并且從性能價格比來看,在購置費用相當?shù)那闆r下,一臺主機的性能往往比不上幾臺計算機所組成網(wǎng)絡(luò)的性能;因此這種模式已逐漸退出主流.字串5
(2)客戶機/服務(wù)器(client/server,簡稱C/S)模式.一般說來,在這種模式下,服務(wù)器只集中管理數(shù)據(jù),而計算任務(wù)分散在客戶機上,客戶機和服務(wù)器之間通過網(wǎng)絡(luò)協(xié)議來進行通訊.客戶機向服務(wù)器發(fā)出數(shù)據(jù)請求,服務(wù)器將數(shù)據(jù)傳送給客戶機進行計算,計算完畢,計算結(jié)果可返回給服務(wù)器.這種模式的優(yōu)點充分利用了客戶機的性能,使計算能力大大提高;另外,由于客戶機和服務(wù)器之間的通訊是通過網(wǎng)絡(luò)協(xié)議進行的,是一種邏輯的聯(lián)系,因此物理上在客戶機和服務(wù)器兩端是易于擴充的.它是目前占主流的網(wǎng)絡(luò)計算模式.
(3)瀏覽器/服務(wù)器(browser/server)模式.在這種模式下,用戶端只需一通用的瀏覽器,如Netscape或Explore,便代替了形形的各種應(yīng)用軟件.服務(wù)器則為Web服務(wù)器.瀏覽器和服務(wù)器之間通過TCP/IP這一通訊協(xié)議進行連接.瀏覽器發(fā)出數(shù)據(jù)請求,由Web服務(wù)器向后臺取出數(shù)據(jù)并計算,將計算結(jié)果返回給瀏覽器.這種模式的優(yōu)點是:由于用戶端所用軟件只是一個簡單的瀏覽器,用戶基本上無需培訓(xùn),用戶端軟件也無需維護;軟件的升級與修改只在服務(wù)器端進行,對用戶透明;服務(wù)器與瀏覽器可處于不同的操作系統(tǒng)平臺.其缺點為:Web動態(tài)技術(shù)不夠成熟,各種標準有待統(tǒng)一,如各廠家的動態(tài)協(xié)議互不支持、瀏覽器之爭等.總之,它是一種先進的但發(fā)展還未成熟的技術(shù).字串4
基于以上的分析,應(yīng)選擇客戶機/服務(wù)器模式作為GIS訪問網(wǎng)絡(luò)數(shù)據(jù)庫的實現(xiàn)模式.
2C/S模式下的GIS訪問網(wǎng)絡(luò)數(shù)據(jù)庫的結(jié)構(gòu)設(shè)計
設(shè)計在總體上分為C/S兩層(見圖1),以充分利用C/S模式的跨平臺、易擴充、數(shù)據(jù)獨立等優(yōu)點.在client端又分兩層來進行設(shè)計——GIS功能層和數(shù)據(jù)請求層,GIS功能層是GIS的功能實現(xiàn)部分,數(shù)據(jù)請求層是GIS的數(shù)據(jù)實現(xiàn)部分.數(shù)據(jù)請求層作為一中間層,起到數(shù)據(jù)轉(zhuǎn)換的作用,對上是具有GIS特點的數(shù)據(jù)文件,對下是標準的數(shù)據(jù)庫記錄.這種分層設(shè)計的形式一方面充分利用了現(xiàn)有的單機版本GIS研究成果;另一方面,GIS功能層和數(shù)據(jù)請求層的開發(fā)可同時進行,只要接口標準不變,本層的變動不會影響到另一層.
Fig.1ThegeneralframeworkofGISaccessingdatabasebasedonC/Smodel
值得一提的是ESRI公司的空間數(shù)據(jù)庫引擎(spatialdatabaseengine,簡稱SDE)的設(shè)計方案(見圖2).它是目前國際上領(lǐng)先的GIS數(shù)據(jù)處理的網(wǎng)絡(luò)計算模型.其數(shù)據(jù)的訪問形式為:由用戶的應(yīng)用程序(userapplication)通過SDE應(yīng)用編程接口(SDEAPI)向SDE服務(wù)器提出空間數(shù)據(jù)請求,SDE服務(wù)器內(nèi)存放有空間對象模型,并依據(jù)空間對象的特點在本地完成空間數(shù)據(jù)的搜索,并將搜索結(jié)果通過網(wǎng)絡(luò)向用戶的應(yīng)用程序返回.字串2
對比圖1和圖2可以看出兩者采用的都是C/S模式,并且都將GIS功能實現(xiàn)與數(shù)據(jù)請求進行分層處理;所不同的是面向數(shù)據(jù)庫的數(shù)據(jù)請求實現(xiàn)的位置:圖1
在客戶機端實現(xiàn),圖2在服務(wù)器端實現(xiàn).在服務(wù)器端實現(xiàn)的主要優(yōu)點為:(1)對于空間對象模型及相關(guān)的計算模式的升級可以只在服務(wù)器端實現(xiàn),而且對客戶機端透明;(2)由于SDE服務(wù)器與數(shù)據(jù)庫ORACLE7.2的結(jié)合非常緊密,因此數(shù)據(jù)的搜尋速度非常快.對于圖1來說,把數(shù)據(jù)請求層放在客戶機端,對數(shù)據(jù)庫的依賴程度就不同于SDE服務(wù)器,后者對數(shù)據(jù)庫的選型有極強的依賴性(目前SDE服務(wù)器只在ORACLE7.2實現(xiàn)),相反,它是一種非常開放的結(jié)構(gòu),它所支持的服務(wù)器不但可跨數(shù)據(jù)庫系統(tǒng)平臺,而且還可跨操作系統(tǒng)平臺.可以說,圖1和圖2兩種設(shè)計模式的優(yōu)缺點是相互對應(yīng)的.
3數(shù)據(jù)庫訪問方式的比較
基于程序的訪問數(shù)據(jù)庫的幾種方法如下.
(1)專用的數(shù)據(jù)庫訪問工具.如PowerBuilder,Delphi等,它偏向于對數(shù)據(jù)庫中數(shù)據(jù)的管理和顯示,具有限的計算功能.既不適于用它來開發(fā)GIS應(yīng)用系統(tǒng),也難以將它們的數(shù)據(jù)操縱功能與現(xiàn)有的GIS應(yīng)用系統(tǒng)緊密結(jié)合.
(2)嵌入數(shù)據(jù)庫語言的常規(guī)語言.各數(shù)據(jù)庫廠家為了讓用戶程序能直接訪問自已的數(shù)據(jù)庫,基本上都提供了專有的面向C語言的預(yù)編譯頭和靜態(tài)庫,如Sybase公司的OPENCLIENT和ORACLE的PRO*C.字串5
(3)開放數(shù)據(jù)庫互連性應(yīng)用編程接口(opendatabaseconnectivityapplicationprogramminginterface,簡稱ODBCAPI)[2,3].它是微軟(Microsoft)公司提出的數(shù)據(jù)庫訪問形式.它通過確保所有的應(yīng)用系統(tǒng)遵循標準的調(diào)用層接口,提供對特定數(shù)據(jù)源命令進行解釋的驅(qū)動程序來保持應(yīng)用系統(tǒng)的互用性.這樣的應(yīng)用系統(tǒng)是開放的,只要有相應(yīng)數(shù)據(jù)源的ODBC的驅(qū)動,它就無需改變代碼而可訪問相應(yīng)的數(shù)據(jù)庫.
在確定訪問數(shù)據(jù)庫的方式時,ODBCAPI的開放性的優(yōu)勢是不言而喻的,但這種方式在效率上不如第二種訪問形式.應(yīng)說明的是:ODBCSQL語法分為3層,即最小層、核心層和擴展層,盡管目前的大型數(shù)據(jù)庫都能支持到擴展層,但為了保證應(yīng)用系統(tǒng)的開放性,在具體編程實現(xiàn)時,盡量只使用最小層和核心層的語法.
4某電信局配線系統(tǒng)的實現(xiàn)
客戶機為MAPGIS/ODBC/WINDOWS95,服務(wù)器為SQLSERVER/WINDOWSNT,要訪問的相關(guān)表中記錄約為13萬條.要求從地理底圖上選中某一DP,在數(shù)據(jù)庫中尋找出從這一DP到配線架的可用通路,并在數(shù)據(jù)庫中作相應(yīng)配線修改.如圖3所示.結(jié)果表明:(1)程序?qū)崿F(xiàn)了MAPGIS訪問網(wǎng)絡(luò)數(shù)據(jù)庫的功能;(2)客戶機和服務(wù)器均為PC機(主頻166MHz),每次操作反應(yīng)時間為數(shù)秒,換機觀察,發(fā)現(xiàn)服務(wù)器的性能是整個網(wǎng)絡(luò)計算的瓶頸.
字串8
5結(jié)論
(1)C/S模式為目前網(wǎng)絡(luò)平臺GIS的首選,將GIS功能與數(shù)據(jù)庫訪問分層實現(xiàn)有利于保護現(xiàn)有的開發(fā)成果;(2)將數(shù)據(jù)請求層放在客戶端和以O(shè)DBC作為數(shù)據(jù)庫的訪問方式保證了應(yīng)用系統(tǒng)的開放性,其訪問可跨越數(shù)據(jù)系統(tǒng)和操作系統(tǒng)平臺;(3)實例表明,應(yīng)用系統(tǒng)的反應(yīng)速度更多取決于服務(wù)器的性能,而不是ODBC的效率.
參考文獻
計算機技術(shù)的飛速發(fā)展,為古典文獻研究的現(xiàn)代化提供了堅實的基礎(chǔ),其貢獻是有目共睹的。然而,計算機技術(shù)在古典文獻研究中的運用仍然存在著極為嚴重的缺陷也是不容回避的。筆者近幾年來主持并直接參加設(shè)計“e書庫”數(shù)據(jù)庫的過程中,感到有必要將自己的一些想法提供給正在設(shè)計有關(guān)軟件的計算機專業(yè)人員、愿意使用該類軟件的專家學(xué)者們參考。
一、我國古典文獻數(shù)據(jù)庫建設(shè)的歷程
自古以來,歷代學(xué)者對古典文獻整理與研究一直沿襲手工操作的方式,然而自上世紀80年代后,計算機技術(shù)開始涉入到古典文獻研究中,對傳統(tǒng)的古典文獻整理與研究方法(自然也對一切需要使用古典文獻資料的專業(yè)研究)起到了極大沖擊。
首先簡單回顧一下計算機技術(shù)在古典文獻研究領(lǐng)域內(nèi)發(fā)展的歷程。上世紀80年代初,我國一些圖書館、大專院校及科研機構(gòu)陸續(xù)開始大規(guī)模地利用計算機設(shè)計并建立數(shù)據(jù)庫。大致說來有兩類數(shù)據(jù)庫,一類是書目數(shù)據(jù)庫,一類是文獻數(shù)據(jù)庫。南京圖書館于90年代初率先建立書目數(shù)據(jù)庫,對讀者檢索有關(guān)書目起到了極大的幫助。之后,各地圖書館紛紛效尤,類似的書目數(shù)據(jù)庫很快就普及了。雖說至今各地圖書館的書目數(shù)據(jù)庫的檢索方式,仍存在機讀編碼格式不統(tǒng)一的問題,然而書目數(shù)據(jù)庫提供的方便快捷的查詢功能,對讀者來說無疑是一件大好事,具體到學(xué)術(shù)研究來說,至少為研究者提供了一個比較方便的查找有關(guān)古典文獻的實用工具。
在建立書目數(shù)據(jù)庫的同時,一些大專院校與科研機構(gòu)開始研發(fā)各自的文獻數(shù)據(jù)庫。從數(shù)據(jù)制作格式來說,大致可以區(qū)分為兩類,一類是圖像格式,即將按原著內(nèi)容掃描成PDF圖像文本,另一類是元數(shù)據(jù)格式,即錄入文獻文本內(nèi)容(或掃描并轉(zhuǎn)化為電子文本)導(dǎo)入數(shù)據(jù)庫,并轉(zhuǎn)換成可閱讀與檢索的數(shù)據(jù)庫機讀格式。一般說來,無論是PDF格式還是元數(shù)據(jù)格式,它們數(shù)據(jù)庫容量都較大,也提供了較為原始的檢索方式,為學(xué)術(shù)研究提供了不小的幫助。從上述兩類制作格式的數(shù)據(jù)庫來說,PDF圖像文本可以直接閱讀圖像文字,但總體說來不太適應(yīng)古典文獻整理與研究的需要。而元數(shù)據(jù)格式較為精致,初步具備了較為方便的常用的功能,可以檢索、作卡片等等。
古典文獻數(shù)據(jù)庫從收錄的文獻內(nèi)容來說,大致可以分為兩類:一類是類目數(shù)據(jù)庫,即按“類”收錄有關(guān)圖籍,如經(jīng)學(xué)類、史學(xué)類、文學(xué)類以及甲骨文、金文或出土文獻資料、石刻資料等等,另一類是綜合數(shù)據(jù)庫,如《四庫全書》、《四部叢刊》、《國學(xué)寶典》之類數(shù)據(jù)庫。
大陸最早的古典文獻數(shù)據(jù)庫是河南大學(xué)的《宋人筆記檢索系統(tǒng)南宋主要歷史文獻》,建立于1987年。之后,各種數(shù)據(jù)庫紛紛涌現(xiàn),比較重要的有南京大學(xué)、河南大學(xué)、蘇州大學(xué)聯(lián)合研制的《計算機甲骨文信息處理系統(tǒng)》、中國社會科學(xué)院《全唐詩》、《先秦魏晉南北朝詩》、《全上古三代秦漢三國六朝文》、《十三經(jīng)》、《全唐文》、《諸子集成》等數(shù)據(jù)庫、北京大學(xué)《全宋詩》數(shù)據(jù)庫、南京師范大學(xué)《全唐五代宋詞》數(shù)據(jù)庫、四川大學(xué)《宋會要輯稿》數(shù)據(jù)庫(與海外合作)等等。港臺古籍數(shù)字化起步較早,均采用繁體字形式。1984年臺灣中央研究院歷史語言研究所開始研發(fā)《漢籍全文資料庫》,香港中文大學(xué)則有《漢及以前全部傳世文獻》、《魏晉南北朝全部傳世文獻》、《竹簡帛書出土文獻》數(shù)據(jù)庫等等。其中《竹簡帛書出土文獻》收錄《馬王堆漢墓帛書》、《武威漢簡》、《睡虎地秦墓?jié)h簡》、《銀雀山漢簡》、《居延漢簡釋文合?!芳捌渌⒁姾啝┕?40多萬字的竹簡帛書出土文獻,價值頗高。
值得注意的是,這些數(shù)據(jù)庫主要是提供給本單位研究人員使用的,當然也有部分數(shù)據(jù)庫對外開放,為其他研究者提供一定幫助。雖然這些數(shù)據(jù)庫有種種限制,但它們無疑為古典文獻的研究(當然包括其它專業(yè)的學(xué)術(shù)研究)提供了方便。之后,隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,各科研機構(gòu)、大專院校、各地方的圖書館、以及其它數(shù)以百計的網(wǎng)站向用戶提供收費或不收費的古籍文獻檢索服務(wù),甚至還提供古籍文獻的下載服務(wù)。顯然,這些工作的開展,為學(xué)術(shù)研究的現(xiàn)代化提供了極為有力的支持。至今為止,據(jù)筆者所查索到的除科研機構(gòu)、大專院校、各地圖書館數(shù)據(jù)庫之外,提供各種文獻下載的中文網(wǎng)站至少在200個以上,其中就有不少古籍文獻下載的網(wǎng)站。這些古典文獻數(shù)據(jù)庫或有關(guān)網(wǎng)站的建立,確實為古典文獻整理與研究乃至其它學(xué)術(shù)研究提供了極有價值的幫助。
二、目前存在的問題
當然,我們也應(yīng)該清醒地看到,在古典文獻數(shù)據(jù)庫大量涌現(xiàn)的同時,一些潛在的問題與數(shù)據(jù)庫本身的缺陷嚴重地制約著古典文獻數(shù)據(jù)庫的正常發(fā)展。
從古典文獻數(shù)據(jù)庫技術(shù)發(fā)展角度來說,筆者認為大致經(jīng)過三個發(fā)展階段。第一階段是PDF圖像文本數(shù)據(jù)庫,其數(shù)據(jù)來源主要是以掃描方式獲得,形成PDF圖像文本。這種圖像文本優(yōu)點是直觀,與原書分毫不差,但它的缺點是功能極其單一,僅可供瀏覽圖像和簡單地檢索書目。雖然第一階段的數(shù)據(jù)庫功能極少,但畢竟能方便而直觀地閱讀文獻了,因此引起了學(xué)者們廣泛的興趣。必須指出的是,由于功能太少,這類數(shù)據(jù)庫難以進一步發(fā)展。
第二階段是元數(shù)據(jù)數(shù)據(jù)庫,以香港迪志公司投資、書同文數(shù)字化技術(shù)有限公司設(shè)計、上海人民出版社出版的《四庫全書》、書同文數(shù)字化技術(shù)有限公司設(shè)計、萬方數(shù)據(jù)電子出版社的《四部叢刊》、尹小林《國學(xué)寶典》、南開大學(xué)永川公司的《二十四史》,以及大陸、港臺等大專院校或科研機構(gòu)制作的較大型的數(shù)據(jù)庫為代表。它們的優(yōu)點是具有較多的基本功能,如檢索、卡片、打印等功能,有些還附加了日歷查詢、字典、音樂背景等附加功能。然而,它們都不允許對數(shù)據(jù)庫內(nèi)的文本錯誤進行修訂、沒有圖表處理能力、不提供功能升級服務(wù)(某些軟件提供所謂新版本,實際上只是增加一些文獻文本,并未真正提升軟件服務(wù)功能)。而且由于各自為政,開發(fā)者大都采取自定義方法來自造非常用的生僻詞,因此各種數(shù)據(jù)庫之間字庫不能相互兼容。這一階段的古典文獻數(shù)據(jù)庫也有吸收第一階段數(shù)據(jù)庫有圖像的優(yōu)點,如上述提及的《四庫全書》就附有圖像,以利研究者核對文字。該階段絕大多數(shù)數(shù)據(jù)庫注意到版權(quán)問題,但仍有一些數(shù)據(jù)庫在版權(quán)上出現(xiàn)較大問題,乃至引起法律糾紛。
計算機技術(shù)廣泛地涉入文科研究領(lǐng)域,各種古典文獻數(shù)據(jù)庫紛紛建立,當然給古典文獻整理與研究的現(xiàn)代化提供了極其有利的幫助,然而,在筆者看來,目前計算機技術(shù)在這一領(lǐng)域中的運用形成紛亂無序的“戰(zhàn)國時代”,有許多亟待解決的問題,否則將會影響或說削弱計算機技術(shù)在古典文獻研究(乃至其它學(xué)術(shù)研究)中巨大作用。對此弊病,筆者擬作一概述,企望引起有關(guān)部門、數(shù)據(jù)庫開發(fā)者及使用者的重視,以期真正使計算機技術(shù)對古典文獻整理與研究起到更大的促進作用。大致說來,主要問題有以下幾個方面:
其一,缺乏整體領(lǐng)導(dǎo)與規(guī)劃,國家投資與收益不對稱。當然,首先應(yīng)該看到,國家有關(guān)部門已經(jīng)著手做了一些規(guī)劃,也實施建立一些比較大的古典文獻數(shù)據(jù)庫,如2002年10月,國家科技圖書文獻中心受科技部的委托,牽頭聯(lián)合中國科技信息研究所、國家圖書館、上海圖書館、中科院圖書館、北京大學(xué)圖書館等單位,啟動了我國數(shù)字圖書館標準規(guī)范建設(shè)項目。這一項目的目的就是力圖建立我國比較統(tǒng)一和規(guī)范的數(shù)字圖書館標準,自然也會對建立古典文獻數(shù)據(jù)庫有較大的借鑒與參考的價值。又如北京大學(xué)《中國基本古籍庫》、上海圖書館《古籍影像光盤制作及檢索系統(tǒng)》等等,也由國家有關(guān)部門投入大量資金,而且已經(jīng)啟動并完成了部分內(nèi)容。不過也應(yīng)該強調(diào),由于國家沒有制定出一個比較符合國內(nèi)數(shù)據(jù)庫發(fā)展狀況的真正有價值的規(guī)范體系,因此這些項目的承擔者仍是各自為政,數(shù)據(jù)庫之間并不能兼容,不可能形成技術(shù)“合力”。再從所取得的社會效益或說實際使用價值來看,也不盡人意。因為至今為止建立的各種數(shù)據(jù)庫仍人為地設(shè)置許多障礙,無法使它們實現(xiàn)較大的使用價值。數(shù)據(jù)庫由國家投資,收益自然應(yīng)該歸國家,或者成為不收費的公益數(shù)據(jù)庫,但目前收益既不歸國家,又未能成為公益數(shù)據(jù)庫,這不能不說是個極大的遺憾。實際上,數(shù)據(jù)庫制作者無償利用國家投資進行了開發(fā),制作完成后卻獲得相當豐厚的收益,使人感到有“國家投資,個別單位圖利”的印象。筆者不反對交納一定使用費用,但收費單位一定應(yīng)該說明收費后去向,絕不允許產(chǎn)生國家投資而由個別單位乃至某些個人得利的情況。
其二,開發(fā)商嗜利忘義,數(shù)據(jù)庫錯誤嚴重。除上述由國家投資開發(fā)的古典文獻數(shù)據(jù)庫外,還有一些有一定技術(shù)實力的軟件開發(fā)商加入到古典文獻數(shù)據(jù)庫的開發(fā)中來了。比較而言,各科研機構(gòu)、大專院校及各地圖書館建立的古典文獻數(shù)據(jù)庫質(zhì)量較高,而開發(fā)商則很少關(guān)注數(shù)據(jù)庫中的文獻質(zhì)量。我們承認確有少量開發(fā)商制作的數(shù)據(jù)庫質(zhì)量較高,如迪志公司開發(fā)的《四庫全書》之類,然而象《四庫全書》這樣的數(shù)據(jù)庫確實鳳毛麟角,難以尋覓。我們發(fā)現(xiàn),甚至有些開發(fā)商僅僅是把文本進行文字掃描導(dǎo)入,疏于校對,因此文本錯誤百出,難以卒讀。由于利益驅(qū)使,絕大多數(shù)開發(fā)商都以“獨自開發(fā)”為己任,數(shù)據(jù)庫設(shè)計相互保密,互不兼容,使用戶深感不便。這些問題已嚴重地影響到古典文獻數(shù)據(jù)庫的正常發(fā)展了。
其三,熱門文獻數(shù)據(jù)重復(fù),冷門文獻數(shù)據(jù)罕見。雖說目前數(shù)據(jù)庫品種繁多,但由于考慮到使用者對文獻內(nèi)容的需求,因此許多開發(fā)者熱衷于開發(fā)那些熱門數(shù)據(jù),而一些比較冷門的文獻則鮮有人問津。實際上,冷門的文獻并非是沒有學(xué)術(shù)價值的文獻,只是使用人較少而已。因而,目前不但數(shù)據(jù)庫中文獻內(nèi)容重復(fù)現(xiàn)象極為普遍,甚至同名同姓的數(shù)據(jù)庫也有不少,如《四庫全書》就出現(xiàn)了武漢大學(xué)版、上海人民出版社版等數(shù)種不同版本。且不說那些數(shù)量繁多、質(zhì)量也不甚高的數(shù)據(jù)庫浪費了多少人力物力,其實也使用戶陷入無可適從、欲舍不能的境地。用戶往往為了某些少量文獻內(nèi)容不得不購買和安裝整個數(shù)據(jù)庫操作系統(tǒng),而且這些龐大的數(shù)據(jù)庫大量占據(jù)硬盤空間,導(dǎo)致計算機運行速度大為減慢。而那些允許網(wǎng)上檢索的文獻數(shù)據(jù)庫又往往容量極大,上網(wǎng)檢索者多,導(dǎo)致“交通阻塞”!
其四,技術(shù)關(guān)卡重重,難以互相兼容。各開發(fā)者既鑒于不同開發(fā)目的與技術(shù)條件,又為防止他人解密,因此在開發(fā)過程中在數(shù)據(jù)庫某些程序中人為設(shè)置技術(shù)障礙,以保障自己利益不受損害。自然,開發(fā)者需要投入大量人力物力,保障本身利益不受損害是無可非議的。然而也由于人為地設(shè)置了障礙,卻使各種文獻數(shù)據(jù)庫之間不能兼容,無法形成合力,先進的技術(shù)反而成為技術(shù)壁壘。實際上,這一情況大大浪費了寶貴的人力資源與財力,對古典文獻的開發(fā)與利用有百害而無一利。另外,由于技術(shù)壁壘,在古典文獻數(shù)據(jù)庫的文字方面更導(dǎo)致許多問題。我國古籍常用漢字大約為4萬余個,這還不包括超過2萬個異體字及數(shù)千甲骨文、金文等古文字。然而我國目前在計算機上采納的國標字庫(GB)和擴展字庫(GBK),兩者相加也只有27000余字,這與我國古籍常用漢字數(shù)量相比,實在差距太大。因此,如此小的字庫與需求相比確實是捉襟見肘。為了彌補這一缺陷,一些軟件設(shè)計者就采取在自定義區(qū)自造字(乃至占據(jù)字庫中擴展B的位置)、有些也用圖片方式來填字。而這些自造字、圖片字,拷貝到WORD文本之后,由于內(nèi)碼位置的差異就變成其它字了,從而導(dǎo)致文本錯誤。
其五,功能單調(diào),難以真正為科研服務(wù)。建立較早的古典文獻數(shù)據(jù)庫功能比較單調(diào),只能做些簡單檢索、拷貝,沒有更為先進的功能,不能適應(yīng)學(xué)術(shù)研究的需要。后來的一些古典文獻數(shù)據(jù)庫也存在類似問題,例如《四庫全書》的檢索功能,雖說可以采用添加“作者”、“書名”等限定條件,但檢索結(jié)果只是羅列一排出處,無法直觀地了解檢索到的具體內(nèi)容。而且《四庫全書》也沒有提供更多的功能給用戶,因此這一巨大的工程仍遠遠不能滿足用戶的需求。況且這一數(shù)據(jù)庫目前已經(jīng)“定型”,不再繼續(xù)開發(fā),使用戶對此深感遺憾。而其它古典文獻數(shù)據(jù)庫設(shè)計者的思維大多仍停留在“文本之爭”當中,重復(fù)著原來設(shè)計思想的錯誤,沒有更多地開發(fā)為科研服務(wù)的有效功能,因此在筆者看來,這一做法顯然不可能真正擺脫古典文獻數(shù)據(jù)庫目前面臨著的困境。
其六,學(xué)術(shù)圈地,使人心有余而力難用。解放后,一些國家級出版社化費了極大的精力,組織專家點校了不少重要古籍,為學(xué)術(shù)研究的發(fā)展作出了極大貢獻。然而時至計算機時代的來臨,卻出現(xiàn)了“版權(quán)”的問題。一些制作者忽視了國家有關(guān)版權(quán)法規(guī),直接利用了一些出版社的成果來牟取經(jīng)濟利益,理所當然地會產(chǎn)生版權(quán)糾紛。筆者以為,保護版權(quán)是每個學(xué)者乃至每個公民應(yīng)盡的責任,根本毫無討價還價的余地。然而問題是,現(xiàn)在一些出版社由于各種原因,沒有對自己已出版的點校過的古籍進行開發(fā),而愿意開發(fā)這些古籍資源者卻無法涉入其中,導(dǎo)致他們處于既想開發(fā)這一寶藏又無法回避版權(quán)問題的尷尬境地,這就使眾多需要使用者望洋興嘆。如果有關(guān)出版社不愿授權(quán),那么想要開發(fā)這些古籍者只能返回到?jīng)]有標點的原始文本中去。這種情況確實使每一個希望使用古典文獻數(shù)據(jù)庫的用戶感到極其失望,而且嚴重影響了古典整理與研究的現(xiàn)代化進度。
上述種種現(xiàn)實情況,已經(jīng)是制約計算機技術(shù)對古典文獻整理與研究支持的瓶頸了,如果不解決這些問題,計算機技術(shù)即使再發(fā)達,恐怕也難以對古典文獻整理與研究予以真正意義上的支持與幫助。
三、如何解決古典文獻數(shù)據(jù)庫存在的問題
古典文獻數(shù)據(jù)庫存在的問題是十分明顯的,那么如何解決這些問題,以利學(xué)術(shù)研究(當然包括文獻研究)的迅速發(fā)展?筆者以為現(xiàn)在應(yīng)該設(shè)計和開發(fā)出新一代文獻數(shù)據(jù)庫的軟件。按照筆者設(shè)想,這代軟件應(yīng)該以建立能自由升級的公共古典文獻數(shù)據(jù)庫為目的,是一種以提供強大功能為主、徹底解決版權(quán)問題的數(shù)據(jù)庫,實際上是建立一個規(guī)模巨大的功能相對完善的學(xué)術(shù)研究資源庫。所謂公共古典文獻數(shù)據(jù)庫是綜合性數(shù)據(jù)庫,只能由國家有關(guān)部門作為主要規(guī)劃者,它應(yīng)該盡可能地包羅我國傳世古典文獻、碑刻資料和出土文獻等。在此基礎(chǔ)上允許建立適應(yīng)每個研究者研究范圍的個性化的文獻檢索服務(wù)系統(tǒng)。個性化的文獻檢索服務(wù)系統(tǒng)是指每個具體研究者所擁有的安裝在各自計算機上的文獻檢索服務(wù)系統(tǒng),它擁有一定數(shù)量的適合自己研究的范圍的古典文獻文本。其實,各個研究者并不需要一個“包羅萬象”的規(guī)模極其巨大的數(shù)據(jù)庫,即使象占據(jù)6至7個G硬盤的《四庫全書》,具體到一個研究者真正需要的內(nèi)容并不是全部,而是其中一部分內(nèi)容。
問題的關(guān)鍵在于公共古典文獻數(shù)據(jù)庫與個性化文獻檢索服務(wù)系統(tǒng)兩者之間的技術(shù)“契合”,即兩者互相兼容的程度。公共古典文獻數(shù)據(jù)庫應(yīng)該與個性化文獻檢索服務(wù)系統(tǒng)有所區(qū)別,公共古典文獻數(shù)據(jù)庫應(yīng)該側(cè)重于文獻數(shù)量的完善、完備,而個性化文獻檢索服務(wù)系統(tǒng)則應(yīng)該考慮其功能強大。因此,從本質(zhì)上說,公共古典文獻數(shù)據(jù)庫應(yīng)該是一個統(tǒng)一的設(shè)計比較周密、與其它個性化數(shù)據(jù)庫在技術(shù)上能實現(xiàn)良好兼容的的數(shù)據(jù)庫;而個性化文獻檢索服務(wù)系統(tǒng)應(yīng)該是“百花齊放”式的但必須能與公共古典文獻數(shù)據(jù)庫兼容而非各自為政的小型數(shù)據(jù)庫。兩者關(guān)系是源與流的關(guān)系。鑒于此,筆者以為目前應(yīng)該從兩個層次上來解決問題,一是盡快建立公共古典文獻數(shù)據(jù)庫;一是繼續(xù)開發(fā)個性化文獻檢索服務(wù)系統(tǒng)。
根據(jù)筆者近幾年的實踐,感到要解決這些問題并非不可能的。其實只要認真對目前計算機技術(shù)在古典文獻整理與研究中存在的問題作一分析與梳理,重點突破一些瓶頸問題,應(yīng)該說是能解決上述這些問題的。那么怎么才能突破上述這些瓶頸呢?筆者以為以下幾個方面是值得考慮的。
其一,加強總體規(guī)劃,建立公共古典文獻數(shù)據(jù)庫。作為一個具體單位來說,誰也沒有可能建立一個包羅萬象的古典文獻數(shù)據(jù)庫,因此,這只能由國家有關(guān)部門組織人力物力來完成。其實,就目前來說,國家投入資金并不少,但由于制度原因,只是向某些重點院?;蚩蒲袉挝?、向重點項目投入巨資,而這些單位建立起各自為政的古典文獻數(shù)據(jù)庫、期刊數(shù)據(jù)庫,雖然也為學(xué)術(shù)研究作了一些貢獻,但不可否認的是,由于各自設(shè)計思路不同,相互之間不能兼容,已經(jīng)妨礙到數(shù)據(jù)庫進一步發(fā)展了。以筆者愚見,國家有關(guān)部門應(yīng)該主動負起責來,加強領(lǐng)導(dǎo),重新考慮古典文獻數(shù)據(jù)庫的立項問題,組織力量、投入資金,真正建立起一個規(guī)模巨大、能為絕大多數(shù)研究者利用的公共古典文獻數(shù)據(jù)庫。同時也應(yīng)該考慮所立項的古典文獻數(shù)據(jù)庫與其它數(shù)據(jù)庫(如現(xiàn)代文獻數(shù)據(jù)庫、當代文獻數(shù)據(jù)庫、期刊數(shù)據(jù)庫等)之間的兼容關(guān)系,只有這樣,或許若干年之后就能建立起一個價值極大的能真正為學(xué)術(shù)服務(wù)的公共古典文獻數(shù)據(jù)庫,乃至包羅一切文獻的數(shù)據(jù)庫。當然,就公共古典文獻數(shù)據(jù)庫來說,可以進行適量收費服務(wù),但主要仍應(yīng)該定位在“公益”上,不以“利”為主,這樣才能真正建立一個有價值的公共古典文獻數(shù)據(jù)庫來。
其二,數(shù)據(jù)庫內(nèi)容與文獻檢索服務(wù)系統(tǒng)分離。這個問題與上述問題是緊密關(guān)聯(lián)在一起的,如果不能真正做到數(shù)據(jù)庫內(nèi)容與文獻檢索服務(wù)系統(tǒng)分離,那么目前“列國紛爭”的面貌是不可能真正解決的。
我們知道,一個古典文獻數(shù)據(jù)庫實際上是兩大部分組成的,一是古典文獻數(shù)據(jù)庫內(nèi)容,即數(shù)據(jù)庫所包括的文獻文本,二是對這些數(shù)據(jù)進行管理的文獻檢索服務(wù)系統(tǒng)。其實目前所見有關(guān)古典文獻數(shù)據(jù)庫都是“兩者合一”,即既包含一些文獻數(shù)據(jù)內(nèi)容,又有具體的操作服務(wù)系統(tǒng)。事實上,這些古典文獻數(shù)據(jù)庫在功能上明顯存在缺陷的。就目前古典文獻數(shù)據(jù)庫管理形式來說,一是網(wǎng)絡(luò)管理,一是個人管理。前者是網(wǎng)絡(luò)數(shù)據(jù)庫,一般是單位所擁有的數(shù)據(jù)庫,即我們所說的網(wǎng)絡(luò)版,后者是安裝在個人電腦中的個人版。就功能來說,網(wǎng)絡(luò)版沒有必要具有卡片、文本修訂、書簽等個性化的功能,個人版應(yīng)該具有做卡片、文本修訂、書簽、文獻管理等個性化的功能。就文獻數(shù)量來說,網(wǎng)絡(luò)版自然力求文獻內(nèi)容豐富,盡可能包羅文獻文本,而個人版實際所需要的文獻數(shù)量是根據(jù)各自研究需要而定的,因而強行“規(guī)定”使用所有文獻內(nèi)容并不值得肯定。就文獻內(nèi)容來說,網(wǎng)絡(luò)版與個人版都應(yīng)該允許不斷地增加其數(shù)據(jù)庫文獻內(nèi)容,但不同的是,網(wǎng)絡(luò)版應(yīng)該是只增不減,而個人版應(yīng)該允許用戶根據(jù)研究需要自由增減文獻內(nèi)容。
在筆者看來,應(yīng)該從單純的文本內(nèi)容競爭的思維中解脫出來,進入以文獻檢索服務(wù)系統(tǒng)競爭為主,文本竟爭為輔的體系,或許是解決古籍文獻數(shù)據(jù)庫的出路。也就是說,擅長計算機技術(shù)的開發(fā)者(開發(fā)商)應(yīng)該注重文獻檢索服務(wù)功能的開發(fā)與完善,而具體文本的整理可由研究學(xué)術(shù)的專業(yè)人士來完成。這樣,開發(fā)者就可能開發(fā)出比較成功的文獻檢索服務(wù)系統(tǒng),而數(shù)據(jù)庫中的文本也由于專業(yè)人士的加入而能大大提高文本的準確率,然后合成為一個規(guī)模較大的公共古典文獻數(shù)據(jù)庫。當然,輸入和整理古典文獻文本可以采用投標(或以申報項目形式)來確定,規(guī)定統(tǒng)一格式,要求保證文本的正確率達到一定比例,完成后再分別導(dǎo)入這一公共古典文獻數(shù)據(jù)庫中;經(jīng)過若干年努力,最終能形成一個規(guī)模巨大、適應(yīng)于學(xué)術(shù)研究的公共古典文獻數(shù)據(jù)庫。我想,采取這種措施不但節(jié)省了大量重復(fù)投資,真正做到人盡其才,物盡其用,而且一旦建立起這個規(guī)模巨大的公共古典文獻數(shù)據(jù)庫,可以解決了目前數(shù)據(jù)庫泛濫、文本錯誤太多、重復(fù)勞動等弊病,而且真正能做到廣大學(xué)者對古典資源“共享共有”。
在此基礎(chǔ)上,各個開發(fā)商可以力求開發(fā)學(xué)者們個性化的文獻檢索服務(wù)系統(tǒng),它無須考慮文獻文本內(nèi)容,但必須功能強大、操作方便,并與公共古典文獻數(shù)據(jù)庫完全兼容,學(xué)者們通過“購買”文本或其它方式來方便地組建自己的數(shù)據(jù)庫,這樣或許會給學(xué)術(shù)研究帶來真正的方便。
還須補充的是,我國的古典文獻中有大量表格與圖片,而由于技術(shù)原因,目前所有古典文獻數(shù)據(jù)庫都沒有導(dǎo)入原著的表格與圖片,極個別數(shù)據(jù)庫有少量圖片也是不能檢索,這是目前眾多古典文獻數(shù)據(jù)庫的重大失誤之一。其實只要真正化力氣去探索,這個問題是不難解決的。因為筆者曾作過設(shè)計并反復(fù)試驗,只要設(shè)計合理,圖片與表格不但可以導(dǎo)入數(shù)據(jù)庫,而且都是可以在數(shù)據(jù)庫中進行檢索。
其三,加速確定字庫方案,以利數(shù)據(jù)庫健康發(fā)展。當然,要真正解決公共古典文獻數(shù)據(jù)庫問題,還必須解決字庫問題。目前,國家雖然組織專家在論證有關(guān)字庫問題,然而由于進程不快,遠遠落后于當今計算機技術(shù)發(fā)展的需要。按照筆者的看法,應(yīng)該建立一個以Unicode字庫為基礎(chǔ)的、適應(yīng)漢語古籍需要的、并與國際接軌的真正有中國特色的字庫。這就需要抓緊工作,迅速落實擴展字庫B的內(nèi)碼。同時根據(jù)我國漢字的具體特點,對自定義區(qū)域的6400字的內(nèi)碼配置也應(yīng)該有所規(guī)范,這樣才能使?jié)h語字庫統(tǒng)一問題落實到實處。如果真能做到如此,那么就能真正解決目前古典文獻數(shù)據(jù)庫之間字庫互不兼容問題。
與字庫相關(guān)聯(lián)的是字體問題。古典文獻數(shù)據(jù)庫應(yīng)該考慮到古代文獻對文字的特殊需要,筆者以為凡是古代文獻數(shù)據(jù)庫中的文本應(yīng)該保留繁體字,以防繁簡不分而導(dǎo)致文義偏差。就目前計算機技術(shù)來說,解決這一問題是毫無困難的。其實用繁體字輸入文本早已不是問題,而掃描古籍文本再轉(zhuǎn)換成文字的技術(shù)也十分成熟,如北京書同文公司的“數(shù)碼翰林”O(jiān)CR識別系統(tǒng),應(yīng)該說是極有價值的識別軟件,對絕大多數(shù)繁體文字能夠正確識別。如果能再進一步加以改進,使擴充字庫數(shù)量并與Unicode字庫兼容,那么古代文獻的文字識別問題是可以得到解決的。應(yīng)該強調(diào)的是,古代文獻以繁體字導(dǎo)入數(shù)據(jù)庫,但應(yīng)該允許在數(shù)據(jù)庫中自由進行繁簡轉(zhuǎn)換,換句話說,若需要使用繁體字時,文本可以保留繁體字,而需要簡體時,可以十分方便地轉(zhuǎn)換成簡體,這樣就適應(yīng)用戶對繁簡體的不同需要了。
其四,徹底解決古典文獻版權(quán)問題。這是困撓計算機古典文獻數(shù)據(jù)庫建設(shè)的重要難題之一。自然,這一問題要真正得到落實確實存在相當困難的,因為版權(quán)保護工作任重道遠!不過,即使困難再大,古籍文獻數(shù)據(jù)化的發(fā)展的潮流是不可能停止的。筆者以為,有關(guān)出版社在維護自身法定的版權(quán)權(quán)益的前提下,應(yīng)該從大局出發(fā),在收取一定數(shù)量的報酬前提下,允許制作有關(guān)古典文獻的數(shù)據(jù)庫,以利學(xué)術(shù)研究的發(fā)展。至于報酬多少可以也應(yīng)該實事求是地酌情商定,國家有關(guān)部門應(yīng)該主動與那些出版社協(xié)調(diào),亦可將目前大量分散投入到各課題中的資金中抽出部分來補償有關(guān)出版社,雙贏互利,以求突破版權(quán)瓶頸,早日解決這一棘手的問題。
與此相關(guān)的是古典文獻電子文本的版權(quán)問題,這也是個極難處理的問題。因為用戶若貪圖小利,版權(quán)意識不強,不愿化費代價使用電子文本,就容易產(chǎn)生“盜版”問題,如此就使得制作古典文獻電子文本者的正當利益大受損失。按筆者設(shè)想,如果真正能夠由國家有關(guān)部門主管古典文獻數(shù)據(jù)庫建設(shè)工作,那么就可以設(shè)想建立公共古典文獻數(shù)據(jù)庫規(guī)定導(dǎo)入數(shù)據(jù)庫的文獻文本都給予一個“統(tǒng)一編號”,沒有統(tǒng)一編號的文獻就不能直接導(dǎo)入公共古典文獻數(shù)據(jù)庫和個人使用的文獻檢索服務(wù)系統(tǒng)中,也就是說,個人使用古典文獻電子文獻必須化費一定的代價才能取得使用權(quán),這樣就可以保證制作古典文獻電子文本者的一定收益,防止版權(quán)意識不強者侵權(quán)使用。同時由于古典文獻電子文本都有了統(tǒng)一編號,那么也就可以防止某一具體文獻文本重復(fù)錄入的問題。即使有部分重復(fù),古典文獻電子文本也可以在用戶選擇過程中優(yōu)勝劣汰。
中圖分類號:TP311 文獻標識碼:A 文章編號:1673-9795(2013)03(b)-0172-01
計算機數(shù)據(jù)庫作為現(xiàn)代化發(fā)展所不可或缺的計算機應(yīng)用系統(tǒng)中重要的組成部分,在面對大量的數(shù)據(jù)及信息的處理及應(yīng)用過程中,不但有效的減少了人力操作,還科學(xué)的實現(xiàn)了大量數(shù)據(jù)信息的及時存儲與共享調(diào)用,為多項工作的開展提供準確的數(shù)據(jù)支持及更為廣泛的信息來源,計算機數(shù)據(jù)庫技術(shù)的高效應(yīng)用與發(fā)展,為現(xiàn)代化建設(shè)工作的開展,尤其是推動信息化建設(shè)的進程,具有重要的技術(shù)支持性作用。
1 計算機數(shù)據(jù)庫的發(fā)展概述
在20世紀60年代,數(shù)據(jù)庫技術(shù)作為計算機領(lǐng)域一項重要的數(shù)據(jù)管理技術(shù),其產(chǎn)生及發(fā)展使多項由人工操作完成的內(nèi)容,開始逐漸由計算機操作系統(tǒng)來承擔完成,此時的數(shù)據(jù)庫相對簡單,是典型的基礎(chǔ)型網(wǎng)絡(luò)狀數(shù)據(jù)庫,隨著人們使用要求的提高,文件系統(tǒng)的相關(guān)功能已無法現(xiàn)實需求,而人們對數(shù)據(jù)的共享功能的需求也日益提升。為提高數(shù)據(jù)庫系統(tǒng)的運行效率,網(wǎng)絡(luò)狀數(shù)據(jù)庫系統(tǒng)逐漸發(fā)展成層析式數(shù)據(jù)庫系統(tǒng),并在之后隨著集合論等相關(guān)關(guān)系概念等理論在數(shù)據(jù)庫系統(tǒng)研發(fā)中的應(yīng)用,關(guān)系型數(shù)據(jù)庫系統(tǒng)逐漸成形,該關(guān)系型數(shù)據(jù)庫系統(tǒng)以嚴格的數(shù)據(jù)邏輯關(guān)系為基礎(chǔ),基本結(jié)構(gòu)的類型可以利用關(guān)系實施描述,構(gòu)建方式易于理解且各實體間的關(guān)系清晰明了,因其具有諸多優(yōu)點而成為數(shù)據(jù)庫系統(tǒng)的典型。在之后隨著面向?qū)ο蠹夹g(shù)的發(fā)展與應(yīng)用,面向?qū)ο蟮臄?shù)據(jù)庫技術(shù)逐漸發(fā)展并完善,自身所具有的完備的功能逐漸取代關(guān)系型數(shù)據(jù)庫系統(tǒng)在計算機領(lǐng)域內(nèi)的應(yīng)用,基于面向?qū)ο筇卣鞯臄?shù)據(jù)庫系統(tǒng)也為之后基于網(wǎng)絡(luò)技術(shù)的數(shù)據(jù)庫系統(tǒng)的產(chǎn)生及發(fā)展奠定了良好的基礎(chǔ)?,F(xiàn)在普遍使用的數(shù)據(jù)庫系統(tǒng)是依托網(wǎng)絡(luò)技術(shù)發(fā)展起的數(shù)據(jù)處理能力更強的系統(tǒng),但現(xiàn)在的數(shù)據(jù)庫技術(shù)已不再是單一技術(shù),可實現(xiàn)與網(wǎng)絡(luò)通訊、并行計算、人工智能等多種技術(shù)的有機結(jié)合,實現(xiàn)信息系統(tǒng)的創(chuàng)新發(fā)展,并在多種技術(shù)的推動下不斷的完善數(shù)據(jù)庫技術(shù)。
2 計算機數(shù)據(jù)庫在現(xiàn)代化建設(shè)中的重要作用
計算機數(shù)據(jù)庫在現(xiàn)代化建設(shè)中的應(yīng)用非常廣泛,就銀行、大型企業(yè)等很多需要進行大量數(shù)據(jù)管理的單位、機構(gòu)等眾多領(lǐng)域,同時,數(shù)據(jù)庫系統(tǒng)的應(yīng)用已不再單純的停留在數(shù)據(jù)信息的存儲等管理層次上,從數(shù)據(jù)中提取自身需要的數(shù)據(jù)信息并進行數(shù)據(jù)挖掘的需求不斷提高,中央集成式數(shù)據(jù)庫系統(tǒng)成為數(shù)據(jù)庫技術(shù)的主流,在很多單位的信息系統(tǒng)中都可實現(xiàn)該技術(shù)的嵌入式應(yīng)用,為現(xiàn)代化建設(shè)工作的開展發(fā)揮重要作用。在多個領(lǐng)域?qū)W科下的相關(guān)技術(shù)的發(fā)展推動下,數(shù)據(jù)庫技術(shù)已實現(xiàn)了與人工智能、并行處理等多種技術(shù)的高效結(jié)合,一系列諸如多媒體數(shù)據(jù)庫、基于工程對象的數(shù)據(jù)庫、分布式數(shù)據(jù)庫等新型的數(shù)據(jù)庫系統(tǒng)的研發(fā)與應(yīng)用越來越廣泛,有效推動了現(xiàn)代化建設(shè)事業(yè)的開展。
現(xiàn)代化建設(shè)事業(yè)的開展是推動社會不斷發(fā)展的歷程,而現(xiàn)有資源的高效利用,尤其是信息化資源,是現(xiàn)代化建設(shè)中重要的組成部分信息化建設(shè)的前提和基礎(chǔ),依托數(shù)據(jù)庫等現(xiàn)代化信息技術(shù)所開展的各項管理工作,對于優(yōu)化事物管理手段和途徑,提升國家各個領(lǐng)域內(nèi)各項管理工作的開展效率,具有重要的意義?,F(xiàn)在世界范圍內(nèi)都已經(jīng)步入了信息化時代,信息作為本時代最為重要的一類資源,與計算機數(shù)據(jù)庫這一信息資源的管理工具一起,可實現(xiàn)大量數(shù)據(jù)信息條理性與層次性的管理,虛擬存儲功能的實現(xiàn)與應(yīng)用有效的推動計算機領(lǐng)域內(nèi)的現(xiàn)代化建設(shè)的變革,從而實現(xiàn)了全社會范圍內(nèi)信息的共享及社會資源的高效調(diào)動,在國家的現(xiàn)代化建設(shè)及信息化發(fā)展中發(fā)揮巨大作用。在國家的經(jīng)濟體系中,銀行體系下的數(shù)據(jù)庫庫系統(tǒng)是非常典型的計算機數(shù)據(jù)庫,銀行體系下涵蓋著大量的信息,各銀行之間就其數(shù)據(jù)管理、信息共享、安全性與保密性等多個方面都有其嚴格的要求,銀行體系的穩(wěn)健發(fā)展促進現(xiàn)代化建設(shè)的進程,而伴隨網(wǎng)絡(luò)技術(shù)發(fā)展起來的網(wǎng)上銀行業(yè)務(wù),完善的數(shù)據(jù)庫系統(tǒng)與網(wǎng)絡(luò)技術(shù)的完美結(jié)合,優(yōu)化傳統(tǒng)銀行業(yè)務(wù)中存在的弊端并提升了業(yè)務(wù)的開展效率。中國知網(wǎng)、萬方、維普等各大數(shù)據(jù)庫系統(tǒng),實現(xiàn)了大量論文期刊與學(xué)術(shù)文獻的共享,推動了各領(lǐng)域科研工作的高效開展,并在各項科研成果的相互借鑒與取長補短中促進現(xiàn)代化建設(shè)事業(yè)的創(chuàng)新性發(fā)展等。
3 結(jié)語
計算機數(shù)據(jù)庫技術(shù)的發(fā)展,使信息的存儲、共享等管理工作的開展更加高效,人們在海量數(shù)據(jù)中挖掘出所需的信息,促進了各項現(xiàn)代化建設(shè)事業(yè)的開展,而伴隨著數(shù)據(jù)庫技術(shù)的創(chuàng)新與發(fā)展,它將會在現(xiàn)代化建設(shè)中發(fā)揮更大的作用。
參考文獻
中圖分類號:TP393 文獻標識碼:A 文章編號:1007-9599 (2013) 02-0000-02
1 計算機數(shù)據(jù)庫安全的重要性及入侵檢測技術(shù)
1.1 計算機數(shù)據(jù)庫安全的重要性分析
目前,計算機數(shù)據(jù)庫所面臨的安全風險非常之多,大體上可將之歸納為兩大方面:一方面是對計算機網(wǎng)絡(luò)設(shè)備的安全威脅;另一方面則是對計算機數(shù)據(jù)庫信息的威脅,無論是哪一類威脅其引發(fā)的后果都是非常嚴重的。數(shù)據(jù)庫是計算機存儲各類重要數(shù)據(jù)信息的部分,它對計算機的正常運行起著至關(guān)重要的作用,一旦數(shù)據(jù)庫“癱瘓”,直接會導(dǎo)致計算機無法正常使用,并且數(shù)據(jù)庫內(nèi)大量重要的數(shù)據(jù)信息還有可能受損,這也會給用戶造成不必要的損失。現(xiàn)階段,對數(shù)據(jù)庫安全威脅較大的除了計算機病毒之外,就是黑客入侵,全世界每年因計算機數(shù)據(jù)庫遭受非法入侵造成的直接經(jīng)濟損失高達數(shù)億美元,這不得不引起我們的高度重視,為此,確保計算機數(shù)據(jù)庫的安全性顯得尤為重要。
1.2 入侵檢測技術(shù)
所謂的入侵檢測技術(shù)實質(zhì)上就是檢測及識別針對計算機網(wǎng)絡(luò)系統(tǒng)的非法攻擊,或是一些違反安全策略事件的過程。它通過相關(guān)數(shù)據(jù)的采集和分析,并從找出可疑或是異常的情況,然后采取一定的措施進行攔截,以達到降低損失,確保計算機網(wǎng)絡(luò)系統(tǒng)安全的目的。入侵檢測本身屬于一種主動防御技術(shù),它可以提供對內(nèi)部、外部以及錯誤操作等的實時保護,并在網(wǎng)絡(luò)系統(tǒng)受到威脅時進行攔截和響應(yīng)入侵,該技術(shù)極大程度地彌補了防火墻技術(shù)的不足。目前,入侵檢測技術(shù)已成為計算機安全中不可或缺的重要組成部分之一,它的存在極大程度低提高計算機網(wǎng)絡(luò)系統(tǒng)的安全性。
2 針對計算機數(shù)據(jù)庫的主要攻擊手段
目前,針對計算機數(shù)據(jù)庫的攻擊手段主要有以下幾種:
2.1 口令破解
這是一種非常典型的攻擊手段,它可以用于所有需要口令的地方,這種攻擊手段大致又可分為以下兩種:(1)弱口令掃描。針對較大范圍內(nèi)的計算機進行掃描,并借助一些常用的簡單口令進行訪問嘗試,試圖破解口令,從而達到入侵的目的。(2)暴力破解。其主要是針對于特定的計算機或是用戶進行的口令破解。該手段能夠有效地破解一些較為強壯的口令。
2.2 sniffer
Sniffer又被稱之為嗅探,屬于一種典型的被動攻擊方式,借助該工具,能夠?qū)W(wǎng)絡(luò)運行狀態(tài)、數(shù)據(jù)流動情況以及網(wǎng)絡(luò)上傳輸?shù)男畔⑦M行監(jiān)視,若是信息以明文的形式在網(wǎng)絡(luò)上傳輸時,則可通過網(wǎng)絡(luò)監(jiān)聽的方式對其進行攻擊,同時將網(wǎng)絡(luò)接口設(shè)計為監(jiān)聽模式,便能夠竊取到網(wǎng)絡(luò)上傳輸?shù)男畔ⅰ?/p>
2.3 DoS
DoS又被稱為拒絕服務(wù)攻擊,這類攻擊手段的前提是攻擊者需要控制大量的計算機作為傀儡機,然后借助這些資源向某一個網(wǎng)絡(luò)服務(wù)器發(fā)動DoS,這樣便可能造成目標服務(wù)器被淹沒。較為常用的DoS攻擊方式有地址欺騙攻擊、POD攻擊、SYNFlood攻擊以及分布式拒絕服務(wù)攻擊等等。
2.4 SQL注入式攻擊
SQL既可以稱之為攻擊手段,也可以視作一種漏洞。當用戶計算機程序中的變量處理不當或是對用戶所提交的數(shù)據(jù)信息過濾不足,都會產(chǎn)生SQL漏洞,而它的攻擊原理就是借助用戶提交或是一些可修改的數(shù)據(jù),將想要的SQL語句插入到系統(tǒng)實際的SQL語句當中,這樣便能夠輕松獲取到各類敏感信息,甚至還能控制整個服務(wù)器。SQL注入式攻擊在很多數(shù)據(jù)庫中都能夠?qū)崿F(xiàn),如Access、Sybase以及SQLServer等等。
2.5 緩沖區(qū)溢出攻擊
它屬于一種系統(tǒng)攻擊手段,主要是利用向程序緩沖區(qū)寫入超長的內(nèi)容,引起緩沖區(qū)溢出,以此來破壞程序的堆棧,從而迫使程序執(zhí)行其它的命令,這樣便可以達到攻擊的目的。
3 提升入侵檢測技術(shù)在計算機數(shù)據(jù)庫中應(yīng)用效果的途徑
3.1 對Apriori算法進行優(yōu)化
在Apriori算法當中最為關(guān)鍵的環(huán)節(jié)是大項目集的調(diào)查,實際查詢過程分為以下兩個部分:其一,按照查詢最多的k-1個項目集Lk-1,獲得待選的k個項目集Ck;其二,對D數(shù)據(jù)庫進行掃描和整理,使全部項目集Ck都獲得應(yīng)有的支持度,由此便可以獲得k個項目集Lk-1。Apriori算法雖然可以將大部分的待選項目集整理好,但若是遇到綜合能力較強的數(shù)據(jù)庫,就會出現(xiàn)大量待選集需要整理的情況,全部整理完需要耗費大量的時間,所以需要在Apriori算法現(xiàn)有的基礎(chǔ)上對其進行優(yōu)化,具體方法如下:(1)減少數(shù)量。通過不斷減少待選集中候選項目的總體數(shù)量,來提高算法的速度,并節(jié)省時間。(2)掃描控制。對數(shù)據(jù)庫進行合理的掃描操作,并將其優(yōu)化為可在編碼上獲得Apriori的算法,各個待選項都要按照數(shù)據(jù)庫中的結(jié)果進行編碼,假設(shè)某個項目在交易中出現(xiàn)便將之編碼設(shè)計成1,如果不出現(xiàn)的就設(shè)計成0,這樣便可以使算法獲得進一步優(yōu)化。
3.2 構(gòu)建計算機數(shù)據(jù)庫入侵檢測系統(tǒng)模型
入侵檢測系統(tǒng)的基本工作原理是先對審計數(shù)據(jù)進行檢測,并判斷是否發(fā)生入侵行為,然后進行報警。從系統(tǒng)功能實現(xiàn)的角度上大體可分為以下三個模塊:數(shù)據(jù)采集模塊、數(shù)據(jù)檢測分析模塊和報警響應(yīng)模塊。按照方法的實現(xiàn)又可將系統(tǒng)分為:(1)數(shù)據(jù)采集模塊。該模塊主要負責收集數(shù)據(jù)庫中服務(wù)器主機日志資料,它能夠充分發(fā)映出用戶的歷史操作行為和數(shù)據(jù)特征,從而為規(guī)則和知識庫的構(gòu)建奠定基礎(chǔ)。此外,在對入侵進行檢測時,需要收集服務(wù)器中的審計數(shù)據(jù),以此來為入侵檢測提供服務(wù),這樣便可以使整個系統(tǒng)運行變得更加順暢。(2)數(shù)據(jù)處理模塊。該模塊主要負責對各種數(shù)據(jù)進行處理和集成,其作用是為下一步的數(shù)據(jù)挖掘做好準備。(3)數(shù)據(jù)挖掘模塊。該模塊主要是借助從處理模塊中提取到的數(shù)據(jù),再次提取出相關(guān)的規(guī)則和行為特征,以此來建立安全的數(shù)據(jù)庫模式。(4)知識規(guī)則庫。它具備系統(tǒng)模塊所需要的安全模式,入侵檢測系統(tǒng)將用戶的操作行為與規(guī)則庫當中存儲的知識進行比較分析,若是兩者相符,則表明用戶行為正常,若是不符則表明是入侵行為。(5)提取特征模塊。該模塊所采用的技術(shù)與數(shù)據(jù)挖掘相類似,具體就是從當前用戶的操作行為中提取出本次操作的特征,以供入侵檢測模塊進行比對分析之用。(6)入侵檢測模塊。它是整個系統(tǒng)通過入侵檢測的算法,從知識規(guī)則庫中提煉出相關(guān)的規(guī)則數(shù)據(jù),檢測用戶的操作行為是否屬于入侵行為,并按照判斷結(jié)果采取相應(yīng)的行動,發(fā)現(xiàn)是入侵的行為系統(tǒng)會進行報警提示,并采取措施對入侵進行攔截。
參考文獻:
[1]趙敏,王紅偉,張濤,等.AIB-DBIDM:一種基于人工免疫的數(shù)據(jù)庫入侵檢測模型[J].計算機研究與發(fā)展,2009(2).
[2]郭曉淳,馬冬梅,鄭波.基于數(shù)據(jù)挖掘的數(shù)據(jù)庫入侵檢測系統(tǒng)[A].第13屆海峽兩岸信息管理發(fā)展與策略學(xué)術(shù)研討會論文集[C].2007(8).
[3]劉興華.基于序列模式挖掘的數(shù)據(jù)庫入侵檢測技術(shù)研究與設(shè)計[J].東北師范大學(xué)計算機科學(xué)與技術(shù)學(xué)報,2009(7).
中圖分類號:G623.58文獻標識碼: A 文章編號:
一、計算機數(shù)據(jù)庫安全管理方面存在的問題
1、計算機操作系統(tǒng)方面的問題
一般來說,操作系統(tǒng)方面的問題主要就是病毒、后門以及數(shù)據(jù)庫系統(tǒng)和操作系統(tǒng)的關(guān)聯(lián)性引起的。
病毒方面:在操作系統(tǒng)中很可能有特洛伊木馬程序的存在,這對操作系統(tǒng)來說是一個極大的威脅,這種木馬程序可以將入駐的程序的密碼加以修改,一旦密碼更新,入侵者就會獲得信息的密碼,使信息內(nèi)容被竊取、破壞等。
后門方面:雖然數(shù)據(jù)庫系統(tǒng)的特征參數(shù)讓數(shù)據(jù)庫的管理員操作起來更加方便,可是與此同時,這些參數(shù)也為數(shù)據(jù)庫服務(wù)器的主機操作系統(tǒng)留下了后門,所以后門也成了訪問數(shù)據(jù)庫的通道。
數(shù)據(jù)庫系統(tǒng)和操作系統(tǒng)的關(guān)聯(lián)性方面:數(shù)據(jù)庫和操作系統(tǒng)之間的關(guān)聯(lián)性非常強,操作系統(tǒng)中文件管理這個功能可以通過存取控制對各種文件進行續(xù)寫和執(zhí)行等操作,所以數(shù)據(jù)庫文件也存在這方面的威脅;同時,操作系統(tǒng)中的監(jiān)控程序也能夠?qū)?shù)據(jù)庫中的用戶登錄和口令鑒別進行控制。所以,數(shù)據(jù)庫的安全與操作系統(tǒng)和硬件設(shè)備所組成的環(huán)境有很大的關(guān)系。
2、管理方面的問題
很多用戶都沒有真正意義上認識到網(wǎng)絡(luò)信息安全的重要性,重視程度不夠就使得實施的管理措施強度不夠,就使得數(shù)據(jù)庫的安全事件經(jīng)常發(fā)生。因為限制數(shù)據(jù)庫服務(wù)器的訪問權(quán)可以減少數(shù)據(jù)庫遭到攻擊,所以很多用戶都懶得進行補丁的修復(fù),這就在數(shù)據(jù)庫的管理上造成了嚴重的失誤。想要數(shù)據(jù)庫絕對的安全,就必須進行補丁的修復(fù),因為經(jīng)常修復(fù)補丁可以不因為很久以前沒有經(jīng)過修復(fù)的漏洞而遭到攻擊。這類問題的主要原因就是存在沒有進行修補的系統(tǒng)安全漏洞和所設(shè)的登錄密碼太過簡單或者沒有進行修改,所以,用戶應(yīng)該建立一個測試環(huán)境,進行補丁修復(fù),然后確認補丁修復(fù),再修復(fù)生產(chǎn)環(huán)境的補丁,提高網(wǎng)絡(luò)信息安全的防范意識,加強管理措施。
3、數(shù)據(jù)庫系統(tǒng)本身存在的問題
關(guān)系數(shù)據(jù)庫這個系統(tǒng)已經(jīng)使用了很多年了,擁有自身強大的特性,產(chǎn)品也非常成熟,但是在實際的應(yīng)用中,其應(yīng)該具有的某些特征,在操作系統(tǒng)和數(shù)據(jù)庫系統(tǒng)中并沒有被提供,特別是一些比較關(guān)鍵的安全特征。所以,很多關(guān)系數(shù)據(jù)庫系統(tǒng)都不是很成熟,還有待改進。
二、強化計算機數(shù)據(jù)庫安全管理技術(shù)的有效措施
計算機數(shù)據(jù)庫的安全性是數(shù)據(jù)庫發(fā)展的根本,所以,做好數(shù)據(jù)庫的安全管理工作是數(shù)據(jù)庫發(fā)展的需要。強化計算機數(shù)據(jù)庫安全管理不僅要提高用戶的網(wǎng)絡(luò)信息安全意識,也要從管理技術(shù)方面出發(fā),以下介紹幾種常見的數(shù)據(jù)庫安全管理技術(shù):
1、安全模型
給數(shù)據(jù)庫建立安全模型的主要作用就是提高對成功實現(xiàn)關(guān)鍵安全需求的理解層次,安全模型有兩種:多級安全模型和多邊安全模型。
⑴多級安全模型:此模型最早是用以支持軍用系統(tǒng)以及數(shù)據(jù)庫的安全保密的。一般來說密級從高到低可以分為絕密級、機密級和秘密級,這樣分級的意義在于使各級的秘密只能讓各級的有權(quán)限的人知道,這樣可以防止高級的信息流入低級,信息所傳遞的范圍始終在控制之內(nèi)。
⑵多邊安全模型:這也是保護數(shù)據(jù)庫安全的重要措施之一,其主要作用是防止信息的橫向泄露,盡可能的確保數(shù)據(jù)庫信息的安全。
2、訪問控制
訪問控制主要是在計算機系統(tǒng)的處理功能的方面對數(shù)據(jù)庫加以保護,其訪問控制的對象主要是數(shù)據(jù)庫內(nèi)部已經(jīng)進入系統(tǒng)的用戶,對數(shù)據(jù)的安全保護形成一個自訂屏障。計算機系統(tǒng)進行活動的對象主要就是主體進程、用戶以及客體(資源和數(shù)據(jù)),而確保主體對客體的訪問的合法性就是計算機安全的關(guān)鍵問題,通過管理數(shù)據(jù)的讀出、寫入以及修改、刪除和執(zhí)行來保證主體訪問客體是被允許的,沒有被允許的訪問將被拒絕,這樣可以確保信息的機密性以及完整和可用性。
訪問控制又主要分為兩種:自由訪問控制和強制訪問控制。
⑴自由訪問控制:這種控制方法又叫做任選訪問控制,被廣泛得到應(yīng)用。運用這種控制方式,資源的擁有者就是創(chuàng)建者,有權(quán)利選擇可以訪問其資源的用戶,所以這樣就使得用戶和用戶進程之間可以有選擇的與其他的用戶進行資源共享。這是對單個的用戶所執(zhí)行的訪問控制的過程及措施,而每個用戶的權(quán)限則是根據(jù)系統(tǒng)來確定的。
⑵強制訪問控制:在這種控制方式中,系統(tǒng)分配給了主體和客體不一樣的安全屬性,而用戶是不能對自身或其他的客體的安全屬性進行更改的,就是不允許單個客戶來確定訪問權(quán)限,用戶與用戶組的訪問權(quán)限只能是通過系統(tǒng)管理員來確定,系統(tǒng)是通過對主客體的安全屬性進行比較來確定主體能否對客體進行訪問。數(shù)據(jù)管理員應(yīng)該提前將數(shù)據(jù)進行備份處理,在發(fā)生故障數(shù)據(jù)遭到破壞或丟失時就可以使用備份的數(shù)據(jù)使其恢復(fù)到以前的狀態(tài),這樣就保證了數(shù)據(jù)的完整性與一致性。
3、安全審計
安全設(shè)計功能就是監(jiān)控和記錄指定用戶在數(shù)據(jù)庫中的操作行為,其實就是對安全方案中的功能提供持續(xù)的評估。在安全審計過程中,管理員應(yīng)該掌握一組可以進行分析的數(shù)據(jù),用來發(fā)現(xiàn)合適何處出現(xiàn)的違反安全方案的一些操作行為。通過分析安全審計的結(jié)果,及時對安全政策進行調(diào)整,修補出現(xiàn)的漏洞。所以,安全審計可以記錄關(guān)鍵事件、提供容易操作的軟件工具和可進行集中處理審計日志的數(shù)據(jù)形式、發(fā)現(xiàn)威脅時進行安全報警等多方面的功能。
三、結(jié)束語
當今社會,數(shù)據(jù)庫已經(jīng)是社會中各企業(yè)所發(fā)展的重要的組成部分,很大程度上促進了企業(yè)的發(fā)展,給社會帶了了非??捎^的價值利益,所以其安全問題應(yīng)該引起高度的重視,在強化數(shù)據(jù)庫安全管理技術(shù)措施的同時,企業(yè)的各方面都應(yīng)該積極配合,這樣才能真正意義上提高數(shù)據(jù)庫的安全性。
參考文獻:
[1] 馬濤,秦軼翠,吳寶珠等.試論計算機數(shù)據(jù)庫安全管理[J].計算機光盤軟件與應(yīng)用,2011,(14):153-153.
中圖分類號:R2-03 文獻標識碼:A 文章編號:1673-7717(2011)04-0688-02
收稿日期:2010-11-10
基金項目:“十一五”國家科技重大專項資助項目(2008ZX10005-013)
作者簡介:李澤庚(1962-),男,安徽桐城人,主任醫(yī)師、教授,博士研究生導(dǎo)師,研究方向:中醫(yī)藥防治呼吸系統(tǒng)疾病和中醫(yī)外感熱病的基礎(chǔ)與臨床研究。
傳染病(infectious disease)是由各種病原體所引起的一組具有傳染性的疾病。病原體在人群中傳播,常造成傳染病流行,對人民的生命健康有極大危害性。傳染病屬于中醫(yī)學(xué)中的“疫、溫疫、溫病、疫病”等病范疇,自古以來就有之。在漫長的歷史進程中,中醫(yī)對傳染病治療形成了一整套系統(tǒng)的理論與方法,在臨床中具有較好的療效,同時也在預(yù)防、治療等方面積累了較多的經(jīng)驗,推動了中醫(yī)學(xué)的發(fā)展。進入21世紀,隨著人類生活方式和生存環(huán)境的改變,病原微生物的變差異,傳染病構(gòu)成譜也發(fā)生了巨大的變化,新發(fā)傳染病正在成為威脅人類身體健康的重要疾病,面對與既往不同的新的傳染病發(fā)展態(tài)勢,現(xiàn)代醫(yī)學(xué)往往存在較大的局限性,而中醫(yī)藥在辨證論治上有著非常大的優(yōu)勢,因此有必要運用多學(xué)科聯(lián)合,系統(tǒng)地總結(jié)以往有文獻記錄以來的傳染病疫情的發(fā)生、變化之間相關(guān)性,為傳染病的防治做出貢獻。大量的文獻資料的分析整理需借助于計算機數(shù)據(jù)庫知識,基于此建立了本數(shù)據(jù)庫。并依據(jù)《中華人民共和國傳染病防治法》規(guī)定之傳染病病種,在“十一五”國家科技重大專項資金的資助下,憑借于互聯(lián)網(wǎng)及大型中醫(yī)藥圖書館,對38種法定傳染病的中西醫(yī)防治經(jīng)驗進行系統(tǒng)的文獻梳理和前瞻性研究,并試圖通過計算機數(shù)據(jù)挖掘技術(shù)發(fā)現(xiàn)某些傳染病的發(fā)病流行規(guī)律,以提高中醫(yī)藥防治重大傳染病的能力。為此,我院和北京方正阿帕比技術(shù)有限公司合作,研制開發(fā)了傳染病數(shù)據(jù)庫系統(tǒng)。該系統(tǒng)的建立不僅解決了資料保管、統(tǒng)計分析使用的難題,而且使資料的儲存更加科學(xué)、規(guī)范、完整、系統(tǒng)。另外,該系統(tǒng)的建立為臨床科研人員的培訓(xùn)提供了平臺,進一步推動了我院信息管理的深入發(fā)展。
1 數(shù)據(jù)庫運行環(huán)境和軟件系統(tǒng)結(jié)構(gòu)
方正德賽數(shù)據(jù)加工系統(tǒng)硬件配置滿足Windows server 2003運行要求,系統(tǒng)安全性、穩(wěn)定性好,延續(xù)了方正在傳統(tǒng)出版領(lǐng)域技術(shù)領(lǐng)先的優(yōu)勢,采用ClientServer方式,服務(wù)端使用Microsoft SQL Server數(shù)據(jù)庫進行中心存儲,是一款強大而可靠的數(shù)據(jù)管理產(chǎn)品,可以為嵌入式應(yīng)用程序客戶端、輕型Web應(yīng)用程序以及本地數(shù)據(jù)存儲區(qū)提供豐富的功能,有利于保護數(shù)據(jù),提高性能。用戶可以將自己單位相當數(shù)量的館藏資源建設(shè)數(shù)字化,成為自有的電子資源,與方正Apabi數(shù)字資源平臺、數(shù)字出版系統(tǒng)相配合,完全實現(xiàn)版權(quán)保護。
2 文獻的整理及數(shù)據(jù)庫的建立
對古今中醫(yī)藥文獻中關(guān)于傳染病的文獻(包括著作、論文、病案等)進行系統(tǒng)整理、分析并匯編成冊。對傳染病的病因、證候、方藥、治療進行縱向分類研究,取名醫(yī)經(jīng)驗及有代表性的文獻資料,歸類整理發(fā)掘,進行橫向研究。在完成文獻整理研究基礎(chǔ)上,構(gòu)建建國以來傳染病中醫(yī)藥文獻數(shù)據(jù)庫,可以高效地實現(xiàn)數(shù)據(jù)的錄入、查詢、統(tǒng)計等功能,供臨床教學(xué)科研查詢使用,實現(xiàn)資源共享。運用數(shù)據(jù)挖掘技術(shù),對中醫(yī)傳染病的文獻信息進行整理和挖掘,按照病名、證型、癥狀、病因、病機、方藥等進行結(jié)構(gòu)化處理,提取其蘊含的多方面信息,進行多角度、多層面的分析,挖掘出建國以來傳染病的發(fā)病特征和中醫(yī)藥防治規(guī)律,以期更好地滿足中醫(yī)辨證論治的需求,促進中醫(yī)藥事業(yè)的繁榮與發(fā)展。
3 以數(shù)據(jù)庫為平臺提高臨床科研水平