數(shù)字圖書館的建設發(fā)展原則
數(shù)字圖書館建設需要高昂的投資和海量的資源,故而針對數(shù)字圖書館的建設、實現(xiàn)、維護和發(fā)展,相關(guān)方都會有一些基本的考慮和遵循原則,這些原則不僅適用于將模擬對象轉(zhuǎn)換為數(shù)字形式,也適用于數(shù)字圖書館,遵循這些原則,并吸取從之而來的實踐經(jīng)驗,會使設計、建設和維護開發(fā)數(shù)字圖書館的工作受益。
數(shù)字圖書館發(fā)展原則
數(shù)字圖書館要適應和迎合變革。持續(xù)變化的技術(shù)環(huán)境,對于數(shù)字圖書館項目來說是一個挑戰(zhàn)。紙質(zhì)文檔會被轉(zhuǎn)換成數(shù)字格式,隨著技術(shù)變革,當市場不再支持相應系統(tǒng)和格式時,該格式的數(shù)字化文檔就會逐漸被廢棄。如果在某特定程序中創(chuàng)建一個重要文檔,那么為了訪問附件則依賴這個特定程序,假設我們的目的是為后人保留重要信息,而未來技術(shù)的變革可能意味著普通用戶無法訪問這個文檔。
互聯(lián)網(wǎng)和Web使數(shù)字圖書館成為可能,數(shù)字圖書館設計者依賴現(xiàn)有的范例和工具,依然會導致不可預見的問題。比如用HTML創(chuàng)建Web站點便于訪問數(shù)字圖像和文檔,但是也會因為HTML更改或被其他技術(shù)取代而過時。技術(shù)變革的速度超過管理者維護數(shù)字圖書館的能力,所以數(shù)字圖書館需要方法和計劃以應對改變,保持對信息提供持久訪問的能力。
發(fā)展數(shù)字圖書館要切實了解“內(nèi)容”。對于用戶來說,內(nèi)容是數(shù)字圖書館中最值得關(guān)注的部分。創(chuàng)建者需要管理和決定數(shù)字圖書館的內(nèi)容,包括選擇要包含的對象,數(shù)字化模擬形式的項目,用標準語言(例如SGML)標記項目,并分配元數(shù)據(jù),用以描述每個對象的內(nèi)容和其他屬性。
對于開發(fā)人員來說,在項目伊始確定元數(shù)據(jù)元素的性質(zhì)和數(shù)量非常重要。一些元數(shù)據(jù)元素描述了項目的內(nèi)容,包括標題、創(chuàng)建者、發(fā)布日期和討論主題,其他元素可能被分配來管理集合,包括掃描狀態(tài)、質(zhì)量控制狀態(tài)和內(nèi)部注釋,以及數(shù)字對象的技術(shù)方面,例如文件格式和大小。
決定系統(tǒng)將要包括的基本概念單元或?qū)ο笸瑯又匾?,例如個人文檔、照片、視頻或?qū)嶒炗涗?,它將影響到元?shù)據(jù)被分配的級別,以及如何組織、訪問和歸檔這些資料。每個概念性對象分配它自己的唯一標識符,將其與元數(shù)據(jù)記錄和集合中的其他對象連接起來。
數(shù)字圖書館建設團隊,需要包容不同背景以及提供各種專業(yè)知識的成員。從多個領域獲得構(gòu)建系統(tǒng)的建議和幫助,才能建立更好的數(shù)字圖書館。
計算機科學和圖書館學是構(gòu)建系統(tǒng)最直接的兩個領域。計算機專家能夠領會和鑒別技術(shù)可行性和局限性,關(guān)心數(shù)字圖書館元數(shù)據(jù)標準在龐大互聯(lián)網(wǎng)信息空間中提供的語義互操作性;而圖書館員是信息資源的管理者,具有豐富的編目和索引經(jīng)驗,并認識到這些概念對于信息檢索的重要性,而且他們了解用戶的信息需求,以及保存材料以繼續(xù)獲取和使用的問題。此外,能夠提供長期財政、材料和人力支持的組織和高層管理人員同樣重要。
設計“易用的系統(tǒng)”。由于Web的巨大優(yōu)點,多數(shù)數(shù)字圖書館是通過網(wǎng)絡技術(shù)在互聯(lián)網(wǎng)Web上提供的。成功的Web站點設計包括許多因素,包括計算機和瀏覽器之間的技術(shù)差異,訪問速度和用戶之間的差異,Web導航偏好等。瀏覽器在顯示信息的方式上有所不同,即使它們使用相同的基本通信協(xié)議(如Http、Https)和標準標記語言(比如HTML或XML)。由于用戶可能會更改默認設置,所以最好創(chuàng)建盡可能簡單的接口,并避免服務器端對數(shù)據(jù)的精確顯示進行控制。此外,開發(fā)面向數(shù)字圖書館的接口時,對于具有一定范圍的物理缺陷的用戶來說,可訪問性也是一個問題。
確保開放存取的原則。確保開放存取與可用性問題密切相關(guān),包括對數(shù)字圖書館內(nèi)容以及對數(shù)字圖書館本身的訪問。確保對內(nèi)容開放存取的一種方法是避免使用專有的軟硬件解決方案。許多用于創(chuàng)建數(shù)字圖像的收費的軟件,同時允許軟件接口免費使用,數(shù)字圖書館開發(fā)人員可以清楚地知道需要哪些軟件來查看這些圖像,就可以訪問這些內(nèi)容。為了確保持續(xù)可訪問性和使用,開放的非專有的系統(tǒng)是建設數(shù)字圖書館的首選。
數(shù)字版權(quán)意識。我國的版權(quán)法和著作權(quán)法保護數(shù)字知識產(chǎn)品,而開放獲取信息的可能威脅知識產(chǎn)權(quán)。數(shù)字信息基礎設施易于獲得大量的信息,但是信息的不當復制和訪問控制存在不確定途徑的風險。創(chuàng)建數(shù)字圖書館應關(guān)注這個問題,并參與討論相關(guān)的解決方案,盡可能的建立管理程序以保護館藏。例如,在數(shù)字轉(zhuǎn)換項目中應該得到實體版權(quán)所有者的許可??紤]個人隱私問題,當重要的私人全部文件被數(shù)字化的時候,要根據(jù)捐贈者標記出的敏感物品以及處置說明,仔細地跟蹤權(quán)限和隱私信息,確保這些信息不存在法律風險。
系統(tǒng)盡可能自動化。建立數(shù)字圖書館需要系統(tǒng)創(chuàng)建者進行大量的腦力勞動,構(gòu)建和使用自動化工具越多,就越能更好地利用寶貴的人力資源;這些工具使內(nèi)容專家能夠?qū)W⒂谥R任務(見圖1),只需使用元數(shù)據(jù)輸入系統(tǒng)向主數(shù)據(jù)庫一次添加元數(shù)據(jù),然后根據(jù)訪問用戶的需要從主數(shù)據(jù)庫提取和組合這些信息,以生成HTML頁面、搜索索引和報告。一次輸入數(shù)據(jù)可以節(jié)省人力和時間,降低錯誤率,并允許最大的靈活性。幾乎整個Web界面都是由數(shù)據(jù)庫生成的,只要必要就允許更新,同時能遵循最新的Web標準。系統(tǒng)進行模塊化設計,現(xiàn)有模塊易于修改,易于為新功能添加新模塊。
采用并遵循標準。在系統(tǒng)構(gòu)建中使用標準使應用程序易于擴展、可互操作和可移植,這些特性對于數(shù)字圖書館的設計、實現(xiàn)和維護非常重要。使用標準對于需要大量工作的數(shù)字圖書館來說尤其重要,掃描、元數(shù)據(jù)輸入和文檔標記,集合中所有涉及到需要評估和處理的單個項目,都是資源任務密集型的工作,最好需要“一次性完成”。遵循標準將使今后可能的數(shù)據(jù)遷移更加容易。另外,使用標準文件格式保存的信息,比用專有格式編碼的信息更容易訪問。
對于開發(fā)人員來說,使用標準更易于實現(xiàn)互操作性。通過使用標準通用的數(shù)據(jù)標簽和Web技術(shù),發(fā)布數(shù)字圖書館的內(nèi)容,增加了其他Web搜索引擎訪問圖書館以及其中具體條目的機會。未來數(shù)字圖書館或許成為某個更寬泛的系統(tǒng)組成部分,那么開放的標準設計,將使未來的轉(zhuǎn)換和重組將更加平順。
保證質(zhì)量的原則。質(zhì)量度量可以應用于創(chuàng)建一個數(shù)字圖書館所涉及的所有過程和結(jié)果。它們與選擇、元數(shù)據(jù)條目、圖像捕獲和系統(tǒng)的總體可用性有關(guān)。完整和正確的元數(shù)據(jù)會帶來許多好處;不完全或不正確的元數(shù)據(jù)影響整個數(shù)字圖書館的質(zhì)量。元數(shù)據(jù)在資源發(fā)現(xiàn)和集合管理方面都扮演著重要角色,如果主題代碼被隨意或不正確地應用,那么根據(jù)這些代碼生成瀏覽層次結(jié)構(gòu)的嘗試可能會被阻止,訪問可能會更加困難。
轉(zhuǎn)換項目中掃描過程的指導方針,如果包括對被掃描圖像的外觀標準,包括方向,分辨率,色調(diào),將會減少很多的潛在問題。一些質(zhì)量控制指標可以自動化,有些則需要人工審查。數(shù)字圖書館項目應定義并堅持實施質(zhì)量控制方法,確保質(zhì)量評估成為構(gòu)建和維護數(shù)字圖書館的重要組成部分。
內(nèi)容持久性的原則。對于數(shù)字圖書館而言,首先,是數(shù)字對象的“遷移策略”,它要求將數(shù)據(jù)從一個文件格式轉(zhuǎn)換為另一個文件格式,從一個軟件環(huán)境轉(zhuǎn)換為另一個軟件環(huán)境,或者從一個物理介質(zhì)轉(zhuǎn)移到另一個物理介質(zhì)。遷移意味著機構(gòu)強大持久的承諾和支持,不斷刷新其集合以跟上技術(shù)進步的步伐。
其次是數(shù)字對象的保存和持久性,保存是指對象的技術(shù)壽命和質(zhì)量;持久性則是一個更廣泛的概念,包含了保存,也包括這個對象將來是否還會以其他形式存在。數(shù)字信息的持久性意味著存儲信息并保持其可訪問。
結(jié)語
遵循以上這些原則,以及從這些原則演變而來的實踐經(jīng)驗,使我們更有利地建設、維護和發(fā)展數(shù)字圖書館,保護高質(zhì)量有價值的信息資源,為用戶持續(xù)提供開放的訪問服務而努力。
- 為什么發(fā)表論文都不開雜志社的發(fā)票呢?
- 2021-2022年CSCD中國科學引文數(shù)據(jù)庫來源期刊列表-理科南大核心目錄完整版
- CSCD中國科學引文數(shù)據(jù)庫來源期刊列表(2023-2024年度)南大核心目錄
- 融媒體環(huán)境下地方新聞網(wǎng)站媒體的發(fā)展路徑
- 創(chuàng)新與繼承:70周年獻禮片“三杰”研究
- 人本導向下的城市更新規(guī)劃思路探索——以上海松江區(qū)中山街道老城區(qū)為例
- 預制裝配式地鐵車站施工技術(shù)
- 從框架理論看“中國學習的人”
- 互聯(lián)網(wǎng)環(huán)境下古都洛陽城市形象建構(gòu)與傳播探析
- 價值工程在房地產(chǎn)開發(fā)管理分工中應用
- 2025年中科院分區(qū)表已公布!Scientific Reports降至三區(qū)
- 2023JCR影響因子正式公布!
- 國內(nèi)核心期刊分級情況概覽及說明!本篇適用人群:需要發(fā)南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的學者
- 我用了一個很復雜的圖,幫你們解釋下“23版最新北大核心目錄有效期問題”。
- CSSCI官方早就公布了最新南核目錄,有心的人已經(jīng)拿到并且投入使用!附南核目錄新增期刊!
- 北大核心期刊目錄換屆,我們應該熟知的10個知識點。
- 注意,最新期刊論文格式標準已發(fā)布,論文寫作規(guī)則發(fā)生重大變化!文字版GB/T 7713.2—2022 學術(shù)論文編寫規(guī)則
- 盤點那些評職稱超管用的資源,1,3和5已經(jīng)“絕種”了
- 職稱話題| 為什么黨校更認可省市級黨報?是否有什么說據(jù)?還有哪些機構(gòu)認可黨報?
- 《農(nóng)業(yè)經(jīng)濟》論文投稿解析,難度指數(shù)四顆星,附好發(fā)選題!