Image
Image

數字化檔案館技術方案


編輯:2021-09-16 09:27:22

1. 技術方案

1.1. 項目總體建議

通過對 XX單位現狀和需求的分析,結合國內、外檔案事業的發展趨勢,建議采用數字檔案館的建設模式進行各項檔案工作建設任務。

1.1.1. 建立數字檔案館

1.1.1.1. 數字檔案館的含義

所謂“數字檔案館”,既不是模仿紙質檔案為主體的實體檔案館,也不是將紙質檔案進行數字化處理后形成的封閉的檔案信息庫,而是建立在現代信息技術的普遍應用基礎上,把分散于不同載體,不同地理位置的信息資源以數字化的形式存儲,以高度有序的綜合檔案信息資源為處理核心,為組織的生產、管理和決策提供可靠的檔案信息服務的超大規模、集中式信息系統。

根據檔案界有關專家學者對數字檔案館的研究以及我們的認識,數字檔案館應具備以下基本特征:

(1) 館藏資源數字化

數據是數字檔案館的核心,是檔案信息資源的數字反映,所以數字檔案館實際上是一個龐大的數字信息資源庫,在這個資源庫中,不僅有文字、圖像,還有聲音等多媒體介質,因此,數字檔案館除了現已存在的電子文件以外,還必須將館藏的實態檔案進行數字化處理,使其永久的存儲在服務器的磁盤、光盤或其他存儲介質中。

(2) 檔案信息結構標準化

信息結構標準化既是館藏信息數字化的基本依據,又是檔案信息能否方便快捷利用的前提和基礎。尤其是建設數字檔案館將要引進比較復雜的元數據的概念和很多新的數據處理技術,比如:數據倉庫技術、數據挖掘技術、數據壓縮技術、數據遷移技術等等。這就要求檔案信息結構的標準化。

(3) 檔案信息傳遞網絡化

網絡化是信息社會的重要特征。要實現信息利用的社會化,首先必須實現網絡化,這是個重要的基礎。同樣,由于數字檔案館是在網上運行的,因此,寬帶高速網對檔案信息的迅速傳遞是必不可少的途徑和條件。目前,支持數字檔案館的網絡技術主要有:局域網技術,Internet技術和Intranet技術??紤]到檔案信息不同于圖書或其他信息,其傳遞的范圍要受到密級的限制和訪問權限的約束以及系統的安全性,因此,在許多場合使用局域網技術和Intranet技術較為穩妥。

(4) 生成空間虛擬化

由于數字檔案館是一個群體概念,是由一個部門、單位乃至一個地域的眾多檔案館或信息資源單位組成的聯合體,通過網絡實現跨庫互動查詢,達到使用信息的目的,所以從這個角度講,正是由于網絡技術的運用,使得傳統意義上的檔案館改變了存在的性質和方式,延伸了傳遞的途徑和條件,拓寬了使用的環境和范圍。這也正如部分檔案學者指出的那樣:通過網絡的連接,傳統檔案館被分成兩類:一類是信息資源檔案館,一類是終端檔案館,前者為數字檔案館提供信息,后者則為用戶提供服務,而終端檔案館則可認為是一種虛擬的工作環境。

(5) 檔案管理自動化

檔案管理自動化是數字檔案館建設不可忽視的基本內容之一。諸如檔案自動編目、檢索、檔案自動標引、各類檔案的借閱管理、統計、報表、檔案業務建設活動等。

(6) 檔案信息利用社會化

眾所周知,傳統介質檔案的利用,在同一時間內只能供一個用戶使用,其他用戶如果想獲得這種檔案信息,只能等待,因而很難實現檔案信息服務社會化。建立了數字檔案館以后,這個問題就可以迎刃而解,用戶可以在任何時間從網絡上查詢這些信息,實現真正意義上的檔案信息服務社會化。

1.1.2. 數字檔案館的構成要素

1.1.2.1. 基礎設施建設

我們采用存儲局域網(SAN的方案,數字檔案館基礎設施建設包括網絡設備、硬件設備和支撐軟件:

(1) 網絡設備。是數字檔案館的通信保障;

(2) 硬件設備。包括檔案館(室)開展信息化建設所必需的網絡設備、數字加工設備、海量存儲設備以及計算機和輸出設備;

(3) 支撐軟件。支撐軟件除運行必需的各類操作系統軟件外,還應包含自行研制開發的通信軟件、郵件服務器、系統管理軟件、安全管理軟件等系統。

1177083

1.1.1.1. 信息資源建設

信息資源是數字檔案館得以生存發展的基礎和核心。信息資源不僅涵蓋原有的傳統意義的檔案信息,并且其信息采集的范圍將進一步擴大到現行文件、各信息系統的專業數據庫和專題數據庫以及從互聯網、政務網等各方面收集的與本單位相關的各類信息。具體包括:

(1) 傳統的館藏檔案的數字化信息;

(2) 直接接收的數字信息、通過其它信息系統及其它分支業務網絡收集的各種類型電子文件及其元數據;

(3) 通過互聯網或其它本組織之外的專用網絡搜集的信息;

(4) 直接采購的與本組織有關的行業數據庫和專題數據庫; 

(5) 其它對組織發展有價值的信息。

1.1.1.2. 標準規范體系建設

標準規范體系建設是數字檔案館工程的重要支撐。在數字檔案館建設過程中,如何將多元化的檔案信息資源協調組織起來,通過網絡互聯互通,實現信息共建和共享,以及數字信息的長期保存和遷移,其關鍵就在于標準化。所以必須按照先進性、完整性和可調整性的原則,借鑒和采用國內外成熟、相關的標準和規范,著眼于檔案工作的發展,研究制定切實可行的標準規范體系。

(1) 遵循的原則。

以標準化管理為主,制度管理為輔。標準化更適于技術工作領域的規范化管理,可操作性強,而且與管理體制的關系較為超脫,因此在不與法律相沖突的情況下,以標準化管理為主更有利于不同國家或多個部門之間的協調。制度通常以法規形式出現,特別是約束力強,但管理范圍有限,所以在標準化管理的基礎上,配合制度可以形成數字檔案館所需的嚴密的規范化管理體系;

首先考慮采用國際標準,其次才是國家、行業及地方標準。由于數字檔案館具有開放性,其信息交流的范圍和種類處于不斷擴展和變化之中,事先難以完全確定,所以即使在數字檔案館的初始階段也應優先采用適用范圍盡可能廣泛的標準,盡量做到一次到位。    面向計算機和網絡及信息平臺的處理,直接采用國際和國家標準;面向綜合性能的處理優先采用國家標準;面向檔案信息的處理以借鑒為主進行補充。由此形成完整的標準和規范體系。將充分借鑒國際上常用的文件生命周期管理方法,對數字檔案館涉及的各類文件或信息進行從始至終的連續管理,保證真實性、完整性、有效性。

(2) 管理性標準規范。

管理性標準規范,是指對信息資源管理維護方法、提供利用的模式、查詢權限的劃分等進行管理的一系列規則。技術手段必須和管理規章制度的有效執行相配合,才能最大限度地發揮效益。我們應依據現有的《中華人民共和國檔案法》、《檔案館工作通則》、《計算機信息系統安全保護條例》、《計算機信息網絡國際聯網安全保護管理辦法》、《計算機信息系統國際聯網保密管理規定》、《計算機病毒防治管理辦法》等規章制度,針對數字檔案館的特殊性,對管理規范進一步完善。尚需制定的規范包括:

《數字檔案信息管理與存儲規范》;

《數字檔案館硬件設備管理規定》;

《數字檔案館信息利用管理規定》;

《數字檔案館用戶管理規定》;

《數字檔案館計算機信息系統安全防護策略》。

(3) 業務性標準規范。

業務性標準規范是針對數字檔案館的業務處理過程進行規范化管理的一系列規則,是對各類檔案信息實體進行科學收集、整理和加工的有效保證。我們應在國家現有的各類檔案收集管理辦法、《電子文件歸檔與管理規范》、《磁性載體檔案管理與保護規范》、《CAD電子文件光盤存儲、歸檔與檔案管理要求》等規范基礎上,尚需制定的規范包括:

《檔案數字資源加工規范》;

電子文件歸檔與管理辦法》;

《電子文件元數據標準》;

電子文件與數字檔案鑒定標準》。

(4) 技術性標準規范。

技術標準規范包括電子文件數字檔案的數據存儲壓縮格式規范、數據交換標準規范、數據加密、水印技術規范和系統軟硬件設施技術標準等。其中有些技術標準是電子信息管理的共用標準,如《信息交換用七位編碼字符集》、《信息交換用漢字編碼字符集》、《聯合圖像專家組規范》(JPEG)、《動態圖像專家組規范》(MPEG)等等。尚需制定的規范包括:

《檔案信息數據存儲、壓縮格式規范》;

紙質載體檔案及縮微膠片數字化存儲技術規范;

聲像、照片檔案數字化存儲技術規范;

各類檔案著錄及數據庫結構標準;

一體化接口技術規范。

1.1.1.3. 應用系統建設

數字檔案館應用系統是一個動態的、可擴展的信息網絡系統,在整個數字檔案館體系中起著承上啟下的聯接作用。一方面可以按照相關技術標準與現有各應用系統完整結合,獲取各方面信息,豐富數字信息資源;另一方面,通過良好的人機交互,為用戶提供跨地域、跨部門的信息服務。數字檔案館應用系統主要包括一體化系統數據接口、信息采集系統、檔案信息管理系統、檔案信息利用服務系統和運行維護跟蹤管理系統。

1.1.1.4. 人才隊伍建設

數字檔案館的建設不僅帶來了技術上的巨大進步和工作效率的極大提高,并且從客觀上對各級檔案部門工作人員的科技素提出了較高的要求。所以在進行數字檔案館建設的同時,必須堅持以人為本的原則,把培養人才、建設隊伍、提高素質放在第一位,培養和造就一支具有良好的職業道德、較高水平的信息工作能力和較全面的知識結構的復合型人才隊伍,并通過院校教育、在職培訓、引進人才等方式保持人才隊伍的先進性,使信息技術不斷與實際工作相結合,為數字檔案館建設創造發展基礎。

1.1.1.5. 信息安全保證體系建設

在數字檔案館的建設和運行過程中,如何確保信息的安全保密是提供信息服務的前提和保證,必須通過信息安全體系的建設,確保信息的可用性、保密性、完整性和抗抵賴性,同時還必須滿足系統的可靠性、可控性和穩定性。

(1) 建立完備的信息安全保密制度。

在信息安全體系建設過程中,必須樹立技術與管理相統一的思想。如何建立健全一整套信息技術發展與實際應用相適應的管理制度,加強對信息維護者和使用者的約束與監督,強化內部安全管理體系,是保證信息安全的重要環節。以《檔案法》、《保密法》、《計算機信息法》、《中華人民共和國計算機系統安全保護條例》等法律、法規和條例為依據,結合檔案信息化建設和數字檔案館的發展要求,及時制定《信息安全保密分類標準》、《涉密信息管理規定》、《數字檔案館涉密信息利用規定》等規章制度,為數字檔案館建設提供原則和依據。

(2) 安全保密措施管理。

安全保密措施是為保證數字檔案館的信息安全所采用的一系列技術方法和手段,是安全保密體系的核心。

物理安全。數字檔案館網絡設備自身的運行安全和設備所處環境的安全,是信息安全保密體系的基礎。根據環境及設備的物理結構特點,其安全隱患主要來自自然災害、意外事故、電磁輻射及機房環境安全等。通過嚴格遵守國家相關法規和標準,切實做好防火、防水、防盜等工作,對信息進行必要的容災備份,并對重點設備進行電磁屏蔽和干擾,物理安全是比較容易保障的;

網絡安全。采取有效技術,根據信息安全需要對數字檔案館進行必要的邏輯隔離,實施入侵檢測,安裝運行防病毒軟件,并針對操作系統可能存在的漏洞,依托網絡操作系統自身提供的安全設置對入網計算機進行管理,自動對各終端的安裝操作系統更新和病毒升級文件,通過硬件提高系統各主機的抗攻擊能力,防止非法用戶通過網絡對數字檔案館進行的惡意攻擊、病毒入侵和其他非法訪問;

信息安全。通過硬件加密設備及特殊的數據庫系統,依托符合國家標準的密碼體系,對密級較高的信息實施加密存儲和傳輸,避免因惡意攻擊造成的泄密情況;

應用安全。研制《數字檔案館網絡安全認證系統》,采用身份認證、數字簽名等技術,確保信息在收集、整理、利用過程中的真實性和有效性,并根據授權實施訪問控制。

(3) 安全監控與審計。

由于數字檔案館信息的多樣性和用戶的限定性,必須研制和應用《數字檔案館網絡監控與審計系統》,利用技術手段,實現對數字檔案館運行全過程的監控,包括操作系統、數據庫系統的運行情況,用戶登錄和信息訪問情況,針對數據庫進行的增、刪、改維護操作日志,數據流量統計等,并實現網絡攻擊預警和主動防范,為事故調查提供準確、詳盡、完整的資料。

1.1. 系統總體設計

1.1.1. 設計原則

1.1.1.1. 成熟性

 XXX單位檔案管理系統是以成熟軟件產品為基礎,結合具體需求進行定制和二次開發的方式進行實施,使系統具有一個高穩定性和先進性的核心,有效縮短項目實施周期,降低項目實施的風險。

1.1.1.2. 先進性、可擴展性

提供的系統應采用目前主流的技術和架構,所提供的技術在近期內具有一定的先進性,并與當前或未來的新技術、操作系統、數據庫以及應用服務器具有兼容性,系統應具有不同級別的安全運行管理措施。同時要把握住信息技術的發展和應用方向,在系統建設過程中對技術和業務要有前瞻性,做到可擴展,可升級,以順應未來的發展。

1.1.1.3. 易用性

提供的系統設計應面向最終用戶,必須保證易操作、易理解、易控制;系統所出現的問題能夠及時預報并迅速解決。系統提供在線幫助便于用戶操作和學習。

1.1.1.4. 易維護性

提供的系統應具有簡單、直觀、方便的維護和管理手段,盡量減少維護和管理環節。

1.1.1.5. 安全性

提供的系統應提供必要的安全措施,保證系統以及系統數據的安全性。由于現用飛揚綜合檔案管理軟件,如升級OAIS數字檔案館系統可無縫對接數據,保證數據安全性移植。

1.1.1.6. 開放性

提供的系統應遵循國際標準,支持多種網絡協議,提供開放的數據接口(基于SOA標準),實現系統間互連。支持各種硬件平臺、不同應用服務器(包括TOMCAT、Websphere、WebLogic)、不同操作系統(包括UNIX、WINDOWS、LINUX等)和數據庫管理系統(如DB2、ORACLE、SQL)。

1.1.1.7. 穩定性

 XXX單位檔案管理系統的功能模型完全以用戶實際業務角度出發,站在檔案管理者的角度,為系統功能模型提供支撐。另外,因為檔案管理系統建設不僅僅局限于機構內部,應充分考慮各下屬單位之間的信息互連,避免形成檔案館信息孤島。實現信息互聯必需遵守一定的規范、標準,所以檔案管理系統的設計采用了開放的數據標準及技術,如都柏林核心元數據(DC)、XML、SOAP等。

1.1.1.8. 標準化

系統在設計、開發過程中,應使用相應的中國國家標準和相關行業標準,包括:

(1) GB/T 13016-1991《標準體系表編制原則和要求》;

(2) GB/T 1.1-2000《標準化工作導則》

(3) GB/T15539-1995軟件工程標準分類法

(4) GB/T8566-2001 信息技術軟件生存周期過程

(5) GB/T8567-1988 計算機軟件產品開發文件編制指南

(6) GB/T9385-1988 計算機軟件需求說明編制指南

(7) GB/T9386-1988 計算機軟件測試文件編制規范

(8) GB/T12505-1990 計算機軟件配置管理計劃規范

(9) GB/T14079-1993 軟件維護指南

(10) GB/T15532-1995 計算機軟件單元測試

(11) GB/T16680-1996 軟件文檔管理指南

(12) GB/Z18493-2001 信息技術軟件生存周期過程指南

(13) GB/T12504-1990 計算機軟件質量保證計劃規范

(14) GB/T17544-1998 信息技術軟件包質量要求和測試

(15) GB/T18491.1-2001 信息技術軟件測量功能規模測量

(16) GB/T18492-2001 信息技術系統及軟件完整性級別

(17) BMB17-2006、BMB23-2008 《涉及國家秘密的信息系統分級保護技術要求》

(18) BMZ2-2001 《涉及國家秘密的計算機信息系統安全保密方案設計指南》

1.1.2. 設計依據

(1) 遵循國家檔案局相關文件檔案管理標準《檔案管理軟件功能要求暫行規定》及國家電子政務、信息安全保密規范。

(2) 嚴格遵守其對系統建設目標、面向用戶對象、各種標準和規范、功能需求和技術需求的各項技術規格要求;

(3) 充分發揮東方飛揚產品、技術優勢、利用現有成熟技術,在現有成熟軟件的基礎上進行改造。

1.1.3. 技術路線

本項目中的 XXX單位檔案管理系統,將基于OAIS參考模型,采用J2EE體系架構,充分運用JAVA、Servlet、Web Service的應用技術和XML的數據交換技術,設計開發Browser/AppServer/DBServer三層架構的數字檔案館應用系統,無用戶端數量限制。

1.1.4. 技術架構

 XXX單位檔案管理系統是基于J2EE平臺研發的數字檔案館系統,系統的所有代碼均使用JAVA語言開發。系統的后臺數據庫系統采用關系型數據庫系統,支持ORACLE、SQLSERVER、MYSQL等多種數據庫系統。系統中的所有配置采用XML技術。技術架構如下圖所示:

179717

整個系統被劃分成五個相對分開的邏輯層面:

展現層:采用Struts框架實現MVC模式的展現層。是展現給系統所有用戶的圖形界面,它包括Ajax、HTML、JSP、Servlet、Java Applet。采用MVC模式的優勢在于:代碼重用性,MVC可以使用多種用戶圖形界面而系統核心處理功能無需改變;開發工作的協同性,Java開發人員與頁面的美工人員的工作可同時獨立的進行,并且圖形界面的變更不會導致核心處理功能的變化;可靠性,因為顯示功能與處理功能的分開,所以在不需要重新編譯核心處理功能的情況下可以修改系統的圖形界面。

應用層:實現所有的檔案管理業務邏輯。包括所有的檔案管理功能,如檔案的攝取、管理、保存、利用、訪問等。工作流引擎貫穿整個系統的功能及業務流程,使各個相對獨立或有先后次序的功能可以有機的結合起來,功能之間有相互調用的接口。

服務層:作為整個系統的服務總線,為整體系統提供面向服務架構的開發工具包。其原理是將基礎功能合并到開發工具包中,統一提供API接口供“應用層”調用,例如JavaMail為所有的模塊提供郵件服務。這些開發工具包有:郵件服務類、消息服務類、文件處理類、FTP處理類、XML處理類、字符集轉換類、唯一主鍵生成器、分頁處理類、數據類型轉換類、樹型結構處理類、報表處理類、文件加/解密類等。

信息包引擎:信息包引擎層是進行邏輯包與物理存貯包之間的轉換層。它完成從信息包數據到數據庫、文件系統、外部各種數據源之間的交互與存取功能,并提供統一的訪問接口。本層向上提供訪問接口,包括定義、查詢和更新三方面的功能接口,向上層提供以DOM形式的信息數據包,將經過服務接口從各類數據源中獲取到的數據轉換為信息包、將數據修改命令轉換為標準格式提交給服務接口執行。數據庫接口使用hibernate 數據對象持久層技術實現。Xml文件訪問使用w3c標準格式定義的xml文件系統作為數據源訪問。

數據層:存放系統的應用數據,是上層的數據源。數據源可以是關系型的數據庫系統,如Oracle、MS Sqlserver、Mysql等;也可以是XML文檔集(按照XML規范存放的數據)。

1.1.1. 系統架構

 XXX單位檔案管理系統架構,如下圖所示:

130712

1.1.1. 應用架構

 XXX單位檔案管理系統的應用架構,即功能模型如下圖所示:

450459

SIP :提交信息包;

AIP :檔案信息包;

DIP :分發信息包;

信息生產者:立檔單位或個人;

立檔單位提交:立檔單位在線將SIP批量遠程傳輸至INGEST功能,由INGEST功能產生適合標準及保存的AIP。SIP在傳輸過程中處于加密、壓縮狀態。從SIP到AIP過程可采用工作流管理;

個人提交:屬于個人捐獻檔案??稍诰€著錄檔案元數據;

元數據:采用并擴展都柏林核心元數據標準(DC)描述檔案信息;

工作流管理:通過用戶自定義的工作流引擎,完成信息提交、攝取、歸檔、利用審批等業務流程,管理員可實時監控流程進度;

在線預訂:利用者在線向ACCESS功能提交超過權限范圍的數字檔案利用請求,經管理員審核后,由ACCESS功能產生分發信息包(DIP)通過電子郵件服務發送至利用者;

安全防護層:包括數字傳輸加密、電子文件加密。

1.1.1. 總體數據流圖

 XXX單位檔案管理系統的基本功能之一就是管理歸檔數據,歸檔數據的主體是電子文件以及電子文件的描述信息(條目數據)。 XXX單位檔案管理系統始終是為數據服務的,數據是 XXX單位檔案管理系統的核心要素。下圖描述的是數據在 XXX單位檔案管理系統中的總體的數據流。

129107

聯系我們

電話:15545301188
聯系人:付立新

地址

黑龍江省牡丹江市江南開發區威廉公館6號樓2單元201

全國免費熱線

15545301188