檔案數據的“異質備份”是目前檔案行業(yè)經常使用的業(yè)務術語,雖然最開始提出時主要是指紙質檔案的膠片化,但隨著技術的發(fā)展,現在主要指對檔案數據資源的使用“不同離線介質“進行”離線存儲”,實現長期保存。

這個項目自啟動以來,我們團隊便傾注了極大的熱情和精力。在市場調研、需求分析、方案制定等各個環(huán)節(jié),我們都力求做到最好。期間,我們不斷與合作伙伴溝通協作,共同攻克了一個又一個難題。終于,在激烈的競爭中脫穎而出,成功中標!

這次中標不僅是對我們團隊實力的認可,更是對我們辛勤付出的回報。這個項目的成功中標,將為我們帶來更多的業(yè)務機會和發(fā)展空間,也將在行業(yè)內樹立我們的良好口碑。


早期觀點:“異質備份”指電子文件打印為紙質或膠片

2008年汶川大地震發(fā)生后,國家檔案局審時度勢,要求各級國家檔案館通過建立異地備份庫等形式,時任國家檔案局局長楊冬權在兩年后的“全國檔案安全體系建設工作會議”上提出: “為了確保檔案實體安全和信息安全,國家檔案局2008年進一步要求各級國家檔案館通過建立異地備份庫等形式,對本級重要檔案及電子文件實行異地備份,對重要的電子文件實行異質備份,確保電子文件的長期可讀,確保檔案信息的絕對安全。各地檔案部門高度重視,精心組織,積極謀劃,相繼建立了電子文件中心或電子文件備份中心,開展電子文件管理工作,認真做好電子文件異質備份和重要檔案異地備份工作?!? “要嚴格對電子文件進行安全備份。凡未向電子文件中心移交電子文件的單位,要將本單位所有電子文件在異地備份一套,其中劃入永久保存的,還要轉換成紙質或縮微膠卷,實行異質備份,以確保電子文件安全?!? 可見,早期文檔中所提到的“異質備份”主要指電子文件轉換成“紙質”或“微縮膠片”,也就是大家通常說的“模擬軌”存儲方式。 當前技術下,電子文件主要使用兩種形態(tài)進行保存,一種是“模擬軌”、一種是“數字軌”。模擬軌上主要記錄模擬信號,模擬信號(Analog Signal)是一種連續(xù)變化的信號,可以在一定范圍內取無限多個值。它通常用于傳輸物理世界中的信息,如聲音、光強、溫度等。例如,在音頻傳輸中,模擬信號可以直接表示聲音的波形。這種信號的特點是具有連續(xù)性和無窮多的可能值,任何微小的變化都會反映在信號上。由于模擬信號的連續(xù)性,傳輸過程中容易受到噪聲的影響,從而導致信號的失真或衰減。除傳統紙質外,早期的磁帶和縮微膠片存儲的就是這類信號。 但是,傳統的模擬信號存儲介質存在諸多問題:

問題一:信號不穩(wěn)定,受環(huán)境影響大

這種模擬信號的存儲介質由于存儲信號是連續(xù)變化的波形,所以每個采樣點的采樣值在播放或者數字化過程中很容易受到外界影響而無法輸出唯一數據。 例如: 使用不同品牌、不同精度的掃描儀對同一文件進行掃描將生成不同大小數字化文件。 使用不同品質的磁頭或者鏡頭將顯著影響磁帶或者膠片的播放質量。

問題二:無法記錄復雜電子文件

除可以展開為二維結構的檔案數據(如文本類、圖紙類和簡單圖像)外,傳統紙質和膠片介質難以記錄復雜結構電子文件,如壓縮包、鏡像文件、數據庫備份文件、二進制程序文件、CAD圖紙文件等,這些復雜類型數據難以展開為二維結構或線性波形,因此難以在傳統介質上進行記錄。

問題三:無法恢復為唯一的電子文件

備份的唯一作用,就是用來做“數據恢復”,如果異質備份主要使用“模擬信號”方式進行備份,則將無法準確恢復為原文件(文件大小、內容完全一致),外界光線、磁場將導致每次的文件還原結果都不一致。 可見,無論是“紙質”還是“縮微膠片”都仍然使用模擬信號存儲數據,這種存儲模式本質上是一種不穩(wěn)定的存儲形態(tài),非常容易受到播放設備、環(huán)境和技術種類而導致檔案電子文件發(fā)生變化,從而導致無法從這類介質中還原唯一的電子文件,難以使用信息化手段對檔案數字化文件進行唯一性認證,最終難以起到現代意義上的數字備份效果。 導致唯有原紙質件才具有法律效力,所有的電子還原件難以證明其真實性,帶來額外的工作成本。

問題四:誤碼率高,沒有數據糾錯機制,極易損壞

最重要的是,這類存儲介質缺乏現代意義上的數據修復機制(如數據校驗值、數據糾刪算法),當一個位置的磁性或者像素丟失后,無法通過數學手段恢復損壞的數據,最終導致數據損壞。 可見,使用“模擬軌”方式存儲的檔案數據仍然以實物方式管理、難以進行唯一性跟蹤、除原件外,也難以在現代單套制體系下進行憑證和真實性認證。

問題五:容量密度小,相關設備造價高、不普及

模擬軌因為存儲原理問題難以實現高密度擴展,單張介質存儲量有限,需要搭配專業(yè)級設備才能實現數據讀取和寫入(如讀取膠片需要專業(yè)級鏡頭設備,初次采購成本較高)。 隨著技術發(fā)展,目前也有數字膠片技術,即采用模擬信號存儲數字型號的方式,先將數字信號轉為圖形碼(如二維碼),然后將圖形碼刻蝕在傳統膠片上,從而實現使用傳統膠片記錄數字信號,但目前仍受限于市場和技術推廣。

現代觀點:“異質備份”指在“不同存儲介質”上進行“離線備份”

隨著信息化系統和“單套制”理念的不斷推進,數字化后的電子檔案和原生電子檔案存量逐年增長,為滿足檔案存儲的安全性,官方文檔中不再提及“異質備份”,而是將重點落到了在“不同存儲介質”上進行“離線備份”。 維基百科中提到: “備份(英語:backup),在信息技術與數據管理領域,指將文件系統或數據庫系統中的數據加以復制;一旦發(fā)生災難或錯誤操作時,得以方便且及時地恢復系統的有效數據和正常運作。重要資料應當異地備援,降低風險” “離線備份(Off-line Backup):離線備份使用可離線媒體來備份,磁帶、光盤或是硬盤盒備份完成后離開備份媒體” 2024年《中華人民共和國檔案法實施條例》中第四十一條明確提到: “檔案館對重要電子檔案進行異地備份保管,應當采用磁介質、光介質、縮微膠片等符合安全管理要求的存儲介質,定期檢測載體的完好程度和數據的可讀性。異地備份選址應當滿足安全保密等要求。” “檔案館可以根據需要建設災難備份系統,實現重要電子檔案及其管理系統的備份與災難恢復?!? 此外,第四十條也明確提到: “檔案館應當在接收電子檔案時進行真實性、完整性、可用性和安全性等方面的檢測,并采取管理措施和技術手段保證電子檔案在長期保存過程中的真實性、完整性、可用性和安全性?!? 2020年國際檔案局《檔案檢查工作辦法》中明確提到: “制定電子檔案備份、轉換和遷移方案及策略,并按照備份策略對電子檔案實行在線、離線、近線備份” “電子檔案單套管理,完成電子檔案長期保存所需的配套制度、設施設備的配置工作、指定長期保存策略,實現電子檔案單套管理”。 2022年,國際檔案局發(fā)布的《電子會計檔案管理規(guī)范》中明確提到: “電子會計檔案應實施在線和離線存儲。在線存儲按電子會計檔案管理系統運行要求實施。離線存儲載體應具有較好的耐久性,按優(yōu)先順序依次為一次性寫光盤、磁帶、硬磁盤等?!? “重要電子會計檔案應進行一式三套離線存儲,三套離線存儲載體宜分開保管,有條件的單位應進行異地備份。離線存儲載體管理按照 DA/T15和 DA/T38給出的要求進行。不能用運維備份的信息組織方式進行離線存儲,更不能用系統備份文件代替離線存儲文件。 對離線存儲電子會計檔案的磁性載體每滿2年、光盤每滿4年進行一次抽樣機讀檢驗,抽樣率不低于10%,發(fā)現問題應及時采取措施。對磁性載體上的電子檔案,應每4年轉存一次。原載體同時保留時間不少于4年。” 從上述相關表述中可以明顯看出,“異質備份”表述被“離線存儲”所替代,明確提及了多種離線存儲介質,如“磁介質”和“光介質”,并且需要進行多套備份和長期保存,并格外重視存儲過程中的“四性檢測”,例如電子檔案數據的真實性就必須依賴現代存儲技術進行針對性維護。
圍繞“磁介質”和“光介質”離線存儲,相關的標準如下: article article 相比于傳統的膠片等技術,光介質和磁介質主要具備以下優(yōu)勢:

優(yōu)勢一:天然符合支持檔案行業(yè)“離線存儲”

藍光光盤是天然的離線存儲介質,當不讀取數據時,光盤與驅動器分離,進而與系統斷開實現離線存儲。 硬磁盤的離線存儲通常需要借助人工管理或硬盤庫管理,實現對指定硬盤進行斷電離線管理。

優(yōu)勢二:低誤碼率,數據糾錯算法與介質質檢

現代化的存儲介質均具備數據糾錯算法,即輕微的環(huán)境干擾或介質損壞不會導致數據損壞,驅動器一般可以進行數據解碼恢復。 磁介質具備S.M.A.R.T.自動化檢測功能,光介質需要使用特制檢測光驅實現介質檢測,完善的介質檢測可以避免存儲數據潛在的丟失風險。

優(yōu)勢三:容量密度大,保存時間長

目前藍光光盤可以最大做到200GB/張的容量密度。 硬盤可以做到20TB/塊,遠超傳統的模擬存儲介質。

隨著時代和技術的發(fā)展,各種術語的含義也在發(fā)生變化,無論是長期保存、離線存儲還是異質存儲,雖然技術在不斷迭代,但目的始終沒有變化,即保證珍貴的檔案數據的安全性。 只有結合最新檔案相關要求和技術發(fā)展潮流,提升相關技術能力,才能逐步建立起電子檔案數據的安全備份體系,實現長期保存。

查看原文