對檔案數字資源“異質備份”的理解

檔案數據的“異質備份”是目前檔案行業(yè)經常使用的業(yè)務術語,雖然最開始提出時主要是指紙質檔案的膠片化,但隨著技術的發(fā)展,現在主要指對檔案數據資源的使用“不同離線介質“進行”離線存儲”,實現長期保存。
這個項目自啟動以來,我們團隊便傾注了極大的熱情和精力。在市場調研、需求分析、方案制定等各個環(huán)節(jié),我們都力求做到最好。期間,我們不斷與合作伙伴溝通協作,共同攻克了一個又一個難題。終于,在激烈的競爭中脫穎而出,成功中標!
這次中標不僅是對我們團隊實力的認可,更是對我們辛勤付出的回報。這個項目的成功中標,將為我們帶來更多的業(yè)務機會和發(fā)展空間,也將在行業(yè)內樹立我們的良好口碑。
早期觀點:“異質備份”指電子文件打印為紙質或膠片
問題一:信號不穩(wěn)定,受環(huán)境影響大
這種模擬信號的存儲介質由于存儲信號是連續(xù)變化的波形,所以每個采樣點的采樣值在播放或者數字化過程中很容易受到外界影響而無法輸出唯一數據。 例如: 使用不同品牌、不同精度的掃描儀對同一文件進行掃描將生成不同大小數字化文件。 使用不同品質的磁頭或者鏡頭將顯著影響磁帶或者膠片的播放質量。
問題二:無法記錄復雜電子文件
除可以展開為二維結構的檔案數據(如文本類、圖紙類和簡單圖像)外,傳統紙質和膠片介質難以記錄復雜結構電子文件,如壓縮包、鏡像文件、數據庫備份文件、二進制程序文件、CAD圖紙文件等,這些復雜類型數據難以展開為二維結構或線性波形,因此難以在傳統介質上進行記錄。
問題三:無法恢復為唯一的電子文件
備份的唯一作用,就是用來做“數據恢復”,如果異質備份主要使用“模擬信號”方式進行備份,則將無法準確恢復為原文件(文件大小、內容完全一致),外界光線、磁場將導致每次的文件還原結果都不一致。 可見,無論是“紙質”還是“縮微膠片”都仍然使用模擬信號存儲數據,這種存儲模式本質上是一種不穩(wěn)定的存儲形態(tài),非常容易受到播放設備、環(huán)境和技術種類而導致檔案電子文件發(fā)生變化,從而導致無法從這類介質中還原唯一的電子文件,難以使用信息化手段對檔案數字化文件進行唯一性認證,最終難以起到現代意義上的數字備份效果。 導致唯有原紙質件才具有法律效力,所有的電子還原件難以證明其真實性,帶來額外的工作成本。
問題四:誤碼率高,沒有數據糾錯機制,極易損壞
最重要的是,這類存儲介質缺乏現代意義上的數據修復機制(如數據校驗值、數據糾刪算法),當一個位置的磁性或者像素丟失后,無法通過數學手段恢復損壞的數據,最終導致數據損壞。 可見,使用“模擬軌”方式存儲的檔案數據仍然以實物方式管理、難以進行唯一性跟蹤、除原件外,也難以在現代單套制體系下進行憑證和真實性認證。
問題五:容量密度小,相關設備造價高、不普及
模擬軌因為存儲原理問題難以實現高密度擴展,單張介質存儲量有限,需要搭配專業(yè)級設備才能實現數據讀取和寫入(如讀取膠片需要專業(yè)級鏡頭設備,初次采購成本較高)。 隨著技術發(fā)展,目前也有數字膠片技術,即采用模擬信號存儲數字型號的方式,先將數字信號轉為圖形碼(如二維碼),然后將圖形碼刻蝕在傳統膠片上,從而實現使用傳統膠片記錄數字信號,但目前仍受限于市場和技術推廣。
現代觀點:“異質備份”指在“不同存儲介質”上進行“離線備份”
圍繞“磁介質”和“光介質”離線存儲,相關的標準如下:


優(yōu)勢一:天然符合支持檔案行業(yè)“離線存儲”
藍光光盤是天然的離線存儲介質,當不讀取數據時,光盤與驅動器分離,進而與系統斷開實現離線存儲。 硬磁盤的離線存儲通常需要借助人工管理或硬盤庫管理,實現對指定硬盤進行斷電離線管理。
優(yōu)勢二:低誤碼率,數據糾錯算法與介質質檢
現代化的存儲介質均具備數據糾錯算法,即輕微的環(huán)境干擾或介質損壞不會導致數據損壞,驅動器一般可以進行數據解碼恢復。 磁介質具備S.M.A.R.T.自動化檢測功能,光介質需要使用特制檢測光驅實現介質檢測,完善的介質檢測可以避免存儲數據潛在的丟失風險。
優(yōu)勢三:容量密度大,保存時間長
目前藍光光盤可以最大做到200GB/張的容量密度。 硬盤可以做到20TB/塊,遠超傳統的模擬存儲介質。
隨著時代和技術的發(fā)展,各種術語的含義也在發(fā)生變化,無論是長期保存、離線存儲還是異質存儲,雖然技術在不斷迭代,但目的始終沒有變化,即保證珍貴的檔案數據的安全性。 只有結合最新檔案相關要求和技術發(fā)展潮流,提升相關技術能力,才能逐步建立起電子檔案數據的安全備份體系,實現長期保存。
查看原文