萬(wàn)字總結(jié):數(shù)據(jù)備份那些事兒
萬(wàn)字總結(jié):數(shù)據(jù)備份那些事兒
talkwithtrend
talkwithtrend.com社區(qū)(即twt社區(qū))官方公眾號(hào),持續(xù)發(fā)布優(yōu)秀社區(qū)原創(chuàng)內(nèi)容。內(nèi)容深度服務(wù)企業(yè)內(nèi)各方向的架構(gòu)師、運(yùn)維主管、開(kāi)發(fā)和運(yùn)維工程師等IT專(zhuān)業(yè)崗位人群,讓您時(shí)刻和國(guó)內(nèi)企業(yè)IT同行保持信息同步。
【作者】 張鵬, 某金融科技公司高級(jí)技術(shù)主管
1. 備份相關(guān)的基礎(chǔ)知識(shí)
1.1. 什么是備份
首先先了解一下什么是數(shù)據(jù)備份,數(shù)據(jù)備份顧名思義,就是將數(shù)據(jù)以某種方式加以保留,以便在系統(tǒng)遭受破壞或其他特定情況下,重新加以利用的一個(gè)過(guò)程。在日常生活中,我們經(jīng)常需要為自己家的房門(mén)多配幾把鑰匙,為自己的愛(ài)車(chē)準(zhǔn)備一個(gè)備胎,這些都是備份思想的體現(xiàn)。
數(shù)據(jù)備份作為存儲(chǔ)領(lǐng)域的一個(gè)重要組成部分,其在存儲(chǔ)系統(tǒng)中的地位和作用都是不容忽視的。對(duì)一個(gè)完整的IT系統(tǒng)而言,備份工作是其中必不可少的組成部分。其意義不僅在于防范意外事件的破壞,而且還是歷史數(shù)據(jù)保存歸檔的最佳方式。換言之,即便系統(tǒng)正常工作,沒(méi)有任何數(shù)據(jù)丟失或破壞發(fā)生,備份工作仍然具有非常大的意義,為我們進(jìn)行歷史數(shù)據(jù)查詢(xún)、統(tǒng)計(jì)和分析,以及重要信息歸檔保存提供了可能。
簡(jiǎn)單的說(shuō),一份數(shù)據(jù)備份的作用,不僅僅像房門(mén)的備用鑰匙一樣,當(dāng)原來(lái)的鑰匙丟失或損壞了,才能派上用場(chǎng)。有時(shí)候,數(shù)據(jù)備份的作用,更像是我們?yōu)榱肆糇∶篮脮r(shí)光而拍攝的照片,把暫時(shí)的狀態(tài)永久的保存了下來(lái),供我們分析和研究。當(dāng)然我們不可能憑借一張兒時(shí)的照片就回到從前,在這一點(diǎn)上,數(shù)據(jù)備份就更顯神奇,一個(gè)存儲(chǔ)系統(tǒng)乃至整個(gè)網(wǎng)絡(luò)系統(tǒng),完全可以回到過(guò)去的某個(gè)時(shí)間狀態(tài),或者重新“克隆”一個(gè)指定時(shí)間狀態(tài)的系統(tǒng),只要在這個(gè)時(shí)間點(diǎn)上,我們有一個(gè)完整的系統(tǒng)數(shù)據(jù)備份。
還有一個(gè)需要澄清的問(wèn)題,數(shù)據(jù)備份更多的是指數(shù)據(jù)從在線狀態(tài),剝離到離線狀態(tài)的過(guò)程,這與服務(wù)器高可用集群技術(shù)以及遠(yuǎn)程災(zāi)備技術(shù),在本質(zhì)上有所區(qū)別。雖然從目的上講,這些技術(shù)都是為了消除或減弱意外事件給系統(tǒng)帶來(lái)的影響,但是,由于其側(cè)重的方向不同,實(shí)現(xiàn)的手段和產(chǎn)生的效果也不盡相同。集群和災(zāi)備技術(shù)的目的,是為了保證業(yè)務(wù)的連續(xù)性,也就是說(shuō),當(dāng)意外發(fā)生時(shí),系統(tǒng)所提供的服務(wù)和功能不會(huì)因此而間斷,能夠重續(xù)運(yùn)行。對(duì)數(shù)據(jù)而言,集群和災(zāi)備技術(shù)是保護(hù)系統(tǒng)的在線狀態(tài),保證數(shù)據(jù)可以隨時(shí)被訪問(wèn)。而相對(duì)來(lái)說(shuō),備份技術(shù)的目的,是將整個(gè)系統(tǒng)的數(shù)據(jù)或狀態(tài)保存下來(lái),這種方式不僅可以挽回硬件設(shè)備壞損帶來(lái)的損失,也可以挽回邏輯錯(cuò)誤和人為惡意破壞的損失。
然而,一般來(lái)說(shuō),數(shù)據(jù)備份技術(shù)并不保證系統(tǒng)的實(shí)時(shí)可用性。也就是說(shuō),一旦意外發(fā)生,備份技術(shù)只保證數(shù)據(jù)可以恢復(fù),但是恢復(fù)過(guò)程需要一定的時(shí)間,在此期間,系統(tǒng)是不可用的。在具有一定規(guī)模的系統(tǒng)中,備份技術(shù)、集群技術(shù)和災(zāi)備技術(shù)互相不可替代,并且穩(wěn)定和諧的配合工作,共同保證著系統(tǒng)的正常運(yùn)轉(zhuǎn)。
1.2. 手工備份和自動(dòng)化備份
相比于系統(tǒng)、數(shù)據(jù)庫(kù)管理人員手工備份,自動(dòng)備份軟件有如下的優(yōu)勢(shì):
穩(wěn)定性
備份的主要作用是為系統(tǒng)提供一個(gè)數(shù)據(jù)保護(hù)的方法,于是備份本身的穩(wěn)定性和可靠性就變成了最重要的一個(gè)方面。相比 于 手工備份,自動(dòng)備份軟件更能保證備份的穩(wěn)定可靠,能提供方法確保不會(huì)在恢復(fù)時(shí)才發(fā)現(xiàn)備份是不成功的。
全面性
在復(fù)雜的計(jì)算機(jī)網(wǎng)絡(luò)環(huán)境中,可能會(huì)包括了各種操作平臺(tái),如各種廠家的UNIX、Linux、Windows等,并安裝了各種應(yīng)用系統(tǒng),如數(shù)據(jù)庫(kù)、文件系統(tǒng)等。備份軟件可以全面支持這些平臺(tái)、軟件。
自動(dòng)化
很多公司由于工作性質(zhì),對(duì)何時(shí)備份、用多長(zhǎng)時(shí)間備份都有一定的限制。在下班時(shí)間系統(tǒng)負(fù)荷輕,適于備份??墒沁@會(huì)增加系統(tǒng)管理員的負(fù)擔(dān),由于精神狀態(tài)等原因,還會(huì)給備份安全帶來(lái)潛在的隱患。自動(dòng)備份軟件能提供定時(shí)的自動(dòng)備份,并利用磁帶庫(kù)等技術(shù)進(jìn)行自動(dòng)換帶。在自動(dòng)備份過(guò)程中,還有日志記錄功能,并在出現(xiàn)異常情況時(shí)自動(dòng)報(bào)警。
高性能
隨著業(yè)務(wù)的不斷發(fā)展,數(shù)據(jù)越來(lái)越多,更新越來(lái)越快,在休息時(shí)間來(lái)不及備份如此多的內(nèi)容,在工作時(shí)間備份又會(huì)影響系統(tǒng)性能。備份軟件在備份時(shí),可以盡量考慮到提高數(shù)據(jù)備份的速度,如利用多個(gè)磁帶機(jī)并行操作的方法、利用合成備份的方法等等。
操作簡(jiǎn)單,集中管理
備份軟件提供集中管理功能,能夠?qū)μ貏e重要數(shù)據(jù)做多份拷貝,并能記錄跟蹤每次備份的不同版本,這樣就可以按照需要恢復(fù)不同的數(shù)據(jù)。數(shù)據(jù)備份應(yīng)用于不同領(lǐng)域,進(jìn)行數(shù)據(jù)備份的操作人員也處于不同的層次。備份軟件提供了一個(gè)直觀的、操作簡(jiǎn)單的圖形化用戶(hù)界面,縮短操作人員的學(xué)習(xí)時(shí)間,減輕操作人員的工作壓力,使備份、恢復(fù)工作得以輕松地設(shè)置和完成。
實(shí)時(shí)性
有些關(guān)鍵性的任務(wù)是要24小時(shí)不停機(jī)運(yùn)行的,在備份的時(shí)候,有一些文件可能仍然處于打開(kāi)的狀態(tài)。那么在進(jìn)行備份的時(shí)候,要采取措施,實(shí)時(shí)地查看文件大小、進(jìn)行事務(wù)跟蹤,以保證正確地備份系統(tǒng)中的所有文件。而這些僅憑借手工備份是很難做到的。
能更迅速、準(zhǔn)確的恢復(fù)數(shù)據(jù)
備份軟件精確的知道每次備份發(fā)生的時(shí)間和內(nèi)容以及存放地點(diǎn),能夠迅速找到并恢復(fù)數(shù)據(jù)。同時(shí),也可以采用多種技術(shù)如從快照恢復(fù)、多流恢復(fù)等方法提高恢復(fù)速度。備份軟件也能提供更小顆粒的恢復(fù)功能。
1.3. 備份和恢復(fù)
數(shù)據(jù)備份的根本目的,是重新利用,這也就是說(shuō),備份工作的核心是恢復(fù),一個(gè)無(wú)法恢復(fù)的備份,對(duì)任何系統(tǒng)來(lái)說(shuō)都是毫無(wú)意義的。在實(shí)際情況中,廠商或集成商更多的是向用戶(hù)吹噓,自己的產(chǎn)品在備份過(guò)程中如何的巧妙。然而,作為最終用戶(hù),一定需要清醒的認(rèn)識(shí)到,能夠安全、方便而又高效的恢復(fù)數(shù)據(jù),才是備份系統(tǒng)的真正生命所在。也許很多人會(huì)以為,既然備份系統(tǒng)已經(jīng)把需要的數(shù)據(jù)備份下來(lái)了,恢復(fù)應(yīng)該不成什么問(wèn)題。這就大錯(cuò)而特錯(cuò)了,事實(shí)上,無(wú)論是在金融電信行業(yè)的數(shù)據(jù)中心,還是在普通的桌面級(jí)系統(tǒng)中,備份數(shù)據(jù)無(wú)法恢復(fù),從而導(dǎo)致數(shù)據(jù)丟失的例子實(shí)在太多了。
眾所周知,建造大樓時(shí)一定會(huì)配備消防系統(tǒng),但是,并非有了消防系統(tǒng)就能高枕無(wú)憂。人們經(jīng)常獲悉,有的樓房突遭火災(zāi)時(shí),消防系統(tǒng)卻無(wú)故癱瘓了,或者消防栓里沒(méi)有水,或者消防通道被堵塞,以致火勢(shì)蔓延,造成巨大的生命財(cái)產(chǎn)損失。因此,并非所有的消防系統(tǒng),在遭遇火災(zāi)時(shí)都能起作用。一樣的道理,數(shù)據(jù)備份設(shè)施之于IT系統(tǒng),就相當(dāng)于消防系統(tǒng)之于樓房,它是保護(hù)IT系統(tǒng)的最后一道防線。即使配備了數(shù)據(jù)備份設(shè)施,并不表明在IT系統(tǒng)遇到問(wèn)題時(shí)一定能將丟失的數(shù)據(jù)成功恢復(fù)。
為了進(jìn)一步闡明恢復(fù)的重要性,讓我們?cè)賮?lái)對(duì)比一下備份和恢復(fù)操作的區(qū)別。
首先、 備份是計(jì)劃內(nèi)的工作,而恢復(fù)則是計(jì)劃外的工作。對(duì)于IT技術(shù)人員來(lái)說(shuō),備份是按照既定的備份策略,每隔一定時(shí)間,按部就班地操作即可。而恢復(fù)則是只有當(dāng)發(fā)生數(shù)據(jù)丟失時(shí),或者要查找歷史數(shù)據(jù)時(shí),才會(huì)進(jìn)行的操作。通常情況下,實(shí)施恢復(fù)操作時(shí),往往都是十萬(wàn)火急,越快越好,同時(shí)還希望恢復(fù)后的數(shù)據(jù)可用。由于備份對(duì)系統(tǒng) 環(huán)境 的影響比較大,所以備份的工作往往是在特定的時(shí)間內(nèi)完成的,也即所謂的“備份窗口”,這時(shí)生產(chǎn)系統(tǒng)通常不工作。而恢復(fù),因?yàn)槭怯?jì)劃外的工作,對(duì)生產(chǎn)系統(tǒng)肯定會(huì)產(chǎn)生影響。下面以電子郵件數(shù)據(jù)的備份和恢復(fù)為例,來(lái)說(shuō)明恢復(fù)對(duì)系統(tǒng)的影響。假定您對(duì)電子郵件系統(tǒng)的備份策略是每晚八點(diǎn)定時(shí)備份到磁帶,備份完成后磁帶里就會(huì)保存有昨天晚上八點(diǎn)之前收到的所有電子郵件。當(dāng)然,收發(fā)電子郵件是一個(gè)連續(xù)的動(dòng)作,晚上八點(diǎn)后,郵箱仍然在不停地收郵件。假設(shè)到了今天中午12點(diǎn),您發(fā)現(xiàn)某一個(gè)重要的郵件不小心被刪掉了,如果這個(gè)郵件是昨天晚上八點(diǎn)前收到的,那么您還是有可能從磁帶里恢復(fù)該郵件。這時(shí)就要啟動(dòng)恢復(fù)操作了。如果備份軟件能夠?qū)崿F(xiàn)郵件一級(jí)的恢復(fù)(恢復(fù)顆粒是單個(gè)郵件)的話,您只要能找到那封丟失的郵件,直接將它恢復(fù)到郵箱就可以了,恢復(fù)的過(guò)程對(duì)整個(gè)郵件系統(tǒng)沒(méi)有任何影響;但是,如果您的備份軟件只能做到郵箱級(jí)的恢復(fù)(恢復(fù)顆粒是一個(gè)郵箱),那么如果您想恢復(fù)該郵件的話,就不得不把整個(gè)郵箱恢復(fù)到昨晚八時(shí)的狀態(tài),造成的后果就是昨天晚上八點(diǎn)到今天上午12點(diǎn)收進(jìn)的郵件會(huì)全部被覆蓋??梢?jiàn),如果從備份的角度來(lái)說(shuō),兩者沒(méi)什么區(qū)別;但是從恢復(fù)的角度來(lái)講,兩者差別很大。
第二、 備份是大批量的數(shù)據(jù)移動(dòng)過(guò)程,往往需要將所有數(shù)據(jù)或所有增量數(shù)據(jù)全部拷貝到備份設(shè)備,而恢復(fù)往往是少量的數(shù)據(jù)移動(dòng)過(guò)程,只需將需要恢復(fù)的數(shù)據(jù)從備份設(shè)備拷貝回主服務(wù)器。現(xiàn)在市場(chǎng)上流行的很多備份軟件,基本上都是在上世紀(jì)80年代設(shè)計(jì)的,那時(shí)的數(shù)據(jù)量相對(duì)較?。◣资椎綆装僬祝?。當(dāng)進(jìn)行備份操作的時(shí)候,備份軟件會(huì)把所需要備份的數(shù)據(jù)文件打包成一個(gè)備份集(backup set),然后將它拷貝至備份設(shè)備中,并且針對(duì)該備份集形成相對(duì)應(yīng)的索引,但一般不會(huì)對(duì)備份集里的內(nèi)容建立詳細(xì)的索引。那么當(dāng)需要恢復(fù)該備份集中的某一個(gè)文件時(shí),備份軟件就必須從備份集中搜索到該文件,然后進(jìn)行恢復(fù)。這在只有幾百兆數(shù)據(jù)量的IT環(huán)境下完全可行,然而來(lái)到我們目前所處的海量數(shù)據(jù)的時(shí)代,由于數(shù)據(jù)量已經(jīng)高達(dá)幾十甚至幾百TB,如果繼續(xù)沿用這種方式,勢(shì)必產(chǎn)生許多問(wèn)題:從浩如煙淼的備份數(shù)據(jù)里,找到并恢復(fù)您需要的那一個(gè),難度無(wú)異于大海撈針!例如,有的用戶(hù)去電信公司要求查詢(xún)自己的歷史話單(如兩年前的某一個(gè)月的通話記錄),今天,很多電信公司無(wú)法滿足用戶(hù)的這一需求,因?yàn)楹芏嗲闆r下明知該歷史話單一定存在于原先的備份介質(zhì)中,但由于數(shù)據(jù)量實(shí)在太大,幾乎沒(méi)有可操作性。這種情況下,備份雖然是成功的,但是恢復(fù)的成功率卻很低。早年的 調(diào)查 就 揭示了數(shù)據(jù)恢復(fù)的真相 ,即 恢復(fù)作業(yè)的平均成功率只有70%左右 。
當(dāng)考慮數(shù)據(jù)保護(hù)時(shí),應(yīng)著眼于“恢復(fù)”,需著重考慮以下幾點(diǎn):
1.確保數(shù)據(jù)能夠恢復(fù)
2.恢復(fù)速度要盡量快
3.恢復(fù)操作對(duì)系統(tǒng)的影響要盡可能小
4.能夠恢復(fù)到用戶(hù)指定的時(shí)間點(diǎn)
5.恢復(fù)的數(shù)據(jù)是可以使用的
當(dāng)然,恢復(fù)是在備份的基礎(chǔ)上進(jìn)行的,如果備份失敗,恢復(fù)肯定不會(huì)成功。 為了確保能達(dá)到恢復(fù)的目的,對(duì)備份操作有以下幾點(diǎn)基本要求:
1.提高備份成功率
備份過(guò)程中,當(dāng)備份介質(zhì)、備份設(shè)備和網(wǎng)絡(luò)出現(xiàn)問(wèn)題時(shí),備份作業(yè)就會(huì)中斷,要提高備份的成功率,備份系統(tǒng)就應(yīng)具有容錯(cuò)機(jī)制。如果是備份介質(zhì)或備份設(shè)備出現(xiàn)問(wèn)題,可以將備份自動(dòng)切換到其他的備份介質(zhì)、設(shè)備或路徑上,并能確保從中斷處繼續(xù)備份操作。另外,“備份的斷點(diǎn)續(xù)傳”也很重要,當(dāng)網(wǎng)絡(luò)發(fā)生阻塞時(shí),備份也會(huì)中斷;一旦網(wǎng)絡(luò)恢復(fù)正常,備份能從中斷處自動(dòng)重啟并繼續(xù)進(jìn)行。
2.精細(xì)的備份數(shù)據(jù)索引
當(dāng)用戶(hù)希望恢復(fù)數(shù)據(jù)時(shí),絕大多數(shù)情況下并不需要恢復(fù)整個(gè)系統(tǒng),而只要恢復(fù)部分?jǐn)?shù)據(jù),甚至只是一個(gè)文件或郵件。索引做得足夠精細(xì),有利于在恢復(fù)時(shí)能快速查找并定位所需要恢復(fù)的數(shù)據(jù),實(shí)現(xiàn)小顆?;謴?fù),同時(shí)將對(duì)系統(tǒng)的影響降到最小,恢復(fù)速度大幅提高。
3.能產(chǎn)生多個(gè)數(shù)據(jù)副本
為了防止備份數(shù)據(jù)意外損壞,產(chǎn)生多個(gè)備份副本是必要的,也很有效。產(chǎn)生數(shù)據(jù)副本的方法有兩種:同步和異步。同步的方法是,在備份時(shí),同時(shí)把備份數(shù)據(jù)寫(xiě)入到兩個(gè)不同的介質(zhì)中;異步的做法是,先把備份數(shù)據(jù)寫(xiě)入一個(gè)介質(zhì),然后再利用空閑時(shí)段,將備份數(shù)據(jù)復(fù)制到其他介質(zhì)上。當(dāng)然也可以通過(guò)網(wǎng)絡(luò)將其復(fù)制到異地,達(dá)到數(shù)據(jù)容災(zāi)的目的。
4.離場(chǎng)保護(hù)
如果數(shù)據(jù)備份是為了恢復(fù)而進(jìn)行的,就應(yīng)該考慮到萬(wàn)一數(shù)據(jù)中心遭遇災(zāi)難時(shí),怎樣進(jìn)行恢復(fù)。這時(shí)“離場(chǎng)保護(hù)”中保存的數(shù)據(jù)副本就會(huì)起到很大的作用。
5. 操作界面應(yīng)足夠簡(jiǎn)單
用戶(hù)界面應(yīng)該面向恢復(fù),而非面向備份。在面向數(shù)據(jù)恢復(fù)的用戶(hù)界面,所有的備份數(shù)據(jù)是按照數(shù)據(jù)原先的結(jié)構(gòu)來(lái)組織的,需要恢復(fù)哪個(gè)數(shù)據(jù),很快就能找到,輕松點(diǎn)擊一下就能恢復(fù)該數(shù)據(jù)了。
1.4. 備份結(jié)構(gòu)
常見(jiàn)的數(shù)據(jù)備份系統(tǒng)主要有Host-Base、LAN-Base和基于SAN結(jié)構(gòu)的LAN-Free、Server-Free等多種結(jié)構(gòu)。
1.Host-Based備份方式:
Host-Based是傳統(tǒng)的數(shù)據(jù)備份的結(jié)構(gòu)這種結(jié)構(gòu)中存儲(chǔ)介質(zhì)(例如磁帶庫(kù))直接接在服務(wù)器上,而且只為該服務(wù)器提供數(shù)據(jù)備份服務(wù)。在大多數(shù)情況下,這種備份大多是采用服務(wù)器上自帶的磁帶機(jī),而備份操作往往也是通過(guò)手工操作的方式進(jìn)行的。
Host-Based備份結(jié)構(gòu)的優(yōu)點(diǎn)是數(shù)據(jù)傳輸速度快,備份管理簡(jiǎn)單;缺點(diǎn)是不利于備份系統(tǒng)的共享,不適合于現(xiàn)在大型的數(shù)據(jù)備份要求。
2.LAN-Based備份方式:
LAN-Based備份,在該系統(tǒng)中數(shù)據(jù)的傳輸是以網(wǎng)絡(luò)為基礎(chǔ)的。其中配置一臺(tái)服務(wù)器作為備份服務(wù)器,由它負(fù)責(zé)整個(gè)系統(tǒng)的備份操作。磁帶庫(kù)則接在某臺(tái)服務(wù)器上,在數(shù)據(jù)備份時(shí)備份對(duì)象把數(shù)據(jù)通過(guò)網(wǎng)絡(luò)傳輸?shù)酱艓?kù)中實(shí)現(xiàn)備份的。
LAN-Based備份結(jié)構(gòu)的優(yōu)點(diǎn)是節(jié)省投資、磁帶庫(kù)共享、集中備份管理;它的缺點(diǎn)是對(duì)業(yè)務(wù)網(wǎng)絡(luò)傳輸壓力大。
3.LAN-Free備份方式:
LAN-Free和Server-Free的備份系統(tǒng)是建立在SAN(存儲(chǔ)區(qū)域網(wǎng))的基礎(chǔ)上的,其結(jié)構(gòu)如下圖所示?;赟AN的備份是一種徹底解決傳統(tǒng)備份方式需要占用LAN帶寬問(wèn)題的解決方案。它采用一種全新的體系結(jié)構(gòu),將磁帶庫(kù)和磁盤(pán)陣列各自作為獨(dú)立的光纖結(jié)點(diǎn),多臺(tái)主機(jī)共享磁帶庫(kù)備份時(shí),數(shù)據(jù)流不再經(jīng)過(guò)網(wǎng)絡(luò)而直接從磁盤(pán)陣列傳到磁帶庫(kù)內(nèi),是一種無(wú)需占用網(wǎng)絡(luò)帶寬 (LAN-Free) 的解決方案。
目前隨著SAN技術(shù)的不斷進(jìn)步,LAN-Free的結(jié)構(gòu)已經(jīng)相當(dāng)成熟,而Server-Free的備份結(jié)構(gòu)則不太成熟。LAN-Free的優(yōu)點(diǎn)是數(shù)據(jù)備份統(tǒng)一管理、備份速度快、業(yè)務(wù)網(wǎng)絡(luò)傳輸壓力小、磁帶庫(kù)資源共享;缺點(diǎn)是投資高。
4.Server-Free備份方式
另外一種減少對(duì)系統(tǒng)資源消耗的辦法是采用無(wú)服務(wù)器(Serverless)備份技術(shù)。它是LAN-free的一種延伸,可使數(shù)據(jù)能夠在SAN結(jié)構(gòu)中的兩個(gè)存儲(chǔ)設(shè)備之間直接傳輸,通常是在磁盤(pán)陣列和磁帶庫(kù)之間。這種方案的主要優(yōu)點(diǎn)之一是不需要在服務(wù)器中緩存數(shù)據(jù),顯著減少對(duì)主機(jī)CPU的占用,提高操作系統(tǒng)工作效率,幫助企業(yè)完成更多的工作。
無(wú)服務(wù)器備份有幾種實(shí)施方式。
方法一,備份數(shù)據(jù)通過(guò)名為數(shù)據(jù)移動(dòng)器的設(shè)備從磁盤(pán)陣列傳輸?shù)酱艓?kù)上。該設(shè)備可能是光纖通道交換機(jī)、存儲(chǔ)路由器、智能磁帶或磁盤(pán)設(shè)備或者是服務(wù)器。數(shù)據(jù)移動(dòng)器執(zhí)行的命令其實(shí)是把數(shù)據(jù)從一個(gè)存儲(chǔ)設(shè)備傳輸?shù)搅硪粋€(gè)設(shè)備。實(shí)施這個(gè)過(guò)程的一種方法是借助于SCSI-3的擴(kuò)展拷貝命令,它使服務(wù)器能夠發(fā)送命令給存儲(chǔ)設(shè)備,指示后者把數(shù)據(jù)直接傳輸?shù)搅硪粋€(gè)設(shè)備,不必通過(guò)服務(wù)器內(nèi)存。數(shù)據(jù)移動(dòng)器收到擴(kuò)展拷貝命令后,執(zhí)行相應(yīng)功能。它的 主要缺點(diǎn)是必須具備特殊的設(shè)備。無(wú)服務(wù)器備份要求使用支持SCSI-3 擴(kuò)展復(fù)制命令集的智能設(shè)備。
方法二,通過(guò)備份服務(wù)器發(fā)送控制指令,首先對(duì)需要備份的數(shù)據(jù)卷做一個(gè)快照(或者其他類(lèi)似操作),形成一個(gè)副本,然后用備份服務(wù)器將此快照卷Mount上,利用備份服務(wù)器將此卷上的數(shù)據(jù)備份至備份設(shè)備上。
1.5. 備份分類(lèi)
備份類(lèi)型主要有三種:全備份,增量備份,差異備份,除此之外,很多備份軟件在這個(gè)基礎(chǔ)上還延伸出一些縮短備份或者恢復(fù)時(shí)間的備份方式,例如輔助副本備份、合成完全備份等等。
1.全備份
全備份將備份所有選定的文件,然后將每個(gè)文件標(biāo)記為已備份(換句話說(shuō),存檔屬性被清除)。如果使用全備份,恢復(fù)所有文件時(shí)僅需具備最新的備份文件副本或磁帶,全備份通常在首次創(chuàng)建備份集時(shí)執(zhí)行。全備份的優(yōu)點(diǎn)是 易于查找文件,因?yàn)槲募嘉挥诋?dāng)前備份媒體上。文件恢復(fù)只需要一種媒體或一組媒體。缺點(diǎn)是浪費(fèi)時(shí)間和浪費(fèi)空間, 如果文件不頻繁進(jìn)行更改,備份內(nèi)容幾乎完全相同。
2.增量備份
增量備份僅備份那些自上次全備份或增量備份以來(lái)創(chuàng)建或更改的文件。增量備份將文件標(biāo)記為已備份(換句話說(shuō),存檔屬性被清除)。如果結(jié)合全備份和增量備份,恢復(fù)所有數(shù)據(jù)時(shí)必須具備最新的全備份集和所有增量備份集。增量備份的優(yōu)點(diǎn)是 需要存儲(chǔ)的數(shù)據(jù)最少 , 備份速度最快。缺點(diǎn)是 完全 恢復(fù) 系統(tǒng)需要的時(shí)間比 全 備份或差異備份長(zhǎng)。
3.差異備份
差異備份僅備份那些自上次全備份或增量備份以來(lái)創(chuàng)建或更改的文件。差異備份不將文件標(biāo)記為已備份(換句話說(shuō),存檔屬性不被清除)。如果結(jié)合全備份和差異備份,恢復(fù)所有數(shù)據(jù)時(shí)既需要最新全備份的文件或磁帶,也需要最新差異備份的文件或磁帶。差異備份的優(yōu)點(diǎn)是 恢復(fù)時(shí)僅需 要 最新 全 備份的媒體和差異備份的媒體 , 備份速度比 全 備份快。缺點(diǎn)是 完全 恢復(fù) 系統(tǒng)需要的時(shí)間比 全 備份長(zhǎng)。如果大量數(shù)據(jù)發(fā)生變化,備份所需的時(shí)間長(zhǎng)于增量備份的時(shí)間。
4.輔助副本
輔助(或次要)副本是備份數(shù)據(jù)的副本。已復(fù)制的數(shù)據(jù)是主要備份副本的真實(shí)映像。如果主要備份服務(wù)器、設(shè)備和媒體丟失或損壞,已復(fù)制的數(shù)據(jù)可用作熱備用備份副本。主要副本和次要副本使用不同的媒體,通常使用不同的備份庫(kù)。輔助副本的優(yōu)點(diǎn)是 制作備用的備份磁帶原樣副本。與實(shí)際副本相比,輔助副本的生成速度更快。副本可現(xiàn)場(chǎng)保存供災(zāi)難恢復(fù)之用。但是這種延伸的技術(shù)不是所有備份管理軟件都很好支持的功能。
5.合成全備份
合成備份(Synthetic backup)的含義就是將一個(gè)全備份和一些增量備份或者差分備份重新組成一個(gè)全備份,這樣在恢復(fù)的時(shí)候,就好像一個(gè)全備份恢復(fù)一樣快捷;而且這部分發(fā)生在介質(zhì)管理器而不是客戶(hù)端,可以有效利用空間并且減小客戶(hù)端的負(fù)載。一般的用戶(hù)可能不熟悉合成備份的用法,一般來(lái)說(shuō),合成備份可以將多個(gè)備份整合成一個(gè)可用的恢復(fù)文件,所以可以將它和傳統(tǒng)備份統(tǒng)一起來(lái)使用。舉例來(lái)說(shuō),如果用戶(hù)創(chuàng)建一個(gè)三個(gè)月一次的全備份、每天一次的差分備份、一周一次的合成備份,那么每個(gè)星期一次的合成備份就會(huì)把上周的全備份和周內(nèi)的差分備份,重新合成一個(gè)全備份文件,就好像每周一次全備份一樣,而這樣做的好處是將合成備份的工作移到介質(zhì)服務(wù)器中完成,減少了客戶(hù)端的負(fù)載。合成備份的優(yōu)點(diǎn)是 將 全 備份和增量備份合并到一個(gè)新的 全 備份中,該 全 備份位于保存在網(wǎng)絡(luò)和/或關(guān)鍵服務(wù)器之外的庫(kù)中。備份和還原時(shí)間減少。這種功能也是某些備份管理軟件的增值功能,不具有普適性。
1.6. RTO與RPO
在業(yè)務(wù)連續(xù)性管理中,RPO(Recovery Point Objective)是指能把數(shù)據(jù)恢復(fù)到過(guò)去的那一個(gè)時(shí)間點(diǎn),RTO(Recovery Time Objective)是指在出現(xiàn)問(wèn)題后,什么時(shí)候可以恢復(fù)數(shù)據(jù)。RPO可簡(jiǎn)單的描述為企業(yè)能容忍的最大數(shù)據(jù)丟失量,RTO可簡(jiǎn)單的描述為企業(yè)能容忍的恢復(fù)時(shí)間。
1.7. 備份設(shè)備
現(xiàn)在企業(yè)常用的備份設(shè)備和介質(zhì)是磁盤(pán),磁帶和光盤(pán)。歷史上很多其他備份介質(zhì)逐漸淘汰了。
1.磁盤(pán)備份設(shè)備
磁盤(pán)備份設(shè)備通常是H DD(硬盤(pán)驅(qū)動(dòng)器(Hard Disk Drive)) 或者S DD ( 固態(tài)硬盤(pán)(Solid State Drive)) 介質(zhì),用于備份的磁盤(pán)一般考慮大容量,價(jià)格低廉。在備份管理軟件中通常是由一個(gè)或者多個(gè)訪問(wèn)路徑組成,可以是本地磁盤(pán),也可以是遠(yuǎn)程訪問(wèn)路徑的網(wǎng)絡(luò)文件系統(tǒng)。每個(gè)訪問(wèn)路徑就是在磁盤(pán)上的一個(gè)目錄。在備份管理軟件中定義的磁盤(pán)備份設(shè)備一般采用文件系統(tǒng),備份的數(shù)據(jù)都是以文件方式存放在磁盤(pán)備份設(shè)備上的。這樣便于數(shù)據(jù)的管理和跨平臺(tái)的遷移。
磁盤(pán)備份設(shè)備有一些特點(diǎn),例如不支持硬件壓縮;隨機(jī)訪問(wèn)速度快;在大數(shù)據(jù)流的備份和恢復(fù)中,可能比磁帶設(shè)備慢,磁帶更容易實(shí)現(xiàn)多流并發(fā)操作;通常情況下,備份數(shù)據(jù)不能離線拿走;由于磁盤(pán)設(shè)備是一個(gè)在線檢測(cè)設(shè)備,所以存放備份數(shù)據(jù)的可靠性,通常會(huì)比磁帶高。
2.磁帶備份設(shè)備
磁帶設(shè)備通常分為2種:
物理磁帶機(jī):只有一個(gè)磁帶驅(qū)動(dòng)器,通常不包括任何其它機(jī)器裝置。通常磁帶機(jī)都是內(nèi)置在服務(wù)器中的。由于磁帶機(jī)的物理特性,所以管理比較復(fù)雜。
物理磁帶庫(kù):包括自動(dòng)裝載機(jī)(AutoLoader)和帶庫(kù)(TapeLibrary)。它們的特點(diǎn)都是除了磁帶驅(qū)動(dòng)器外,還有一個(gè)機(jī)器手臂,來(lái)自動(dòng)控制和裝載磁帶。
3.光盤(pán)備份設(shè)備
光盤(pán)是以光信息做為存儲(chǔ)的載體并用來(lái)存儲(chǔ)數(shù)據(jù)的一種物品。分不可擦寫(xiě)光盤(pán),如 CD-ROM 、 DVD-ROM 等;和可擦寫(xiě)光盤(pán),如CD-RW、 DVD-RAM 等。藍(lán)光光碟( Blu-ray Disc ,簡(jiǎn)稱(chēng)BD)是指DVD之后的下一代光盤(pán)格式之一,用以存儲(chǔ)高品質(zhì)的影音文件以及高容量的 數(shù)據(jù)存儲(chǔ) 。
光盤(pán)是利用激光原理進(jìn)行讀、寫(xiě)的設(shè)備,是迅速發(fā)展的一種輔助 存儲(chǔ)器 ,可以存放各種文字、聲音、圖形、圖像和動(dòng)畫(huà)等多媒體數(shù)字信息。
光盤(pán)備份設(shè)備也分為光盤(pán)刻錄機(jī)和光盤(pán)庫(kù)。
4.虛擬磁帶庫(kù)
虛擬帶庫(kù)( Virtual Tape Library,VTL )就是以磁盤(pán)作為自身存儲(chǔ)介質(zhì),并能仿真為物理磁帶庫(kù)的產(chǎn)品。簡(jiǎn)單的說(shuō),虛擬帶庫(kù)就是將磁盤(pán)空間虛擬為磁帶空間,能夠在傳統(tǒng)的備份軟件上實(shí)現(xiàn)和傳統(tǒng)磁帶庫(kù)同樣功能的產(chǎn)品。
傳統(tǒng)的磁帶庫(kù)的存儲(chǔ)介質(zhì)為磁帶,磁帶的優(yōu)勢(shì)是可以集中的保存,數(shù)據(jù)的移動(dòng)比較方便,但是磁帶介質(zhì)不是非常穩(wěn)定,容易受粉塵、濕度、磁粉、粘連、霉點(diǎn)等因素的影響,出現(xiàn)讀寫(xiě)錯(cuò)誤 ,對(duì)保存環(huán)境的要求比較高。帶庫(kù)里面的機(jī)械手和驅(qū)動(dòng)器屬于精密機(jī)械設(shè)備,經(jīng)常容易發(fā)生故障,速度比較慢,恢復(fù)時(shí)間比較長(zhǎng)。
虛擬帶庫(kù)將使用磁盤(pán)做為存儲(chǔ)介質(zhì),使用軟件在邏輯上將磁盤(pán)存儲(chǔ)系統(tǒng)(包括SCSI或者光纖陣列或者SAN存儲(chǔ)網(wǎng)絡(luò)等)虛擬為傳統(tǒng)的磁帶庫(kù)設(shè)備,自動(dòng)的在邏輯上實(shí)現(xiàn)機(jī)械手,驅(qū)動(dòng)器的功能,磁盤(pán)存儲(chǔ)系統(tǒng)的RAID,鏡像等功能可以從底層保護(hù)備份的數(shù)據(jù)。虛擬磁帶庫(kù)能夠和各大廠家的備份軟件無(wú)縫的兼容,實(shí)現(xiàn)許多高級(jí)的備份功能,最大程度上保護(hù)用戶(hù)的數(shù)據(jù)。
虛擬帶庫(kù)的實(shí)現(xiàn)可以大致分為三種方式。第一,純軟件方式,即 將磁帶庫(kù)模擬軟件直接安裝在備份服務(wù)器上,把備份 管理 服務(wù)器的文件系統(tǒng)分區(qū)模擬成磁帶庫(kù),從而使備份軟件以磁帶庫(kù)方式使用磁盤(pán)文件系統(tǒng) ,目前有廠家在備份軟件里面集成了類(lèi)似的產(chǎn)品 。這種方式磁盤(pán)本質(zhì)上仍然在線,而且對(duì)備份主機(jī)的負(fù)擔(dān)比較大,使用的環(huán)境有局限性,優(yōu)點(diǎn)是成本比較低。第二種, 專(zhuān)用服務(wù)器級(jí)虛擬磁帶庫(kù)方案 , 該方案實(shí)際上是另外一種虛擬磁帶庫(kù)的軟件實(shí)現(xiàn)方案 , 通過(guò)把虛擬磁帶庫(kù)管理軟件安裝在一臺(tái)獨(dú)立的專(zhuān)用服務(wù)器內(nèi),而將該服務(wù)器及所連接的磁盤(pán)存儲(chǔ)設(shè)備模擬成磁帶庫(kù)。這種方案的 特點(diǎn)是速度比較快,而且數(shù)據(jù)受主機(jī)的影響小, 不足是需要利用一臺(tái)的服務(wù)器作為虛擬磁帶庫(kù)管理器,系統(tǒng)優(yōu)化性略低。第三, 專(zhuān)用控制器級(jí)集成虛擬磁帶庫(kù)設(shè)備方案, 將磁帶庫(kù)模擬管理軟件固化在特別設(shè)計(jì)的硬件設(shè)備中,就形成了專(zhuān)用的虛擬磁帶庫(kù)設(shè)備,這種設(shè)備需要配置一定數(shù)量和類(lèi)型的主機(jī)接口和后端存儲(chǔ)磁盤(pán)陣列接口。專(zhuān)用的虛擬磁帶庫(kù)設(shè)備硬件結(jié)構(gòu)與不同于服務(wù)器,設(shè)計(jì)采用了精簡(jiǎn)的硬件模塊和精簡(jiǎn)的操作系統(tǒng)內(nèi)核(一般為L(zhǎng)inux內(nèi)核),并且充分考慮了與主機(jī)及存儲(chǔ)設(shè)備的連接能力 。專(zhuān)用的虛擬磁帶庫(kù)設(shè)備 的出現(xiàn) 標(biāo)志著虛擬磁帶庫(kù)技術(shù)終于突破了操作系統(tǒng)和PC服務(wù)器架構(gòu)的限制,使虛擬磁帶庫(kù)真正成為了一種獨(dú)立的外設(shè),其使用方式也更接近普通磁帶庫(kù),而其優(yōu)越性能也體現(xiàn)得更加充分。
1.8. 備份的數(shù)據(jù)類(lèi)型
需要備份的數(shù)據(jù)主要分兩類(lèi),即非結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)。
通常把沒(méi)有“數(shù)據(jù)模型”的計(jì)算機(jī)信息稱(chēng)為非結(jié)構(gòu)化數(shù)據(jù),例如文字、圖、音頻、視頻Microsoft Office 文檔, Web頁(yè)面,等。非結(jié)構(gòu)化數(shù)據(jù)多存放于文件系統(tǒng)中,所以備份的時(shí)候多數(shù)按照文件系統(tǒng)備份方式進(jìn)行備份。
2. 數(shù)據(jù)備份策略設(shè)計(jì)
企業(yè)在做數(shù)據(jù)備份策略設(shè)計(jì)的時(shí)候通??紤]備份對(duì)象,備份結(jié)構(gòu),備份方式,備份周期,備份窗口,數(shù)據(jù)保留周期,備份介質(zhì)等等方面。
2.1. 備份對(duì)象的確定
備份對(duì)象,即備份哪臺(tái)主機(jī)上的哪些數(shù)據(jù),企業(yè)用戶(hù)在收集這個(gè)信息的時(shí)候需要細(xì)致,因?yàn)椴煌膫浞輰?duì)象,有不同的備份實(shí)現(xiàn)方案,例如操作系統(tǒng)本身的備份,看似和普通文件系統(tǒng)類(lèi)似,但是操作系統(tǒng)通常不能按照普通文件系統(tǒng)來(lái)進(jìn)行備份,需要考慮操作系統(tǒng)崩潰之后如何從備份介質(zhì)中恢復(fù),如何引導(dǎo)操作系統(tǒng)啟動(dòng),同時(shí)基于windows和unix、linux操作系統(tǒng)還有不同的備份和恢復(fù)方式。又例如,同樣是linux文件系統(tǒng),但是掛載本地文件系統(tǒng)和掛載遠(yuǎn)程共享文件系統(tǒng),所需要的備份方案也不盡相同。一個(gè)大型的I T 系統(tǒng)里自身比較復(fù)雜,有多種類(lèi)型的備份對(duì)象,也有一些大型的I T 系統(tǒng)是有很多耦合度較高的子系統(tǒng)組成,那么在考慮備份對(duì)象的時(shí)候,不可以只考慮單一系統(tǒng)的某個(gè)單個(gè)類(lèi)型的備份對(duì)象,要基于整個(gè)系統(tǒng)能夠恢復(fù)為出發(fā)點(diǎn)來(lái)綜合考慮所有相關(guān)聯(lián)的備份對(duì)象。
2.2. 備份方式
備份方式,采用全備份或全備份與增量備份相結(jié)合的方式;這是需要結(jié)合恢復(fù)來(lái)綜合考慮的,因?yàn)閭浞莸闹饕康氖怯脕?lái)恢復(fù),例如每天全備份,那么恢復(fù)的時(shí)候復(fù)雜程度就降低了,直接拿匹配的備份集來(lái)恢復(fù)就可以了。但是帶來(lái)的問(wèn)題是每天備份窗口時(shí)間長(zhǎng),需要的備份存儲(chǔ)空間大,備份時(shí)系統(tǒng)性能影響時(shí)間長(zhǎng)。如何取舍,需要根據(jù)系統(tǒng)的重要程度,備份的數(shù)據(jù)量,備份窗口,恢復(fù)的要求等等方面綜合考慮。
2.3. 備份計(jì)劃
在備份系統(tǒng)中,用戶(hù)必須制定備份計(jì)劃來(lái)實(shí)施備份;備份計(jì)劃說(shuō)明了,用戶(hù)準(zhǔn)備在何時(shí),對(duì)哪臺(tái)服務(wù)器上的哪些內(nèi)容,進(jìn)行什么類(lèi)型的備份。備份計(jì)劃牽涉到了備份的時(shí)間,備份的內(nèi)容,備份的類(lèi)型,備份的方式。一般而言,在備份系統(tǒng)中,用戶(hù)可以制定一個(gè)或多個(gè)備份計(jì)劃的策略,從而減少制定備份計(jì)劃的工作量。
企業(yè)用戶(hù)的IT 環(huán)境復(fù)雜多樣,不同的系統(tǒng)、應(yīng)用對(duì)備份都有各自的需求,所以針對(duì)不同的需要,往往需要制定不同的備份計(jì)劃。
采用全備份還是全備份與增量備份相結(jié)合的備份方式,這是需要結(jié)合恢復(fù)來(lái)綜合考慮的,因?yàn)閭浞莸闹饕康氖怯脕?lái)恢復(fù),例如每天全備份,那么恢復(fù)的時(shí)候復(fù)雜程度就降低了,直接拿匹配的備份集來(lái)恢復(fù)就可以了。但是帶來(lái)的問(wèn)題是每天備份窗口時(shí)間長(zhǎng),需要的備份存儲(chǔ)空間大,備份時(shí)系統(tǒng)性能影響時(shí)間長(zhǎng)。如何取舍,需要根據(jù)系統(tǒng)的重要程度,備份的數(shù)據(jù)量,備份窗口,恢復(fù)的要求等等方面綜合考慮。
典型常用的備份方式 |
計(jì)劃特點(diǎn) |
適用范圍 |
每天作全備份 |
備份產(chǎn)生的數(shù)據(jù)量大恢復(fù)的速度快備份數(shù)據(jù)的可靠性高,所以可恢復(fù)性強(qiáng) |
小數(shù)據(jù)量的,重要的數(shù)據(jù)備份(例如,小型的數(shù)據(jù)庫(kù)系統(tǒng),AD等) |
每周作1次合成全備份其它工作日作增量備份 |
比較常規(guī)的備份方式,備份的數(shù)據(jù)量少全備份的時(shí)候,不需要從客戶(hù)端讀取數(shù)據(jù);所以全備份效率高;可恢復(fù)性較差,因?yàn)楸仨氁蕾?lài)于每周的全備份;恢復(fù)性能很慢;該數(shù)據(jù)備份必須支持合成全備份 |
郵件系統(tǒng)的備份(Exchange,Lotus)文件系統(tǒng)的備份 |
每周作1次全備份其它工作日作增量備份 |
比較常規(guī)的備份方式,備份的數(shù)據(jù)量少;可恢復(fù)性較差,因?yàn)楸仨氁蕾?lài)于每周的全備份;恢復(fù)性能很慢; |
中大型數(shù)據(jù)庫(kù)(全備份數(shù)據(jù)量比較多) |
每天作1次全備份每隔1小時(shí)作日志備份或者是每周作1次全備份每天作日志備份 |
非常特殊的備份方式;日志備份的時(shí)候?qū)I(yè)務(wù)系統(tǒng)基本沒(méi)有影響;丟失的數(shù)據(jù)可能最少;恢復(fù)的速度可能最慢,因?yàn)椴捎玫氖侨罩净貪L的方式; |
非常大型的數(shù)據(jù)庫(kù),作增量備份對(duì)應(yīng)用影響太大用戶(hù)要求丟失的數(shù)據(jù)量最少 |
2.4. 備份周期
備份周期,每隔多長(zhǎng)時(shí)間進(jìn)行一次備份;這個(gè)需要和備份方式以及備份窗口相結(jié)合來(lái)設(shè)計(jì)。在保護(hù)客戶(hù)投資期間內(nèi),一個(gè)完整的備份周期是指包含第n-1次完全備份和第n-1次完全備份與第n次完全備份之間的增量備份總合。如何評(píng)估備份對(duì)象應(yīng)該每隔多長(zhǎng)時(shí)間做一次備份呢,可以參考R PO 這個(gè)指標(biāo)的設(shè)定,即能夠容忍最多丟失多長(zhǎng)時(shí)間段的數(shù)據(jù)。比如企業(yè)能夠容忍丟失 10 個(gè)小時(shí)的數(shù)據(jù),一次備份需要花費(fèi)1個(gè)小時(shí)的時(shí)間,那么每?jī)蓚€(gè)備份周期的時(shí)間間隔,應(yīng)該小于9個(gè)小時(shí)。
2.5. 備份窗口
備份窗口,每次數(shù)據(jù)備份何時(shí)開(kāi)始,所占用的時(shí)間窗口;業(yè)界有兩種觀點(diǎn),一種認(rèn)為備份窗口是備份所消耗的時(shí)間,另一種認(rèn)為是企業(yè)可以允許某個(gè)時(shí)間段對(duì)于某一個(gè)系統(tǒng)進(jìn)行備份。更多的觀點(diǎn)更傾向于后者,請(qǐng)注意,備份作業(yè)會(huì)占用系統(tǒng)資源的,所以需要合理規(guī)劃出一個(gè)時(shí)間段來(lái)進(jìn)行備份,那么這就是備份窗口。
2.6. 數(shù)據(jù)保留
數(shù)據(jù)保存周期,備份數(shù)據(jù)在多長(zhǎng)時(shí)間內(nèi)有效;這是和企業(yè)對(duì)數(shù)據(jù)生命周期管理的約定,以及監(jiān)管部門(mén)對(duì)企業(yè)數(shù)據(jù)保護(hù)的要求。
數(shù)據(jù)備份到備份介質(zhì)上的時(shí)候,會(huì)占用介質(zhì)空間;如果不制定數(shù)據(jù)保留策略的話,那么每天產(chǎn)生的備份數(shù)據(jù)將不停的占用備份介質(zhì),從而將所有的備份介質(zhì)空間占滿。所以必須制定一個(gè)數(shù)據(jù)保留策略,來(lái)回收過(guò)期數(shù)據(jù)所占用的介質(zhì)空間,或者將備份數(shù)據(jù)從一個(gè)備份介質(zhì)上搬遷到其它介質(zhì)上。
數(shù)據(jù)保留策略的幾個(gè)術(shù)語(yǔ):
歸檔數(shù)據(jù): 往往指的是這些備份介質(zhì)必須被保留很長(zhǎng)時(shí)間,往往>=1年;同時(shí)經(jīng)常是被保留在異地,例如:銀行,保險(xiǎn)柜等。這些數(shù)據(jù)通常是以全備份的方式保留的。例如:每年保留1個(gè)全備份,保留10年。
循環(huán)周期: 指的是備份數(shù)據(jù)經(jīng)過(guò)了一個(gè)循環(huán),1個(gè)循環(huán)包括了1個(gè)全備份和到下一個(gè)全備份間的所有其它類(lèi)型的備份。
保留時(shí)間: 指的是備份數(shù)據(jù)需要保留的天數(shù)。
數(shù)據(jù)保留策略關(guān)系到介質(zhì)空間容量的設(shè)計(jì),同時(shí)還應(yīng)該定義一個(gè)保護(hù)用戶(hù)投資的期限,即空間容量的設(shè)計(jì)要滿足一定時(shí)期內(nèi)的峰值。
數(shù)據(jù)保留設(shè)計(jì)原則:
典型常用的存儲(chǔ)策略 |
策略說(shuō)明和特點(diǎn) |
適用范圍 |
磁盤(pán)保留數(shù)據(jù)保留15天和2個(gè)周期 |
所有的備份數(shù)據(jù)都存放在磁盤(pán)上磁盤(pán)上的數(shù)據(jù)保留15天或者是2個(gè)循環(huán)周期(至少2個(gè)全備份和相關(guān)備份數(shù)據(jù)) |
最常用的磁盤(pán)保留策略 |
磁帶保留數(shù)據(jù)保留15天和2個(gè)周期 |
所有的備份數(shù)據(jù)都存放在磁帶上磁帶上的數(shù)據(jù)保留15天或者是2個(gè)循環(huán)周期(至少2個(gè)全備份和相關(guān)備份數(shù)據(jù)) |
最常用的磁帶保留策略 |
磁盤(pán)和磁帶同時(shí)保留備份,而磁盤(pán)備份是為了快速恢復(fù)磁盤(pán)上保留備份的時(shí)間短磁帶上保留備份的時(shí)間長(zhǎng) |
在磁盤(pán)上保留7天1個(gè)周期的備份數(shù)據(jù)在磁帶上保留30天4個(gè)周期的數(shù)據(jù)每周將磁盤(pán)上的備份數(shù)據(jù)復(fù)制到磁帶上恢復(fù)數(shù)據(jù)的時(shí)候,通過(guò)磁盤(pán)恢復(fù),恢復(fù)速度快;而磁帶作為最后一級(jí)保障; |
最常用的磁盤(pán),磁帶同時(shí)保留策略 |
磁盤(pán)上保存增量備份,磁帶上保留全備份數(shù)據(jù) |
在磁盤(pán)上只保留增量備份數(shù)據(jù)全備份數(shù)據(jù)都備份到磁帶上磁帶上保留30天4個(gè)周期 |
磁盤(pán)備份空間較少的情況 |
磁盤(pán)到磁帶或者是磁帶到磁帶的同時(shí)雙重保護(hù)策略; |
在常規(guī)磁盤(pán)或磁帶備份介質(zhì)上保留15天2個(gè)周期的備份數(shù)據(jù)在另外一個(gè)磁帶池上創(chuàng)建Inline備份,保留策略為30天4周期;此時(shí)往上一級(jí)備份的同時(shí),也同時(shí)往該磁帶上備份; |
這樣防止備份的時(shí)候,備份介質(zhì)或設(shè)備出錯(cuò); |
需要?dú)w檔的磁帶備份常規(guī)數(shù)據(jù)保留為15天2周期,在磁盤(pán)或磁帶上歸檔數(shù)據(jù)為保留7年內(nèi)的年全備份和保留最近1年的月全備份 |
在磁盤(pán)或磁帶上,設(shè)置常規(guī)保留策略,為15天2個(gè)周期在需要?dú)w檔的磁帶上設(shè)置保留策略是:365天中保留月全備份365 x 7中保留年全備份 |
需要將數(shù)據(jù)異地并且離線保存,或長(zhǎng)期歸檔 |
2.7. 備份結(jié)構(gòu)
備份結(jié)構(gòu),采用 LAN-Free 還是 LAN 方式進(jìn)行備份;目前企業(yè)中的備份結(jié)構(gòu)絕大部分都可以歸納為這兩種,主要關(guān)注的是備份的時(shí)候的數(shù)據(jù)流和控制流的走向,通常情況下控制流需要通過(guò)L AN 網(wǎng)絡(luò)傳輸,數(shù)據(jù)流是根據(jù)備份結(jié)構(gòu)設(shè)計(jì)的。充分計(jì)算數(shù)據(jù)量的總量和備份效率,評(píng)估備份對(duì)L AN 網(wǎng)絡(luò)的壓力,這里的L AN 網(wǎng)絡(luò)通常指業(yè)務(wù)網(wǎng)絡(luò),當(dāng)前企業(yè)中通常是以太網(wǎng)網(wǎng)絡(luò)作為業(yè)務(wù)訪問(wèn)網(wǎng)絡(luò)。L AN- Free的誕生主要就是為了解放對(duì)業(yè)務(wù)網(wǎng)絡(luò)的壓力,請(qǐng)注意L AN- Free設(shè)計(jì)的初衷是針對(duì)業(yè)務(wù)網(wǎng)絡(luò)而不是特指以太網(wǎng)絡(luò),這其實(shí)也是S AN 網(wǎng)絡(luò)誕生的時(shí)候被稱(chēng)為第二網(wǎng)絡(luò)的原因?;谶@個(gè)觀點(diǎn),只要備份的數(shù)據(jù)流通過(guò)非業(yè)務(wù)網(wǎng)絡(luò)傳輸,就實(shí)現(xiàn)了L AN-F ree。但是業(yè)界也有很多人的觀點(diǎn),直接就把L AN-F ree和基于光纖通道技術(shù)的S AN 網(wǎng)絡(luò)結(jié)合在一起了。請(qǐng)注意備份結(jié)構(gòu)的設(shè)計(jì),在投資允許的情況下,盡可能的要把備份的網(wǎng)絡(luò),即備份數(shù)據(jù)流傳輸?shù)木W(wǎng)絡(luò),和業(yè)務(wù)網(wǎng)絡(luò)分開(kāi)。
2.8. 多份拷貝
備份數(shù)據(jù)是否進(jìn)行多份拷貝;多個(gè)副本是非常有意義的,能夠更好的保證數(shù)據(jù)安全,如何做多個(gè)拷貝不同的備份管理軟件是有區(qū)別的,有備份的同時(shí)就生成兩個(gè)副本,也有通過(guò)主拷貝生成的副本拷貝,還有通過(guò)介質(zhì)的特性例如虛擬磁帶庫(kù)實(shí)現(xiàn)副本的本地或者異地拷貝。
2.9. 介質(zhì)和備份設(shè)備
備份介質(zhì),備份數(shù)據(jù)使用哪種備份設(shè)備存儲(chǔ)數(shù)據(jù)(物理磁帶庫(kù)、虛擬磁帶庫(kù)、磁盤(pán)緩存設(shè)備,或者以上設(shè)備的組合),以及所使用的磁帶邏輯卷池等。
介質(zhì)離線存放,監(jiān)管機(jī)構(gòu)和有一些企業(yè)自身對(duì)數(shù)據(jù)安全的管理比較嚴(yán)格,是需要做介質(zhì)離線并異地存放的。物理磁帶和光盤(pán)介質(zhì)是具備離線存放的。拿物理磁帶庫(kù)來(lái)說(shuō),做物理磁帶的出庫(kù),并做登記,異地存放。需要注意的是要有比較完善的管理,最好的方式通過(guò)軟件進(jìn)行出庫(kù)管理,并且能夠和備份和恢復(fù)結(jié)合起來(lái)。介質(zhì)存放的地點(diǎn)環(huán)境要符合介質(zhì)長(zhǎng)期存放的要求,確保介質(zhì)不會(huì)受損影響未來(lái)需要時(shí)的恢復(fù)。
備份設(shè)備在備份系統(tǒng)里的功能主要是提供了備份數(shù)據(jù)路徑和提供了備份介質(zhì)用來(lái)存儲(chǔ)數(shù)據(jù)。目前企業(yè)主要的備份設(shè)備是磁盤(pán)、磁帶和光盤(pán)。有一些備份一體機(jī)實(shí)際存儲(chǔ)介質(zhì)是磁盤(pán),物理和虛擬磁帶庫(kù)的存儲(chǔ)方式是按照磁帶的數(shù)據(jù)格式存儲(chǔ),但是虛擬磁帶庫(kù)實(shí)際的存儲(chǔ)介質(zhì)也是磁盤(pán),光盤(pán)介質(zhì)不同于磁帶的線性存儲(chǔ)方式,寫(xiě)入和讀取的方式和磁帶不同,和物理磁盤(pán)接近,同時(shí)也具有離線存儲(chǔ)的功能特性。
針對(duì)磁盤(pán)備份設(shè)備而言,相對(duì)來(lái)說(shuō)管理設(shè)計(jì)比較簡(jiǎn)單,只要有足夠的空間,磁盤(pán)有足夠的性能,就能備份。而且由于磁盤(pán)是個(gè)隨機(jī)設(shè)備,所以在剪除過(guò)期數(shù)據(jù)的時(shí)候,沒(méi)有比較多的考慮。而磁帶備份設(shè)備相對(duì)復(fù)雜,備份的時(shí)候采用驅(qū)動(dòng)器往往只能備份一個(gè)任務(wù);而備份的介質(zhì)是以磁帶方式存放在帶庫(kù)中的磁帶槽位中;因此在這里我們主要介紹備份系統(tǒng)中磁帶備份設(shè)備和相關(guān)的設(shè)計(jì)原則,光盤(pán)備份設(shè)備也可以參考。
磁帶備份設(shè)備的設(shè)計(jì)主要考慮兩個(gè)方面:一是備份數(shù)據(jù)流,這個(gè)主要涉及驅(qū)動(dòng)器池設(shè)計(jì);另一個(gè)是備份介質(zhì)池,這個(gè)涉及備份磁帶池設(shè)計(jì)。
備份數(shù)據(jù)流設(shè)計(jì)原則:在備份系統(tǒng)中,可以將磁帶庫(kù)中一個(gè)或多個(gè)驅(qū)動(dòng)器分配到一個(gè)或多個(gè)驅(qū)動(dòng)器池中。這樣用戶(hù)就可以根據(jù)備份數(shù)據(jù)的多少和重要程度,合理的調(diào)配驅(qū)動(dòng)器資源;確保重要數(shù)據(jù)能夠及時(shí)備份,或者將多個(gè)任務(wù)負(fù)載均衡。
劃分驅(qū)動(dòng)器池的原則:確保最重要的備份任務(wù)有足夠的驅(qū)動(dòng)器能夠備份數(shù)據(jù)。確保驅(qū)動(dòng)器池最少,避免浪費(fèi)??梢酝ㄟ^(guò)劃分任務(wù)優(yōu)先級(jí),來(lái)使得重要的備份任務(wù)能夠優(yōu)先得到驅(qū)動(dòng)器池中的資源。
備份介質(zhì)池:在備份系統(tǒng)中,可以將不同槽位上的磁帶分配到不同的介質(zhì)池中,從而便于管理和維護(hù)。建議在備份管理系統(tǒng)中開(kāi)啟介質(zhì)的條碼或者標(biāo)簽管理,介質(zhì)池的劃分可以按保留時(shí)間或存儲(chǔ)策略方式來(lái)劃分的。
劃分介質(zhì)池的原則:介質(zhì)池的數(shù)量盡量少,從而減少管理復(fù)雜度,使得磁帶空間能夠盡量共享,減少磁帶空間浪費(fèi)。按保留時(shí)間的不同來(lái)劃分介質(zhì)池。例如:14天的1個(gè)介質(zhì)池,1個(gè)月的1個(gè)介質(zhì)池。按磁帶的用途來(lái)劃分介質(zhì)池。例如:1個(gè)介質(zhì)池是專(zhuān)門(mén)存放在線磁帶,用于恢復(fù)的;1個(gè)介質(zhì)池是存放離線拿走磁帶的。按存儲(chǔ)策略個(gè)數(shù)或者用途來(lái)劃分。
2.10. 元數(shù)據(jù)備份
備份管理系統(tǒng)是做備份管理的,備份數(shù)據(jù)的主要目的就是用來(lái)做恢復(fù),備份的數(shù)據(jù)是企業(yè)的重要數(shù)據(jù),那么管理備份數(shù)據(jù)的管理系統(tǒng)也是重要系統(tǒng),備份系統(tǒng)元數(shù)據(jù)包括:備份的匯總索引,用戶(hù)定義的備份計(jì)劃和保留策略,相關(guān)客戶(hù)端和備份設(shè)備。所以保護(hù)元數(shù)據(jù)非常重要。
專(zhuān)業(yè)的企業(yè)級(jí)備份管理系統(tǒng)都有專(zhuān)門(mén)的工具和策略來(lái)保護(hù)元數(shù)據(jù)庫(kù)。如果備份系統(tǒng)沒(méi)有保護(hù)元數(shù)據(jù)的專(zhuān)用工具,請(qǐng)定期將備份管理服務(wù)器上備份系統(tǒng)安裝路徑上的文件,復(fù)制到其它硬盤(pán)或設(shè)備上。請(qǐng)?zhí)貏e注意每一個(gè)備份集和備份管理系統(tǒng)的元數(shù)據(jù)中的備份索引之間的聯(lián)系,備份數(shù)據(jù)的同時(shí)要關(guān)注備份索引的備份,恢復(fù)數(shù)據(jù)的時(shí)候要考慮備份索引數(shù)據(jù)的恢復(fù)和極限情況下整個(gè)備份管理系統(tǒng)的恢復(fù)。
原題:企業(yè)數(shù)據(jù)備份策略規(guī)劃設(shè)計(jì)
如有任何問(wèn)題,可點(diǎn)擊文末 閱讀原文 ,到社區(qū)原文下評(píng)論交流 覺(jué)得本文有用,請(qǐng) 轉(zhuǎn)發(fā) 或點(diǎn)擊“ 賞 ”,讓更多同行看到
資料/文章推薦:
-
今天你備份了嗎——52篇值得閱讀的備份好文
-
數(shù)據(jù)備份管理中的分類(lèi)定級(jí):方法、標(biāo)準(zhǔn)與策略
歡迎關(guān)注社區(qū) "災(zāi)備 " 技術(shù)主題 ,將會(huì)不斷更新優(yōu)質(zhì)資料、文章,您也可以前往提出疑難問(wèn)題,與同行切磋交流。地址: https://www.talkwithtrend.com/Topic/3457
下載 twt 社區(qū)客戶(hù)端 APP
長(zhǎng)按識(shí)別二維碼即可下載
或到應(yīng)用商店搜索“twt”
*本公眾號(hào)所發(fā)布內(nèi)容僅代表作者觀點(diǎn),不代表社區(qū)立場(chǎng) ;封面圖片由版權(quán)圖庫(kù)授權(quán)使用
-
2023年各省最新電價(jià)一覽!8省中午執(zhí)行谷段電價(jià)! 2023-01-03
-
PPT導(dǎo)出高分辨率圖片的四種方法 2022-09-22
-
全國(guó)消防救援總隊(duì)主官及簡(jiǎn)歷(2023.2) 2023-02-10
-
我們的前輩!歷屆全國(guó)工程勘察設(shè)計(jì)大師完整名單! 2022-11-18
-
關(guān)于某送變電公司“4·22”人身死亡事故的快報(bào) 2022-04-26
