HBase自帶的export/import機(jī)制可以實(shí)現(xiàn)Backup Restore功能。而且可以實(shí)現(xiàn)增量備份。 下面設(shè)增量備份的python腳本 在這個(gè)腳本中,每天做增量備份,每個(gè)月15日做全備份。
import time
import datetime
from datetime import date
import sys
import os
tablename=sys.argv[1]
backupDst=sys.argv[2]
today=date.today()
if today.day == 15: //every month, we do a full backup
backupSubFolder=backupDst+today.isoformat()+"-full"
cmd="hbase org.apache.Hadoop.hbase.mapreduce.Export %s %s"%(tablename,backupSubFolder)
else:
yesterday=datetime.date.today()- datetime.timedelta(days=1)
todayTimeStamp=time.mktime(today.timetuple())
yesTimeStamp=time.mktime(yesterday.timetuple())
backupSubFolder=backupDst+today.isoformat()
cmd="hbase org.apache.Hadoop.hbase.mapreduce.Export %s %s %s"%(tablename,backupSubFolder,str(int(todayTimeStamp)*1000)
print cmd
os.system(cmd)
而Restore機(jī)制就更加簡單
hbase org.apache.Hadoop.hbase.mapreduce.Import tablename restorefolder
要注意的是,做Restore時(shí)候,原始的表必須是創(chuàng)建好的。所以如果表本身被損壞,需要重新創(chuàng)建一個(gè)新的空表,再做Restore。
還有,必須在Hadoop-env.sh中配置好hbase和Zookeeper的路徑,加上這樣的語句
export Hadoop_CLASSPATH="/usr/lib/hadoop-hbase/hbaseXXX.jar:/usr/lib/hadoop-hbase/lib/zookeeperXXX.jar:/etc/hadoop-hbase/conf"
把這個(gè)加到crontab里面,就可以實(shí)現(xiàn)每天定時(shí)備份了。 本文出自:億恩科技【mszdt.com】
服務(wù)器租用/服務(wù)器托管中國五強(qiáng)!虛擬主機(jī)域名注冊頂級(jí)提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM]
|