Linux集群技術的要點解析 |
發(fā)布時間: 2012/9/8 14:59:23 |
現(xiàn)在很多的企業(yè),網(wǎng)站都在應用Linux操作系統(tǒng),Linux的優(yōu)點使人們舍棄了微軟。今天就講講Linux集群技術,讓你更一步了解Linux,知道Linux集群技術強大功能。給你挑選系統(tǒng)起到參考的作用。 Linux競爭力很強的原因之一,是它可以運行于極為普及的PC機上,不需要購買昂貴的專用硬件設備。在幾臺運行Linux的PC機上,只要加入相應的集群軟件,就可以組成具有超強可靠性、負載能力和計算能力的Linux集群。集群中的每臺服務器稱為一個節(jié)點。 按照側(cè)重點的不同,可以把Linux集群分為三類。一類是高可用性集群,運行于兩個或多個節(jié)點上,目的是在系統(tǒng)出現(xiàn)某些故障的情況下,仍能繼續(xù)對外提供服務。高可用性集群的設計思想就是要最大限度地減少服務中斷時間。這類集群中比較著名的有Turbolinux TurboHA、Heartbeat、Kimberlite等。第二類是負載均衡集群,目的是提供和節(jié)點個數(shù)成正比的負載能力,這種集群很適合提供大訪問量的Web服務。負載均衡集群往往也具有一定的高可用性特點。Turbolinux Cluster Server、Linux Virtual Server都屬于負載均衡集群。另一類是超級計算集群,按照計算關聯(lián)程度的不同,又可以分為兩種。一種是任務片方式,要把計算任務分成任務片,再把任務片分配給各節(jié)點,在各節(jié)點上分別計算后再把結果匯總,生成最終計算結果。另一種是并行計算方式,節(jié)點之間在計算過程中大量地交換數(shù)據(jù),可以進行具有強耦合關系的計算。這兩種超級計算集群分別適用于不同類型的數(shù)據(jù)處理工作。有了超級計算集群軟件,企業(yè)利用若干臺PC機就可以完成通常只有超級計算機才能完成的計算任務。這類軟件有Turbolinux EnFusion、SCore等。 高可用性集群與負載均衡集群的工作原理不同,適用于不同類型的服務。通常,負載均衡集群適用于提供靜態(tài)數(shù)據(jù)的服務,如HTTP服務;而高可用性集群既適用于提供靜態(tài)數(shù)據(jù)的服務,如HTTP服務,又適用于提供動態(tài)數(shù)據(jù)的服務,如數(shù)據(jù)庫等。高可用性集群之所以能適用于提供動態(tài)數(shù)據(jù)的服務,是由于節(jié)點共享同一存儲介質(zhì),如RAIDBox.也就是說,在高可用性集群內(nèi),每種服務的用戶數(shù)據(jù)只有一份,存儲在共用存儲設備上,在任一時刻只有一個節(jié)點能讀寫這份數(shù)據(jù)。 以Turbolinux TurboHA為例,集群中有兩個節(jié)點A和B,設這個集群只提供Oracle服務,用戶數(shù)據(jù)存放于共用存儲設備的分區(qū)/dev/sdb3上。在正常狀態(tài)下,節(jié)點A提供Oracle數(shù)據(jù)庫服務,分區(qū)/dev/sdb3被節(jié)點A加載在/mnt/oracle上。當系統(tǒng)出現(xiàn)某種故障并被TurboHA軟件檢測到時,TurboHA會將Oracle服務停止,并把分區(qū)/dev/sdb3卸載。之后,節(jié)點B上的TurboHA軟件將在節(jié)點B上加載該分區(qū),并啟動 Oracle服務。對于Oracle服務有一個虛擬的IP地址,當Oracle服務從節(jié)點A切換到節(jié)點B上時,虛擬的IP地址也會隨之綁定到節(jié)點B上,因此用戶仍可訪問此服務。 由以上分析可以看出,高可用性集群對一種服務而言不具有負載均衡功能,它可以提高整個系統(tǒng)的可靠性,但不能增加負載的能力。當然,高可用性集群可以運行多種服務,并適當分配在不同節(jié)點上,比如節(jié)點A提供Oracle服務,同時節(jié)點B提供Sybase服務,這也可以看成是某種意義上的負載均衡,不過這是對多種服務的分配而言。 負載均衡集群適用于提供相對靜態(tài)的數(shù)據(jù)的服務,比如HTTP服務。因為通常負載均衡集群的各節(jié)點間通常沒有共用的存儲介質(zhì),用戶數(shù)據(jù)被復制成多份,存放于每一個提供該項服務的節(jié)點上。 下面以Turbolinux Cluster Server為例簡要介紹一下負載均衡集群的工作機制。在集群中有一個主控節(jié)點,稱為高級流量管理器(ATM)。假設這一集群僅被用來提供一項HTTP服務,其余各節(jié)點均被設定為HTTP的服務節(jié)點。用戶對于頁面的請求全部發(fā)送到ATM上,因為ATM上綁定了這項服務對外的IP地址。ATM把接受到的請求再平均發(fā)送到各服務節(jié)點上,服務節(jié)點接收到請求之后,直接把相應的Web頁面發(fā)送給用戶。這樣一來,假如在1秒內(nèi)有1000個HTTP頁面請求,而集群中有10個服務節(jié)點,則每個節(jié)點將處理100個請求。這樣,在外界看來,好象有一臺10倍速度的高速計算機在處理用戶的訪問。這也就是真正意義上的負載均衡。 但是ATM要處理所有1000個頁面請求,它會不會成為集群處理速度的瓶頸呢?由于對于頁面的請求的數(shù)據(jù)量相對較少,返回頁面內(nèi)容的數(shù)據(jù)量相對較大,因此這種方式還是很有效率的。ATM發(fā)生故障,也不會導致整個系統(tǒng)無法工作。Turbolinux Cluster Server可以設置一臺或多臺計算機為后備ATM節(jié)點,當主ATM節(jié)點故障時,在后備ATM中會產(chǎn)生出一個新的主ATM,接替它的工作?梢钥闯,這種負載均衡集群也具有一定的高可用性。 HTTP頁面相對是靜態(tài)的,但有時也需要改動。Turbolinux Cluster Server提供了數(shù)據(jù)同步工具,可以很方便的把對頁面的改動同步到所有提供該項服務的節(jié)點上。 下面介紹一下對于高可用性集群與負載均衡集群的組合使用。如果用戶有一個由兩個節(jié)點組成的最小集群,是否可以同時獲得高可用性集群和負載均衡集群的效益呢?答案是肯定的。由于高可用性集群適用于提供動態(tài)數(shù)據(jù)的服務,而負載均衡集群適用于提供靜態(tài)數(shù)據(jù)的服務,所以我們不妨假設要同時提供 Oracle和HTTP服務。用戶要在節(jié)點A和B上安裝TurbolinuxTurboHA和TurbolinuxClusterServer軟件。把節(jié)點A作為Oracle正常工作的節(jié)點,節(jié)點B作為Oracle服務的后備節(jié)點,這是對TurboHA軟件而言。對于ClusterServer軟件而言,要設置節(jié)點B為主ATM節(jié)點,節(jié)點A為后備ATM節(jié)點,而節(jié)點A和節(jié)點B同時又都是HTTP的服務節(jié)點。 這樣一來,節(jié)點A和節(jié)點B都是身兼兩職,而用戶同時得到了一個具有高可用性的Oracle服務和一個具有負載均衡功能的HTTP服務。即使有一個節(jié)點發(fā)生故障,Oracle服務和HTTP服務都不會因此而中斷。 但對于同一種服務,是不能同時獲得高可用性與負載均衡能力的。對一種服務,要么是只有一份數(shù)據(jù),放在共用存儲設備上,一次被一個節(jié)點訪問,獲得高可用性;要么是把數(shù)據(jù)復制為多份,存儲于每個節(jié)點的本地硬盤上,用戶的請求同時發(fā)送到多個節(jié)點上,獲得負載均衡能力。 對于高可用性集群,由于它在設計時的目的就是為了最大可能地減少服務中斷時間,因此服務的切換受到很大的關注。當一個節(jié)點上的服務故障時,會被很快地檢測到并被切換到其他節(jié)點上。但在切換時,不能忽略對數(shù)據(jù)完整性的保護。 在什么情況下數(shù)據(jù)完整性會被破壞呢?由于高可用性集群中至少有兩個節(jié)點,連接在一個共用的存儲設備上,對于非裸分區(qū)而言,如果被兩個節(jié)點同時讀寫,就會造成文件系統(tǒng)被破壞。因此就需要利用I/O屏障來防止這一事件的發(fā)生。 I/O屏障的目的是為了保證故障節(jié)點不能再繼續(xù)讀寫某一服務的共用分區(qū),實現(xiàn)的方式有多種。Kimberlite使用硬件開關來實現(xiàn),當一個節(jié)點發(fā)生故障時,另一節(jié)點如果能偵測到,就會通過串行口發(fā)出命令,控制連接在故障節(jié)點電源上的硬件開關,通過暫時斷電,而后又上電的方式使得故障節(jié)點被重啟動。 I/O屏障有多種形式。對于支持SCSI Reserve/Release命令的存儲設備,也可以用SG命令實現(xiàn)I/O屏障。正常節(jié)點應使用SCSI Reserve命令"鎖住"共用存儲設備,保證其不被故障節(jié)點讀寫。如果故障節(jié)點上的集群軟件仍在運行,如發(fā)現(xiàn)共用存儲設備已被對方鎖住,就應把自己重啟動,以恢復正常工作狀態(tài)。 以上介紹了Linux集群技術的基本原理,也介紹了幾種著名的軟件?傊,Linux集群技術最大的發(fā)揮了PC機和網(wǎng)絡的優(yōu)勢,可以帶來可觀的性能,是一種大有前途的技術。希望通過本文你進一步了解了Linux集群技術。 本文出自:億恩科技【mszdt.com】 |