光纖通道交換機需要彼此通信、合作,以管理整個網絡。要保證
交換機彼此通信良好,最佳方法是從三家最頂尖的交換機供應商
中挑選一家,然后選擇其產品:博科、思科以及QLogic公司。
“(交換機之間的)通信需遵循標準,但對于構建SAN所需的功能而
言,這種標準相對疲軟,而且并不常見。” Gartner分析師Rober
t Passmore說,“所有的交換機供應商都擁有一組專屬的強健的
管理功能。”
下文分類列舉了光纖通道交換環境普遍適用的最佳策略。
規劃的注意事項
根據你未來三年的需要規劃SAN。
根據過去兩年使用的應用程序、物理服務器以及存儲數量,規劃你未來的需求。考慮可能部署哪些新技
術,如虛擬服務器。認真思考不同的組件會對總體環境產生什么影響。
“無論你在未來三年有什么需要,都將這種需要擴大一倍,并按這個目標構建。” Dragon Slayer Consul
ting總裁Marc Staimer說:“這么做花費增加了,但是會讓你今后的生活簡單得多。”
沒有事先規劃SAN就好比“一個巨大的噩夢”,Staimer指出“規劃越充分,返工就越少”。
判斷應用程序的吞吐量和I/O,從而設計SAN環境的規模,這么做能取得最佳效果。
惠普公司多供應商系統工程團隊的高級SAN系統工程師Dan Iacono認為,大多數用戶并不了解應用程序的吞
吐量和I/O。Unix和Windows內置的性能工具,或者由網絡、SAN、存儲供應商提供的性能工具都能幫助計算
吞吐量和I/O。
了解應用程序及其吞吐量,有助于判斷哪種端口(超額認購或完全吞吐量)最為合適,以及如何設計SAN能最
有效地利用網絡帶寬。許多用戶選擇核心/邊緣設計,邊緣采用16口或32口交換機,通過交換機內鏈路(IS
L)接入更大的導向器級交換機。
Iacono說:“你需要了解邊緣交換機的吞吐量,從而通過適量的ISL連入導向器中。”減少ISL的數量,可
以釋放交換機的端口,從而將更多的資金投入SAN。
擁有成熟SAN的公司可能會發現,他們需要將邊緣交換機中高吞吐量的應用程序直接連入導向器,從而減少
中轉,讓程序和存儲近距離接觸。
不要害怕超額認購。
大多數服務器并不需要光纖通道交換機的全部網絡帶寬,因此,超額認購或者分配的存儲超過交換機的處
理能力都是十分常見的策略,因為從統計學上來講,不可能同時需要所有存儲。
Howard Goldstein Associates的總裁Howard Goldstein依然認為管理員“容易變得非常保守,其實大可不
必”。他還指出,在大多數SAN環境中,“你僅使用了交換機端口的十分之一容量”。
事先評價電力消耗和降溫需求。
技術供應商經常將產品整合為盡可能小的軟件包,但是客戶站點可能無法處理。博科公司數據中心基礎設
施分類部的產品銷售主管Mario Blandini認為,大多數提議都會面臨電力消耗的問題。
“究竟多少IT環境不再需要額外的電力容量,你可能會很好奇。” Blandini說,“大多數(醫院或大學)的
建筑物都是在75年甚至100-200年之前建立的。這些建筑物在設計電耗時,可能從來沒有想到19平方英寸的
空間需要消耗10,000 W的電力。”
建立兩個獨立的光纖通道網絡,實現冗余
SAN需要一周七天、一天二十四小時都在運行。SAN支持的服務器數量越多,故障引起的后果越嚴重。為了
保證SAN不發生故障,服務器和存儲的連接需要兩條路徑。
如果一條路徑——采用HBA、交換機、電纜、端口等——發生故障,另一條路徑就能讓程序繼續與其存儲通
信。這么做還有一個好處,SAN在運行時就能實現升級。
“光纖通道這項技術可能引起破壞。” Staimer說,“無論你改變或者添加了任何東西,或者對系統完成
了任何工作,都可能破壞當時正在使用系統的應用程序。因此,最好是在一個網絡中實現變更,在另一個
網絡運行程序。具有兩個網絡時,損失最小。”
管理:技術方面
安裝路徑管理軟件,當一條路徑失效時,自動將I/O請求切換到另一條路徑。
一些操作系統環境能提供基本性能。Passmore說,一些存儲供應商擁有自己的路徑管理軟件,費用相對較
高,但由于還能實現其它功能,因此還是物有所值。
設置、調整并監測硬件和性能警告。
惠普公司的Iacono記得有一家大型的咨詢公司,每天接到6000條警告,卻置之不理。而一家交換機供應商
在SAN遭遇0 MBps時,采用缺省警告加以終止。這樣可能會導致每天收到上千封郵件。
他說:“你需要關閉缺省警告。”
但是,即使是少量的硬件位級錯誤也應該引起重視,因為這可能是錯誤發生的前兆。“大約95%的SAN錯
誤,我們都能事先得到警告,但是沒有解決警告。” Iacono說,“如果你得到的警告太多,可能就需要調
整警告環境,去除錯誤的設置,或者可能真的存在急需解決的問題。”
將SAN的設置信息備份到硬盤中,而不是SAN中。
SAN一般不會發生錯誤,但是一旦發生錯誤,問題就嚴重了。如果將SAN文檔備份到與網絡驅動相連的服務
器中,而驅動又在SAN中,那么存儲團隊就會丟失恢復系統所需的信息。
Iacono說:“我可以告訴你,《財富》50強公司也這么做,真是令人吃驚。”
許多公司甚至沒有更新SAN文檔。他們通常從Excel線程開始工作,出發點很好,但是幾乎從不更新,因為
面臨著更加緊迫的任務。
“如果讓他們檢查故障,他們甚至不知道哪些信息與哪些端口相連。” Iacono說,“每個人都會涉及此類
文檔,但是50%到70%的文檔都沒有及時更新。”
管理:人事方面
雇傭專業的存儲團隊和完善的變更管理程序。
SAN出現問題,通常是由于人為錯誤。嚴格的變更管理策略能夠降低錯誤發生率。同理,專業的存儲團隊能
積極管理系統,減少錯誤率。
服務器管理員需要與存儲團隊交流、協調需求,因為存儲是由存儲團隊設計完成的。一位存儲專家記下流
程步驟和設置說明,包括存儲陣列和交換機的任務。理想情況下,另一位存儲專家會審核變更設計,從而
保證質量。
Gartner的Passmore認為:“實際上,遵循這些規則的公司多年來一直在 SAN領域取得成功。”
為訪問SAN的每位管理員和第三方咨詢師設置獨立的用戶帳戶和密碼。
Iacono說,很多情況下,管理員在調整新交換機的參數后沒有轉告同事。他發現同一臺交換機擁有不同的
配置,詢問發生了什么情況,通常會聽到這種回答“Joe是這么做的,而Steve是那么做的”。
Iacono認為:“一旦明確了職能,這些問題就不復存在。我們希望能夠審計所有的過程。”
IT團隊不僅能夠明確問題來源,而且當SAN管理人員離開公司時,不必重置通用密碼。
完成LUN掩碼和綁定的同時創建區域。
為新服務器創建存儲時,可以利用工具建立存儲卷,分配地址或SCSI LUN。如果某些實體不具有LUN,LUN
掩碼就會將LUN隱藏,LUN綁定只是將LUN附屬到服務器中HBA的全局ID中。
完成LUN掩碼和綁定的同時,存儲專家應該深入交換機,創建區域,而且只允許專門的適配器與特定的存儲
端口實現通信。
“實際上,交換機通過分區可以強化LUN的掩碼和綁定。” Passmore說,“進一步而言,可以設計與服務
器通信的端口交換機,從而檢查全局ID,在存儲陣列中強化LUN的掩碼和綁定。”
使用安全外殼(SSH)協議訪問SAN。
如果管理員使用Telnet協議登錄SAN交換機,密碼其實沒有受到保護,可能會面臨攔截的文獻。SSH能提供
安全通道。
“采用SSH,一切都受到保護。” Iacono說,“如果你管理的是Windows或Unix環境,這就是一項基本標
準,但是處于某些原因,沒有人對SAN環境使用SSH。”
虛擬服務器
保證服務器內外流入交換機和指定目標的網絡帶寬足以適應環境。
如果服務器沒有得到充分利用,但又運行了虛擬機中多個應用程序的工作負荷,那么網絡帶寬的需求就會
逐步擴大。用戶在設計SAN時需謹記這一點。
“去年,典型的x86服務器經常需要處理每秒一千多兆的吞吐量。”Staimer指出,“當前的x86服務器一般
都屬于四核,如果應用程序允許的話,很容易就能達到10 GB。如果你同時運行20個程序,就會達到10 G
B。而以前的服務器之所以沒有達到10 GB,是因為一個程序無法完成。”
保證擁有虛擬機的物理服務器位于同一區域。
管理員可以利用虛擬服務器技術在無需停機的情況下,將應用程序從一臺物理服務器轉移到另一臺物理服
務器,但是這些物理服務器需要位于同一光纖通道區域,才能訪問存儲。
Staimer說:“應用程序無法找到存儲,為什么呢?因為程序崩潰了!”
利用支持N_Port ID虛擬化(NPIV)的交換機和HBA。
如果一臺物理服務器中運行了五臺虛擬機,NPIV就會允許每臺虛擬機各自獲得一個獨特的HBA標識符,具有
NPIV功能的交換機能夠識別這些獨特的ID。這就意味著每臺虛擬機都能訪問各自的LUN。
如果設備不具備NPIV功能,物理服務器就只能得到一個端口ID。
新型交換機和HBA都支持NPIV,但是使用遺留硬件的人員可能需要檢查供應商如何更新固件。NPIV處理刀片
服務器的方式與其處理虛擬服務器的方式非常相似。