SUM服務器監控軟件監控磁盤SMART信息

S.M.A.R.T.,全稱為“Self-Monitoring Analysis and Reporting Technology”,即“自我監測、分析及報告技術”。是一種自動的硬盤狀態檢測與預警系統和規范。通過在硬盤硬件內的檢測指令對硬盤的硬件如磁頭、盤片、馬達、電路的運行情況進行監控、記錄并與廠商所設定的預設安全值進行比較,若監控情況將或已超出預設安全值的安全范圍,就可以通過主機的監控硬件或軟件自動向用戶作出警告并進行輕微的自動修復,以提前保障硬盤數據的安全。除一些出廠時間極早的硬盤外,現在大部分硬盤均配備該項技術。
哲濤SUM服務器監控軟件對ATA磁盤的SMART可以全面監控和自主分析,主要監控磁道錯誤、磁盤穩定性、預測性錯誤、重定位扇區(常發生重定位扇區則說明磁盤即將損壞)、磁盤溫度等。

磁盤SMART監控

磁盤SMART溫度監控

歷史

最早期的硬盤監控技術起源于1992年IBM在為AS/400計算機的IBM9337硬盤陣列中的IBM 0662 SCSI2代硬盤驅動器之中,后來該技術被命名為Predictive Failure Analysis(故障預警分析技術),它是通過在固件中測量幾個重要的硬盤安全參數和評估他們的情況。從物理硬盤發送到監控軟件的結果中被限定兩種結果:“硬盤安全”和“硬盤不久后會發生故障”。

不久,由微機制造商Compaq和硬盤制造商Seagate、QuantumConner提出了名為IntelliSafe的類似技術。通過該技術,硬盤會測量自身的的健康指標并將參量值傳送給操作系統和用戶的監控軟件中,每個硬盤生產商有權決定哪些指標需要被監控和它們的安全閾值。

Compaq于1995早期將該項技術方案提交到Small Form Factor委員會進行標準化,該方案得到IBM、Seagate、Quantum、ConnerWestern Digital所支持。由于IntelliSafe技術的靈活性,委員會接受了該方案,并正式更名S.M.A.R.T.技術,將其標準化并推廣至ATA-3行業標準中。

運作原理

該技術所需數據被存放在硬盤物理盤面最前面的磁道中,由硬盤制作商將相關管理程序和數據該磁道中,包括加解密程序,自監控程序,自修復程序等,主機的監控軟件可以通過“SMART RETURN STATUS”的命令讀取S.M.A.R.T.信息,且這些信息不允許被用戶修改。

檢測屬性

下面將列出一些S.M.A.R.T.的原始檢測屬性和含義。普遍為檢測值越高性能越好。即使所有制造商都必須遵守共同的規則,但由于有些檢測值在不同硬盤制造商中用不全相同的定義和計量方法而對于不同制作商來說檢測值不全是越高越好,所以下面屬性的指標只作一般參考。除外,各制造商也會根據自己需要添加一些自己專有的檢測屬性

說明
Dark Green Arrow Up.svg
表示數值越高越好
Dark Green Arrow Down.svg
表示數值越低越好
重要項:粉色底當超出安全范圍會對性能嚴重影響
IDID十六進制值英文名中文譯名最優說明
10x01read error rate底層數據讀取錯誤率
Dark Green Arrow Down.svg
存儲器從一個硬盤表面讀取數據時發生的錯誤率。原始值由于不同廠商的不同計算方法而有所不同,其十進制值往往無意義的。一般來說有數值意味著磁頭已出現問題了。
20x02Throughput Performance讀寫通量性能
Dark Green Arrow Up.svg
通常是硬盤讀寫性能的測量值,如果其值有變動,有可能硬盤出現了問題。
30x03Spin-Up Time盤片啟動時間
Dark Green Arrow Down.svg
盤片由靜止啟動加速到穩定正常運行速度的平均所需時間。
40x04Start/Stop Count電機起停次計數
Dark Green Arrow Down.svg
一個盤片啟動關閉周期的統計值,只有硬盤從完全斷電中啟動或從睡眠模式恢復,盤片主軸電機被啟動時才會記一次數。
50x05Reallocated Sector Count重定位磁區計數
Dark Green Arrow Down.svg
記錄由于損壞而被映射到無損的后備區的扇區計數。當硬盤出現損壞扇區時,可以通過將其物理空間指向到特定的無損區域進行重映射修復,從而出現壞扇區的硬盤仍可使用。但當高過一定數值后,后扇區消耗殆盡而無法再重映射修復時,這些壞扇區就會顯現出來且無法自行修復。除外由于要要求磁頭讀取這些壞扇區時專門再移動到后備區讀寫數據,對硬盤讀寫性能也有影響。
60x06Read Channel Margin信道讀取余量讀取數據時信道可用的余量,該屬性沒制定任何功用。
70x07Seek Error Rate尋道錯誤率(該屬性是特定制造商才有的)磁頭尋找磁道由于機械問題而出錯幾率,有多種原因可能引致出錯,如:磁頭伺服構件,盤體過熱,或損壞。于不同廠商的不同計算方法而有所不同,其十進制值往往無意義的。
80x08Seek Time Performance尋道性能
Dark Green Arrow Up.svg
每次尋道時間的平均值,該值短期內迅速減少,有可能硬盤出現了問題。
90x09Power-On Hours硬盤加電時間
Dark Green Arrow Down.svg
硬盤自出廠以來加電啟動的統計時間,單位為小時(或根據制造商設定為分鐘或秒),一般用戶以該值判定硬盤是否被使用過。
100x0aSpin Retry Count電機起轉重試
Dark Green Arrow Down.svg
S.M.A.R.T參數電機起轉重試,表明了主軸電機的啟動嘗試次數。這個屬性存儲了關于主軸電機嘗試加速到完全可操作速度的次數(在這種情況下,意味著主軸電機的第一次啟動嘗試沒有成功)。主軸電機頻繁的嘗試啟動,意味著硬盤驅動器的壽命可能將近實際限值。
110x0bRecalibration Retries磁頭校準重試
Dark Green Arrow Down.svg
磁頭在一次運行失敗時嘗試校準至正常狀態的統計數,該值改變時意味著硬盤的機械部件已經出現問題了。
120x0cPower Cycle Count設備開關計數該屬性表示硬盤電源充分開/關循環計數。
130x0dSoft Read Error Rate軟件讀取錯誤率
Dark Green Arrow Down.svg
操作系統讀取數據時的出錯率。
1830xb7SATA Downshift Error CountSATA降級運行計數Western Digital 和 Samsung 特有屬性,記錄由于兼容問題導致降低SATA傳輸級別運行的計數。
1840xb8End-to-End error終端校驗出錯
Dark Green Arrow Down.svg
HP專有S.M.A.R.T.(SMART IV)技術的一個特有屬性,記錄硬盤從盤片讀取數據到高速緩存后再傳輸到主機時數據校驗出錯的次數。
1850xb9Head Stability磁頭穩定性Western Digital特有屬性
1860xbaInduced Op-Vibration DetectionWestern Digital特有屬性
1870xbbReported Uncorrectable Errors報告不可糾正錯誤
Dark Green Arrow Down.svg
硬件ECC無法恢復的錯誤計數。
1880xbcCommand Timeout通信超時
Dark Green Arrow Down.svg
由于無法連接至硬盤而終止操作的統計數,一般為0,如果遠超過0,則可能電源問題,數據線接口氧化或更嚴重的問題。
1890xbdHigh Fly Writes磁頭寫入高度
Dark Green Arrow Down.svg
硬盤進行寫入時對磁頭高度進行監控以提供額外的保障。當磁頭處于不正常高度進行寫入時,寫入操作會被終止,原有數據重寫入或者將該扇區重映射到安全區域。該屬性是統計值。
1900xbeAirflow Temperature氣流溫度
Dark Green Arrow Down.svg
Western Digital特有屬性,計量硬盤內氣流溫度,和檢測項0xc2相似。
1910xbfG-sense Error Rate加速度錯誤率
Dark Green Arrow Down.svg
計量可能對硬盤做成損害的沖擊次數。
1920xc0Power-off Retract Count電源關閉磁頭收回計數
Dark Green Arrow Down.svg
計量磁頭在沒有加電時不移進硬盤的值。
1930xc1Load Cycle Count磁頭升降計數
Dark Green Arrow Down.svg
計量磁頭在加電時移進/移出硬盤周期的值。
1940xc2Temperature溫度
Dark Green Arrow Down.svg
計量硬盤的溫度
1950xc3Hardware ECC Recovered硬件ECC恢復(特定原始值)
1960xc4Reallocation Event Count重定位事件計數
Dark Green Arrow Down.svg
記錄已重映射扇區和可能重映射扇區的事件計數。
1970xc5Current Pending Sector Count等候重定的扇區計數
Dark Green Arrow Down.svg
記錄了不穩定的扇區的數量。
1980xc6Uncorrectable Sector Count無法校正的扇區計數
Dark Green Arrow Down.svg
記錄肯定出錯的扇區數量。
1990xc7UltraDMA CRC Error CountUltraDMA通訊CRC錯誤
Dark Green Arrow Down.svg
記錄硬盤通訊時發生的CRC錯誤。
2000xc8Multi-Zone Error Rate多區域錯誤率
Dark Green Arrow Down.svg
寫入一個區域時發現的錯誤的計數。
2000xc8Write Error Rate寫入錯誤率
Dark Green Arrow Down.svg
Fujitsu的特別屬性,寫入一個區域時發現的錯誤的計數。
2010xc9Soft Read Error Rate邏輯讀取錯誤率
Dark Green Arrow Down.svg
記錄脫軌錯誤。
2020xcaData Address Mark errors數據地址標記錯誤
Dark Green Arrow Down.svg
記錄數據地址標記錯誤(或制造商特定的計數)
2030xcbRun Out Cancel用完取消
Dark Green Arrow Down.svg
ECC錯誤計數
2040xccSoft ECC Correction邏輯ECC糾正
Dark Green Arrow Down.svg
記錄由軟件ECC更正的錯誤計數。
2050xcdThermal Asperity Rate熱嘈率
Dark Green Arrow Down.svg
記錄高溫導致的出錯記數。
2060xceFlying Height飛行高度記錄磁頭的飛行高度。飛得太低會增加磁頭撞毀的機會,飛得太高增加讀寫錯誤的機會。
2070xcfSpin High Current主軸電機浪涌電流計數
Dark Green Arrow Down.svg
記錄主軸電機運轉時浪涌電流的次數。
2080xd0Spin Buzz記錄由于電力不足而啟動主軸電機的蜂鳴聲次數。
2090xd1Offline Seek Performance離線尋址性能在其內部測試硬盤的尋址能力表現。
2100xd2??(沒定性,出現在Maxtor 6B200M0 200GB 和Maxtor 2R015H1 15GB 的硬盤中)
2110xd3Vibration During Write寫操作震動記錄寫入操作的震動數。
2120xd4Shock During Write寫操作沖擊記錄寫入操作時的沖擊數。
2200xdcDisk Shift盤體偏移
Dark Green Arrow Down.svg
記錄盤體由于沖擊或溫度導致偏離主軸的相對距離。
2210xddG-Sense Error Rate加速計出錯率
Dark Green Arrow Down.svg
從外部誘發的沖擊和振動產生的錯誤計數。
2220xdeLoaded Hours數據加載時間數據讀取時所花費的時間。(磁頭移動時間)
2230xdfLoad/Unload Retry Count加載/卸載重試次數磁頭改變位置時所需時間。
2240xe0Load Friction負載摩擦
Dark Green Arrow Down.svg
讀寫時由于機械摩擦做成的阻力。
2250xe1Load/Unload Cycle Count加載/卸載循環計數
Dark Green Arrow Down.svg
總負載周期計數。
2260xe2Load 'In'-time磁頭磁頭加載所需總時間(不包括在停泊區的花費)。
2270xe3Torque Amplification Count扭矩放大計數
Dark Green Arrow Down.svg
嘗試來補償盤片的速度變化的計數。
2280xe4Power-Off Retract Cycle斷電縮回周期
Dark Green Arrow Down.svg
切斷電源后電磁樞自動縮回的時間計數。
2300xe6GMR Head AmplitudeGMR磁頭振幅磁頭振幅計數(磁頭反復正反向運動距離)。
2310xe7Temperature硬盤溫度
Dark Green Arrow Down.svg
記錄硬盤溫度。
2320xe8Endurance Remaining耐久性剩余磁盤可使用周期與設計可使用周期的百分比。
2320xe8Available Reserved Space可用保留空間Intel固態硬盤報告的可提供的預留空間占作為一支全新的固態硬盤預留空間的百分比。
2330xe9Power-On Hours加電時間處于開機狀態的小時數。
2330xe9Media Wearout Indicator介質耗損指標Intel固態硬盤報告的NAND刷寫壽命,全新時值為100,最低值為1,其跌幅隨NAND的擦除周期增加而在0到最大額定周期范圍減少。
2400xf0Head Flying Hours磁頭飛行時間磁頭處于定位中的時間。
2400xf0Transfer Error Rate傳輸錯誤率在數據傳輸時連接被重置的次數計數。(Fujitsu特有屬性)
2410xf1Total LBAs WrittenLBA寫入總數LBA寫入總數計數。
2420xf2Total LBAs ReadLBA讀取總數LBA讀取總數計數,部分S.M.A.R.T.檢測程序會把原始值顯示為負數,這是因為該原始值為48位,而不是32位的。
2500xfaRead Error Retry Rate讀取錯誤重試率
Dark Green Arrow Down.svg
從磁盤讀取時的錯誤計數。
2540xfeFree Fall Protection自由跌落保護
Dark Green Arrow Down.svg
對“自由落體事件”檢測計數。

在非ATA平臺上的實現

SCSI

硬盤的傳輸端口平臺主要分為ATA和SCSI兩個平臺。作為一種硬盤的檢測技術,理論上都能在兩個平臺上實現的,但由于兩個平臺也存在巨大的不同,S.M.A.R.T.在SCSI上的實現和在ATA的實現上也有所不同。首先,作為ATA上的專有規范,S.M.A.R.T.對ATA系統的干預要比SCSI更明顯,S.M.A.R.T.對SCSI更多是起到檢測的作用,即使在檢測到磁盤有故障時,其只是報告監控端,要人為地處理故障。其次,由于SCSI平臺的硬盤比ATA的更為復雜,所以其檢測屬性也比ATA的多和復雜準確,如包括對盤片和驅動電路版的溫度檢測(ATA多只對盤片溫度檢測),對電壓的檢測等。

USB

USB標準中,USB不能用于計算機內部儲存設備的基本總線(如ATA,SCSI等),其本身沒有為S.M.A.R.T.提供傳輸數據的途徑。在使用ATA硬盤,以USB為傳輸端口的移動硬盤中,即使硬盤內S.M.A.R.T.仍然運作,但沒辦法直接向系統提供S.M.A.R.T.的數據?,F在新的移動硬盤的內部驅動轉換電路已經能以一些方法將硬盤內S.M.A.R.T.的數據通過USB傳輸到系統或監控程序中讀取。

S.M.A.R.T(Self Monitoring Analysis and Reporting Technology /自我監測、分析與報告技術)是為了提高硬盤數據的安全性而開發的。它可以使硬盤實時檢查自身的狀態,通過一定機理及時分析出潛在的問題,報告給系統,有時甚至能給出預計的硬盤故障日期,實際就是一種預警技術。這個功能可以比較客觀的反映硬盤目前的健康狀況。

Value/Current(當前值) 當前硬盤改屬性的值。
Worst(最壞值) 該屬性出現過的峰值。
Threshold/Warn(閾值/臨界/極限值) 硬盤廠商所規定的該屬性峰值。如果某個屬性超過Threshold規定的極限值時,就表示你的硬盤可能出現了問題。
Raw Values/Data (Raw值/數據) 。和該屬性有關聯的數據總值。

怎么看這類屬性?
主要是看Raw和Worst的值是否還在臨界值之內(>或<臨界值)
一般使用軟件如HDTune、CrystalDiskInfo等,一般屬性中有黃色或者紅色你就要注意了,硬盤可能快壞了,要是還在保修期內,就趕緊備份數據,送去檢修。
下面我們來介紹各個屬性(按2010年2月11日 維基百科 上的解釋)
ID Hex =英文屬性名 / 中文屬性名 屬性描述
--------------------------------------------------
01 01 =Read Error Rate / (底層)數據讀取錯誤率
指從磁盤表面讀取數據時發生的硬件讀取錯誤的比率,Raw值對于不同的廠商有著不同的體系,單純看做1個十進制數字是沒有任何意義的。
*以上為Wiki上的英文翻譯版本,此屬性貌似存在分歧,有的說值高了好,有的說低了好,此處我們還是按照Wiki上的吧,反正只要 Worst不小于 Threshold 就行了。
**這里的Raw值也可能不同,比如我筆記本上的ST硬盤就Raw為0,而臺式機上1.5T的ST就為227901540。

02 02 =Throughput Performance / 吞吐性能(讀寫通量性能)
Raw值越高越好
整體(普通)的硬盤驅動器的吞吐性能。如果這個屬性的值一直在下降有很大的可能性是硬盤有問題了。
* 一般在進行了人工 Offline S.M.A.R.T. 測試以后才會有值。

03 03 =Spin-Up Time / 馬達旋轉到標準轉速所需時間
Raw值越低越好
主軸旋轉加速的平均時間(從零轉速到完全運轉(標準轉速)[毫秒])。
單位也可能為秒。
如果是0的話證明這一項沒有讀對,或者是這一項的數據生成錯誤。不應該出現0的結果。

04 04 =Start/Stop Count / 啟動/停止計數
馬達 啟動/停止 周期的計數。當馬達啟動或硬盤完全停止工作后(斷開電源)啟動和硬盤從睡眠模式回復到先前狀態,計數都會增加。
*一般來說開機一次這個就加1,也可以看做是通電次數,這一般是個壽命參考值,本身不具有任何指標性,購買硬盤時可以參考此值。

05 05 =Reallocated Sectors Count / 重新配扇區的計數
Raw值越低越好
對重新分配的扇區的計數,當硬盤發現一個 讀取/寫入/校驗 錯誤時它將這個扇區標示為“重新分配”,并且將數據傳輸到一個特殊的保留區(空閑區)。這個過程也稱為是“重定向”,這個重新分配的扇區叫做“重新映射”。這就是為什么,現在的硬盤當進行表面測試的時候是找不到“壞塊”的,所有的壞塊都被隱藏在重新分配的扇區中。然而,隨著重新定位的扇區增加,讀取/寫入速度趨向于降低。Raw值通常代表一系列已經發現和重映射的壞扇區,因此,這個屬性值越高,硬盤就有越多的扇區被重定位,所以這個值是越小越好。
* 理想情況下這個值應該為0,如果不為0也不要太驚慌,而是應該比較密切的關注這個值的變化情況:如果連續幾周沒有變化,那你應該可以放心的繼續使用比較長的一段時間;如果這個值持續攀升,那么請盡快備份所有數據,并考慮購買新硬盤。

06 06 =Read ***nel Margin / 讀取通道邊界
讀取數據時通道的邊界,這個屬性的功能并不明確

07 07 =Seek Error Rate / 尋道錯誤率
磁頭尋道錯誤的比率,如果機械定位系統中有局部的故障,那么尋道錯誤率會增加,這種故障是多種因素造成的。Raw值對于不同的廠商有著不同的體系,單純看做1個十進制數字是沒有任何意義的

08 08 =Seek Time Performance / 尋道時間性能
Raw值越高越好
磁頭尋道操作的平均性能,如果這個屬性的值持續下降,這是機械子系統有問題的標志

09 09 =Power-On Hours (POH) / 累計通電時間
Raw值越低越好
通電時間計數,Raw值顯示在通電狀態下的總小時數(或者是 分鐘,秒,取決于制造商)
磁盤加電時間。初始值的字段顯示為此裝置總開機時間的累計。
* 參考磁盤廠家給的該款硬盤的 MTBF(平均故障間隔時間) 可以估計故障概率。但是也有可能超過MTBF而不會出現故障,因為統計數據對于個體來說是不精確的,是一個壽命參考值,本身不具任何指標性。
**購買硬盤時可以看此值,新的硬盤一般為0或者幾十以內,過分大的可能就是被人用過了。

10 0A =Spin Retry Count 或 Spin-up Retry Count / 旋轉重試計數 或 馬達重試計數
Raw值越低越好
馬達重試啟動嘗試的的總數,這個屬性存儲馬達嘗試啟動的到全速運轉(第一次嘗試失敗的情況)的總數,這個屬性的值的上升,是硬盤機械子系統有問題的標志
* 理想情況應該為0,在某些情況下可能人為造成這個值的非故障升高,比如電壓供給不足。

11 0B =Recalibration Retries / 校準重試
Calibration_Retry_Count / 校準重試計數 
Raw值越低越好
這個屬性指被要求重新校驗的次數(第一次嘗試失敗的情況下)。這個屬性的值的上升,是硬盤機械子系統有問題的標志

12 0C =Power Cycle Count / 通電周期計數
這個屬性是指這個硬盤電源 開/關 周期的總數。
這是個壽命參考值,本身不具任何指標性。

13 0D =Soft Read Error Rate / 軟件讀出誤碼率(可校正讀出誤碼率)
Raw值越低越好
報告給操作系統的未修正的讀取錯誤。
高值暗示有扇區不穩定。

183 B7 =SATA Downshift Error Count / SATA 降檔錯誤計數
西部數據和三星的屬性。

184 B8 =End-to-End error / 端對端錯誤
Raw值越低越好
這個屬性是HP的SMART IV技術的一部分,它表示傳輸通過高速緩存內存數據緩沖區后主機和硬盤驅動器間的校驗數據不匹配。

185 B9 =Head Stability / 頭穩定性
西部數據的屬性。

186 BA =Induced Op-Vibration Detection / 感應運算振動檢測
西部數據的屬性。

187 BB =Reported Uncorrectable Errors / 反饋無法校正的錯誤
Raw值越低越好
不能使用硬件ECC恢復的錯誤總數。

188 BC =Command Timeout / 命令超時
Raw值越低越好
因為HDD超時導致放棄操作的數量,通常情況下,這個屬性值應該等于0,如果這個只遠遠高于0,那么,很可能電源供應有很嚴重的問題,或者數據線被氧化。

189 BD =High Fly Writes / 高飛寫入
Raw值越低越好
HDD生產商實現 一個飛行高度監視器來嘗試對于檢測到記錄頭正在飛出它的正常操作范圍時的寫入操作提供額外的保護,如果發生不安全的飛行高度條件,寫入進程停止工作,信息將被重寫或者重定向到磁盤上一個安全的區域。這個顯示在硬盤生命周期內檢測到的這些錯誤的總數。這個特性實現在大多數現代的希捷驅動器和一些西部數據的驅動器中,西部數據驅動器開始于 WD企業級WDE18300和WDE9180 Ultra2 SCSI硬盤驅動器,它將被包含在未來所有西部數據企業級產品中。

190 BE =Airflow Temperature (WDC) / 氣流溫度(西部數據)
Raw值越低越好
西部數據硬盤上的氣流溫度(和[C2]的 Temperature 數值一樣,但是在有些型號上臂當前值會少50.此值已經廢棄了)。

190 BE =Temperature Difference from 100 / 從100開始的溫差
Raw值越高越好
值和 (100 – 溫度°C)相同, 允許制造商對于符合的最高溫度設置一個最小限制(可能是希捷專有?)。

191 BF =G-sense Error Rate / 加速度錯誤率 或 震動偵測錯誤率
Raw值越低越好
因外來的沖擊和震動導致的錯誤數。

192 C0 =Power-off Retract Count / 斷電磁頭縮回計數
Emergency Retract Cycle Count (Fujitsu) / 緊急回縮周期計數(富士通) 
Raw值越低越好
磁頭被載離媒體的次數計數。磁頭能在沒完全斷電的前縮回。
*這個屬性所顯示的數字表示這塊磁盤自動關機(突然斷電)的次數。

業務熱線電話:(+86)021-52765253 021-61172807      上海哲濤網絡科技有限公司版權所有 © 2005-2023       滬ICP備06058430-1號

滬公網安備 31011302000898號

校睿寶,培訓機構學員管理軟件,教師工資計算軟件,消課管理軟件!

手機智慧課堂答題,短信答題,微信答題!

數據備份軟件,文件數據備份軟件,文件備份軟件,B/S架構備份軟件,分布式計算機備份軟件!

点广告流量赚钱吗 配资炒股是不是不用自己的账号 极速6合平特一肖计划 在线配资推荐天牛宝配资靠谱 甘肃11选5专家预测 体育彩票玩法规则 辽宁11选五开奖结果 四川金7乐手机版 合肥定盘星配资公司 北京十一选五走势走 中国福利彩票福建快3