- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
供電系統可靠性指標MTBF的定義,計算與比較
供電系統可靠性指標MTBF 的定義、計算與比較
摘 要
比較資料中心基礎設施系統時,平均故障間隔時間 MTBF 通常作為制定決策的關鍵依據。供應商提供的數值通常具有誤導性,使得用戶無法進行有效的比較。如果不瞭解或錯誤理解了這些數位背後隱含的可變因素和假設,難免做出錯誤的決定。本文通過明確的假設情況分析,來說明 MTBF 如何才能有效地用作系統規範和系統選擇的依據之一。
關鍵字:MTBF、定義、計算方法
簡介
避免資料中心和網路系統出現故障始終是頭等重要的任務。如果短時間的停機可能會對業務的市場價值產生負面影響,那麼,支援這個網路環境的物理基礎設施就一定要可靠。如何才能確信自己實施的解決方案是可靠的?MTBF(平均無故障工作時間) 是比較可靠性最常用的指標。不過,如果沒有透徹地瞭解 MTBF,可能就無法實現業務可靠性目標。如果故障定義不明確或者假設不現實或被曲解,MTBF 就毫無意義。
本文說明應如何使用 MTBF, 以及將 MTBF 用作規格和選擇依據時的限制。本文還提供一個核對表,作為確保公平有效地進行跨系統比較的指導性原則。
MTBF 的比較性分析--現場資料評估法
預測 MTBF 的方法有多種。由於有如此多種可用的方法,似乎不可能找到使用同一方法的兩個系統。不過,還是有一種方法可以適用於大多數系統的各種不同過程,即現場資料評估方法,此方法使用實際的現場故障資料,因此能夠提供比類比情況更準確的故障率評估。對於小批量生產的產品或新產品,此資料可能找不到;不過,對那些已在現場獲得廣泛應用的產品,由於有大量的資料,使用此方法就容易了。因此,對於跨系統比較,從現場資料評估開始比較是最合理也是最現實的。
本文還介紹了完成此方法的步驟,列舉並說明了各個步驟中可能影響結果的可變因素。如果要進行比較的系統間的關鍵假設或可變因素發生變化,那麼評估這些變化對 MTBF 估計結果的可能存在的影響就非常重要了。圖 1 說明現場資料評估過程的時間流程。隨後的過程步驟將說明這個時間流程中的每個階段。
第 1 步:定義並估計抽樣總體的大小
在確定年故障率 (AFR) 並最終確定產品的 MTBF 的過程中,第一步是確定要分析的特定產品抽樣總體。是基於特定產品型號還是整個產品系列進行計算?此抽樣總體中產品的生產時間跨度應該多大(以天或月計)?生產日期何時開始何時結束?為抽樣總體選擇的產品應該在設計方面非常相似,並具有足夠多的數量以保證所採集資料的統計有效性,這非常重要。
第 2 步:確定採集資料的樣本時間範圍
過程的第二步是確定從抽樣總體中採集故障資料的樣本時間範圍。通常在產品的用戶給供應商報告故障時採集資料。抽樣總體中產品的最晚生產日期和樣本開始日期之間的時間間隔,因產品、地理位置、分銷過程和庫存地點不同而有所差異。例如,如果產品在工廠倉庫中儲存兩個月,在分銷渠道中歷時兩個月,那麼最早只能在抽樣總體中最晚產品生產日期的四個月後開始進行抽樣。對於需要通過批發商、經銷商和零售商這些環節的產品,四個月被視為是考慮上述可變因素的合理時間範圍。
圖 1 – 現場資料評估過程
下面說明兩個重要的可變因素:(1) 抽樣總體中產品的最晚生產日期和樣本期間開始日期之間要有足夠的時間間隔 (2) 資料獲取窗口要足夠大,以確保結果的可信度。
如果抽樣總體中產品的最晚生產日期和樣本期間開始日期之間沒有足夠的時間間隔,那麼在抽樣總體中的產品得到完全部署之前可能就已經開始進行抽樣了。這種情況可能會造成兩種結果。第一,由於尚未部署的產品不可能出現故障,所以有低估故障率的傾向。第二種結果就是樣本期間很可能包括大量的安裝故障或設置故障。因為新產品的故障率可能會顯示為一個標準的“浴缸”型,所以包括大量安裝故障可能會導致高估故障率。儘管我們知道這兩種相反的效果都很明顯,但也不能指望他們能互相抵消。
在抽樣時間方面,另一個需要考慮的重要問題是視窗的持續時間。需要多少天才能充分採集故障資料?採樣時間視窗必須選得足夠寬,以便可以從樣本中移除統計“干擾”。獲得合理準確度所需的持續時間取決於抽樣總體的大小。例如,大批量產品可能需要一個月時間,小批量產品可能需要幾個月時間。
第 3步:定義故障
必須準確定義故障,確保評估過程的一致性後,才能開始統計故障。現在假設在“故障”產品返回工廠時,是由每個技術人員單獨定義故障。某位元技術人員可能只統計那些出現重大故障的產品,而另一位元技術人員可能統計所有出現了故障(包括重大故障)的產品。這兩種極端的做法使得準確評估特定產品故障率的可能性幾乎為零,當然更不能準確評估對該產品的程序控制所產生的影響。因此,在診斷任意產品之前,供應商必須對故障有一個明確的定義。在計算特定事件的 MTBF 時,供應商可能有多種不同的故障定義。例如,UPS 供應商會試圖評估導致關鍵
文档评论(0)