您的位置:首頁 >滾動 >

為什么企業依舊青睞HDD?

2024-12-06 11:38:25    來源:今日熱點網

據行業分析機構 Trendfocus發布的數據,2024年第一季度,全球機械硬盤(HDD)出貨量達2970萬塊,環比增長3%,出貨總容量達262EB,環比增長22%。面向企業存儲的HDD出貨量和出貨容量雙雙增長,其中出貨容量增幅高于出貨量的增幅,這表明HDD依然是企業容量需求型場景的主流選擇。

企業數據存儲大致可分為性能需求型和容量需求型兩大類場景,前者的典型代表是計算類應用,通常以512B、4K等小數據塊的隨機讀寫為主,關注點聚焦在IOPS性能;而容量需求型存儲則重點考量64K、128K及以上數據塊的順序讀寫性能(即帶寬,MB/s),典型應用場景包括關鍵業務數據備份、文件共享、日志存儲等,使用HDD為AI應用存儲海量訓練數據也是企業的主流選擇。

雖然SSD的順序讀寫性能高于HDD,但對于企業用戶來說,實際的使用需要結合各種綜合因素,除性能外,還有穩定性、可靠性、投入成本等多種因素。所以企業依然青睞使用HDD來滿足海量數據增長引發的存儲容量需求。而HDD是如何滿足企業應用所需的呢?

本文將基于東芝的MG10-D系列空氣封裝硬盤,從實際測試出發,分析HDD在企業存儲市場的優勢特點。

1

基準測試:

可預測的性能,簡化企業存儲復雜度

MG10-D系列是東芝最新發布的傳統磁記錄格式 (CMR) 空氣硬盤產品家族,有SATA和SAS兩種接口,容量從1TB到10TB。據東芝官網信息,MG10-D系列硬盤的性能和電源能效均有明顯提升,同時還提供即時清理擦除(SIE)和自加密驅動器(SED)等數據安全功能。本次測試用的HDD為3.5英寸外形規格的SATA接口硬盤,容量8TB。

為什么企業依舊青睞HDD?

圖1:用于本次測試的東芝MG10-D系列磁盤,容量8TB

為什么企業依舊青睞HDD?

圖2:硬盤背面

為什么企業依舊青睞HDD?

圖3:硬盤接口為SATA 3.0規格,最大速率6Gb/s

為什么企業依舊青睞HDD?

圖4:主軸電機,帶動內部盤片高速旋轉(7200轉/分鐘),并“托”起磁頭實現數據存取

為什么企業依舊青睞HDD?

圖5:主軸電機上方的通氣孔,用以保持內外部氣壓平衡,旁邊有英文提示“請勿遮擋”

基準性能測試的目的是用于評估HDD自身所能發揮出的性能,即 “裸盤性能”。根據海量文件存儲、數據備份、云歸檔等場景的數據存取特點,測試選擇用64K、128K及以上尺寸的數據塊,通過常用的硬盤基準性能測試工具Iometer下發順序讀寫負載來評估HDD的帶寬表現。圖6為東芝MG10-D系列8TB硬盤在128K數據塊下的順序讀寫性能。

為什么企業依舊青睞HDD?

圖6:東芝MG10-D系列8TB硬盤的128K順序讀寫性能

本節測試使用單一線程對東芝MG10-D系列8TB硬盤下發讀寫負載,從測試結果可以看出,在單線程、1隊列深度時,硬盤達到最大讀寫帶寬,均在290MB/s左右,此時的平均響應時間僅為0.46ms。

此測試結果表明了以下多層含義:

1、 順序讀寫性能均衡,不管是順序讀(綠色柱狀)還是順序寫(橙色柱狀),在不同隊列深度下的吞吐率都近乎相似,保持在290MB/s左右;

2、 在隊列深度為1時,硬盤已達到最大的讀寫帶寬290MB/s,應用體驗穩定流暢。

3、 在達到最大帶寬后,隨著負載(隊列深度)的增加,吞吐率保持平穩,響應時間隨負載的增加而增長,這表明即使在密集負載情況下,東芝MG10-D 8TB硬盤依然能夠發揮出最大帶寬性能,且保持平穩,具有很好的性能可預測性,以便企業存儲系統能更好地匹配業務需求。

值得注意的是,東芝官網公布的MG10-D系列HDD的順序讀寫帶寬為268MiB/s,為二進制。而本測試中的290MB/s使用十進制,換算成二進制大約為278MiB/s。

為什么企業依舊青睞HDD?

圖7:不同數據塊大小的順序讀寫性能(吞吐率與響應時間)

上圖7是東芝MG10-D系列8TB硬盤在使用64K、128K、256K、512K、1024K等不同大小數據塊下的順序讀寫帶寬和響應時間表現。其性能表現趨勢與上一測試結果近乎相似,在1隊列深度時可達到最大吞吐率,且隨著負載的繼續增加,吞吐率保持不變,響應時間隨數據塊大小而變化。

為什么企業依舊青睞HDD?

圖8:東芝MG10-D系列8TB硬盤穩定性測試結果

上圖8為128K數據塊在持續讀寫下的響應時間散布,在1分鐘持續的讀寫負載下發中,響應時間大多散布在0.4~0.5ms之間,只有極少數分散在0.5ms之外,但均未超過0.6ms,這從另一方面顯示了東芝MG10-D系列硬盤的性能穩定性與可預測性。

從基準測試的結果數據來看,東芝MG10-D系列8TB硬盤僅需單線程單隊列的情況下就能達到最大吞吐率,即使在密集讀寫負載情況下也能保持穩定的最大帶寬性能,所具備的性能可預測性,有助于企業用戶簡化存儲系統的優化與管理工作。

基準性能測試反映的是東芝8TB硬盤本身所能發揮的最大性能,并不代表其在實際應用中的性能表現。接下來進行的文件性能測試將展示東芝8TB硬盤的實際應用性能表現。

2

如何讓海量小文件存儲更有效率?

文件存儲是企業最常見的應用場景,典型如日志存儲、文件共享、云數據備份與歸檔等,隨著大數據分析技術的發展,海量文件存儲也逐漸成為企業的典型應用場景,尤其是近幾年掀起的又一輪AI狂潮,為AI模型訓練所需的海量數據提供存儲能力也是HDD的重要應用場景。

我們使用VDbench創建模擬企業實際數據環境,來測試東芝10-D系列8TB硬盤,評估在處理海量小文件場景下,硬盤的每秒文件讀寫數,每秒吞吐率,以及響應時間等多項表現。將東芝MG10-D系列8TB硬盤用作企業文件系統,并創建兩層目錄,每層10個目錄,在第二層的所有目錄中都創建2000個半/非結構化文件,總計20萬個文件(即2000x10x10)。在不同的測試環節,VDbench會重新生成不同大小的20萬個文件(如64K、128K、256K、512K、1024K),用以評估東芝MG10-D系列8TB硬盤在不同文件大小情況下的每秒文件讀寫數量和帶寬吞吐。

圖9展示的是64K、128K、256K及以上不同尺寸大小文件的順序讀取與寫入性能:

為什么企業依舊青睞HDD?

圖9:海量小文件的順序讀取/寫入性能測試結果

從上圖展示的測試結果來看,在64K和128K小文件測試中,MG10-D每秒可成功打開并傳輸的文件超1000個以上,隨著文件尺寸的增大,每秒文件傳輸數開始下降,帶寬則快速提升,在256K時達到最大帶寬171MB/s;之后隨著文件尺寸的增加,每秒文件傳輸數逐漸下降,帶寬隨之對應下降。

在文件順序寫入測試中(實際是重寫),64K文件每秒可寫入近950個,隨著文件尺寸的增大,每秒寫入數量逐步降低,寫入帶寬則隨之提高。在1MB文件時達到最大帶寬111MB/s。

在企業數據中心內,更多應用場景的數據傳輸特點是文件隨機讀寫,圖10展示的是不同尺寸大小文件的隨機讀取與寫入性能測試結果:

為什么企業依舊青睞HDD?

圖10:海量小文件隨機讀取/寫入性能測試結果

圖10測試結果顯示,在20萬小文件隨機讀取性能測試中,東芝MG10-D系列8TB硬盤在128K尺寸大小文件時,每秒成功打開并傳輸的文件數量最多,達到137個,對于HDD而言,這是一個極出色的性能成績。隨后,隨著文件尺寸的增大,每秒打開數量降低,但帶寬隨之提高,在1MB尺寸文件時獲得最大帶寬38MB/s。

同理,在隨機寫入測試中,東芝MG10-D系列8TB硬盤在64K尺寸文件獲得最大文件寫入數量——每秒寫入519個文件,隨著測試文件尺寸的增大,每秒寫入數量下降,但寫入帶寬逐漸上升,到1MB尺寸文件時獲得最大帶寬——97MB/s。

為何在文件性能測試中,隨機寫入性能遠超隨機讀取性能?這是因為在測試中啟用了硬盤寫入緩存(Write Cache)。通常情況下,為了防止突然掉電導致緩存數據丟失,硬盤中的寫入緩存大多處于關閉狀態。而在本次測試中之所以打開寫入緩存,這是因為東芝MG10-D系列硬盤中集成了持久寫入緩存技術,即使突然掉電,該技術也能保證硬盤緩存中的數據安全。并且,該系列硬盤緩存都為512MB,更大容量意味著可以緩存更多數據,也意味著更好的性能。

以上兩個測試結果顯示,東芝MG10-D系列8TB硬盤對文件隨機讀取的加速效果低于隨機寫入,這是因為測試數據全部都是重新寫入的新數據,沒有調用到讀緩存。而在文件隨機寫入測試中,下發的負載首先寫入硬盤的寫緩存(并經過排序),然后以類似順序寫入的方式寫入硬盤,從測試結果來看,其加速效果非常明顯,在64K文件大小時,每秒隨機寫入的文件數量約為順序寫入的55%,隨著文件尺寸的增大,加速效果越發明顯,在1MB文件大小時,隨機寫入帶寬接近順序寫入帶寬的90%(87%)。

在海量小文件存儲系統中,存儲的文件數量也會對文件讀寫性能帶來影響(其他配置不變的情況下),此測試將評估128K尺寸文件大小下,不同文件數量對讀寫性能帶來的影響,圖11為測試結果:

為什么企業依舊青睞HDD?

圖11:不同文件數量對存儲性能的影響

在文件隨機讀取測試中,隨著文件系統中文件數量的增加,每秒成功打開并傳輸的文件數量會隨之下降,在超過10萬個文件后,讀取性能趨于平緩,響應時間也維持穩定。而在文件隨機寫入測試中,由于寫入緩存的加速,雖然文件系統內文件數量顯著增加,但每秒成功寫入的文件數量依然平穩,響應時間也沒有很大起伏,得益于緩存顯著提升了企業文件系統的性能,尤其是寫入性能。

上述結果均基于單機環境下對單塊東芝MG10-D系列8TB硬盤進行測試獲得,在企業實際環境中,存儲系統通常有著數量多得多的硬盤。比如分布式存儲,即使最小3節點也有多達36塊硬盤,如果按上述測試數據推算,其能支持每秒最多3.6萬個文件的并發訪問。即使部署在傳統雙控陣列(12塊硬盤)中,也能支持每秒最多近1.2萬個文件的并發訪問。更何況還有存儲系統的內存/緩存加持,實現的系統綜合實際性可高于上述數值。

本測試綜合考慮HDD的性能后選擇使用的是單機環境(i5-13600,14Core@2.7GHz,32G內存)進行測試,在測試中排除了系統內存、網絡等因素的影響。在企業實際環境,如文件共享應用中,文件系統(NAS)緩存將會對文件讀寫性能帶來利好,但不同的存儲網絡(GbE vs FC、10GbE vs 25GbE等)則會對測試結果帶來較大影響,同時,客戶端并發數量、讀寫負載混合比例等都會不同程度上影響文件系統性能。

3

除了性能,硬盤還有其他優點

東芝MG10-D系列硬盤是東芝專為企業存儲而研發改進的傳統磁記錄格式(CMR)硬盤家族,除了上述測試中所反映出的性能穩定性、可預測性外,為滿足企業存儲需求,東芝MG10-D系列硬盤還有著很多特點及可選擇的附加功能,比如:

即時清理擦除(SIE)和自加密功能(SED)很多企業,尤其是有著大規模數據中心的企業,因故障更換硬盤、報廢硬盤后,如何處理被淘汰硬盤通常是一個難題,其上可能存放著企業敏感數據。而利用這兩項安全功能,能幫助企業更好地處理數據安全風險。東芝MG10-D全容量系列硬盤均支持這兩項功能。

持久寫入緩存技術。可在保證最優寫入性能(Write Cache啟用)的基礎上防范由于突然掉電導致緩存數據丟失的風險,幫助企業在保證數據安全的同時更好地應對突發業務波峰。

存儲選擇更靈活。東芝MG10-D系列硬盤不僅提供用于構建分布式存儲的SATA接口硬盤,還提供滿足企業存儲陣列需求的SAS接口硬盤;企業還可根據業務所需靈活選擇512e/4Kn或512n等不同扇區格式的硬盤,可無縫融入企業各種業務場景;1TB起步、最高10TB的容量規格也讓企業擁有更靈活的選擇。

為什么企業依舊青睞HDD?

圖12:東芝MG10-D系列提供不同規格型號的硬盤,供企業按需求靈活選擇

除上述特點以外,東芝MG10-D系列硬盤每年額定工作負載總傳輸率可達550TB;同時還具有很好的電源能效,在活躍待機模式下的功耗降至5.74W,相比上一代產品能耗節省方面也有很大提升。對于聚集了數萬臺服務器的企業數據中心,每一瓦的能耗節省都能為用戶帶來更好的成本管控制。

在很多企業數據中心的主流應用場景,HDD以其可預測的性能、更具性價比的投入、經驗證的可靠性、更靈活的容量與接口選擇,以及優異的兼容性等特點,能夠更好地支撐企業業務的正常穩定運行。

免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。

關鍵詞:

相關閱讀