鼎甲 InfoStor-TL 分布式磁帶存儲技術白皮書
發布人:Marketing 發布日期:2021-10-19 10:46:21 點擊數:8893
2021.02?第2.1版
冷數據的存儲從來沒有如現在一般迫切,其增長勢頭,價值體現,來源都與以往不同,磁帶做為冷數據存儲介質,在現今IT環境中角色越發關鍵,把這個變化比做鳳凰涅磐也毫不夸大其辭。
此白皮書基于這一背景,磁帶在現有技術條件下,承載這些新的業務需求的磁帶布署方式也一樣發生了變化,企業對于彈性、簡化以及成本的考量,促使磁帶技術以一種輕量級的方式提供服務,分布式磁帶庫的應用變得更為廣泛。
分布式磁帶庫,以模塊的方式,能夠像搭積木的方式在機房中靈活部署,按照需求擴展,安裝和運維幾乎不需原廠干預,采用LTFS開放軟件,使磁帶庫輕松融入客戶整體架構,另外,最重要的是各項成本和支出表現優異,這使其成為企業的最佳選擇。
本白皮書同時對鼎甲INFOSTOR-TL產品做了基礎性的介紹,為用戶提供參考,以方便用戶作出最佳決定。
1.?分布式磁帶存儲技術
眾所周知,磁帶技術幾乎伴隨著信息技術而生,曾經作為主存儲使用,有著光輝的歷史,但與硬盤的技術及市場的競爭中逐漸勢弱,不斷邊緣化,似有被磁盤技術完全替代的趨勢。然而,隨著移動技術,大數據及云計算的興旺發展,信息技術革命真正進入數據主導時代。
數據改變一切,當然也改變了數據存儲的方式,縱覽全球的大型的云數據中心,包括Microsoft, Google, AWS, Facebook, 磁帶技術已經被大規模應用于冷數據存儲,成為歸檔及備份類應用當仁不讓的第一選擇。
磁帶技術浴火重生,鳳凰涅槃,其背后的驅動力仍在于數據,在于數據的價值,以及這些價值呈現方式,還包括數據的獲取成本,使用時機,難以衡量的生命周期,最關鍵的還是數據規模。與其他存儲介質相比,磁帶存儲技術完美契合了這些新的需求,這表現在:
- 從成本上,不論是購買成本(CAPEX, 資本性支出),還是運維成本(OPEX,管理性支出),相比于閃存和硬盤(包括SMR類高密度近線硬盤),磁帶的成本優勢巨大,這種數倍甚至十數倍的TCO(總擁有成本)優勢反饋到超大規模的數據量(通常數百PB甚至數個EB)層面,這就為企業節省了千萬甚至數億人民幣級別的成本支出,這種節省,對改善企業基本面,增強企業顯示競爭力,具有無可抵御的吸引力。
- 從技術上,磁帶技術潛力巨大,磁錄密度幾乎線性增長,這與磁盤后繼乏力形成鮮明對比,根據現有的路線圖,磁帶介質容量幾乎每3年增長50%甚至100%,實驗室環境中單柄磁帶已經做到了528TB,這確是磁盤甚至閃存難以企及的技術底蘊,更是光盤存儲望塵莫及的。除去密度之外,磁帶與生俱來的空隙(Air Gap)技術為網絡及數據安全提供最后的保障。
- 從產品生命周期及可靠性來講,磁帶技術(包括磁帶庫,磁帶機和磁帶)可謂超長待機,磁帶的可靠性相較硬盤技術高3個數量級,這使磁帶機和磁帶庫的生命周期包括售后在內往往超過20年,而在數據中心中的30年前的磁帶比比皆是。
- 從企業社會責任來講,磁帶技術因其離線特性,天然對環境較為友好,電力消耗相對于閃存和硬盤來講幾乎忽略不計,這不僅節省運維成本,同時切實踐行了企業的社會責任承諾。除了電力消耗,磁帶對環境的友好性還表現在對數據中心的環境要求上,對機架,空氣質量,溫濕度等等相比于其他存儲介質均較為寬松。
1.2?LTO磁帶技術及路線圖
LTO 技術聯盟 (LTO Consortium)提供開放磁帶技術發展路線,包括LTO Ultrium磁帶技術以及LTFS (Linear Tape File System)磁帶開源文件系統,聯盟廠商采用統一的技術路線,提供標準化,統一開放的產品,使磁帶技術能得以簡單有效的方式提供給客戶。
LTO Ultrium的技術路線如圖1所示,2020年4季度末,LTO9產品已發布,并計劃于2021年第一季度向市場推出相應的產品。按照LTO聯盟的技術路線圖,今后的磁帶密度皆比上一代提升一倍。
圖1:LTO Ultrium磁帶技術路線圖
附表1則為目前及未來市場中的LTO磁帶技術的數據表:
LTO 6 | LTO 7 | LTO 8 | M8 | LTO 9 | LTO 10 | LTO 11 | LTO 12 | |
發布時間 | 2012/12 | 2015/12 | 2017/12 | 2020/09 | 2023*** | 2026*** | 2029*** | |
磁帶裸容量 (TB) | 2.5 | 6 | 12 | 9 | 18 | 36 | 72 | 144 |
磁帶壓縮容量 (TB)* | 6.25 | 15 | 30 | 22.5 | 45 | 90 | 180 | 360 |
磁帶長度(m) | 846 | 960 | 960 | 960 | 1035 | / | / | / |
磁帶材料 | MP或BaFe | BaFe | BaFe | BaFe | / | / | / | / |
磁帶內存 (KiB) | 16 | 16 | 16 | 16 | / | / | / | / |
磁帶機未壓縮最大讀寫速度(MB/s) | 160 | 300 | 360 | 300 | 400 | 1100** | / | / |
磁帶機壓縮后最大讀寫速度(MB/s) | 400 | 750 | 900 | 750 | 1000 | 2750** | / | / |
全磁帶寫入時間(按未壓縮速度hh:mm) | 04:20 | 05:33 | 09:16 | 08:20 | 12:30 | 12:07** | / | / |
WORM | 可以 | 可以 | 可以 | 不可以 | 可以 | / | / | / |
加密 | 可以 | 可以 | 可以 | 可以 | 可以 | / | / | / |
注: * 磁帶按2.5:1壓縮; **為技術計劃;***為預計時間; “/”表示尚無可披露數據 |
1.3?冷數據存儲技術方向以及對磁帶庫的要求
根據IDC的預測,企業數據產生的年度復合增長率水平為40%-50%,每2-3年數據增長一倍,這也意味著全球范圍內,數據在2025年之前將達到甚至超過200ZB,其中產生于中國的數據將占據1/4。在這些數據中,溫冷數據占據總量的90%, 按照IDC的定義,超過30天的純冷數據則占總量的60%以上,這就是說,即便在中國,屆時每年會有將近30ZB的冷數據需要存儲。
與數據爆發式容量增長的同時,冷數據的價值體現也在發生改變,或者說,數據的價值呈現變得多元化,既存在數據價值相對較高的數據庫,ERP類的數據,這類數據增長相對平緩;也存在大量AI科學訓練,媒體及醫學影像數據這類相對價值稀薄的數據;還包括為滿足政策法規要求所必須存儲的價值幾乎為零的數據,可以說數據的價值是與其復原或恢復的概率直接相關。
大幅降低冷數據單位存儲成本,這個要求變得愈發迫切,在存儲介質一端,閃存通過技術的更新(如3D NAND)大幅增加容量以降低成本,而希捷大規模HAMR (Heat Assited magnetic Recording),西數借助MAMR (Microwave Assisted Magnetic Recards)技術期望提升硬盤容量,但值得指出的是磁記錄面密度的提升,磁帶的可提升空間相較于磁盤具有巨大優勢,2020年底,Fujifilm聯合IBM發布基于鍶鐵氧體(SrFe)技術的磁帶技術,單柄磁帶容量達到580TB,而磁記錄面密度也僅僅約為12TB硬盤密度的1/3。從技術角度而言,磁帶是唯一能解決這一要求的唯一選擇,包括DNA存儲,5D晶體技術,磁阻式隨機訪問存儲器(MRAM)都無法勝任。
包括Google、微軟、AWS一批云計算廠商大規模部署磁帶庫,云應用也改變了磁帶庫的傳統應用方式,最明顯的莫過于采用對象接口(S3)方式,在這方面有開源項目可供利用,如OpenStack Swift,名為SwiftHLM的組件可插入OpenStack Swift堆棧以便在系統中添加磁帶作為二級或三級存儲使用,當然有更多的商業對象存儲軟件可供選擇,比如Xtreme Store以及PoINT歸檔網關等等。
冷數據應用還體現在量子計算領域,現有的非對稱加密算法ECC,RSA以及AES-128/256都將變得不安全,新的量子安全加密(QSC)機制已經提上日程,技術上,加密的數據無法壓縮(compresion)或除重(dedup),這對磁帶機的性能也提出了要求。另外,在超大規模歸檔存儲中,糾刪碼(EC)的使用會大幅降低數據存儲的安全成本,使用糾刪碼的環境下,作為可移動存儲,磁帶與硬盤及SSD有著很大不同,實踐中需要利用獨特方法例如小文件的聚合及片段讀取以提升整體性能。
云,AI以及邊緣計算的另一個技術趨向在于磁帶庫部署方式的改變,多點部署,業務可彈性,簡化運維已成為互聯網及云計算廠商的三大基礎要求,基于這些要求,分布式磁帶庫成為更切實的選擇。
1.4?集中式及分布式磁帶存儲技術選擇
從產品形態上,集中式磁帶存儲技術最重要的技術特性表現在可橫向擴展上,例如IBM TS4500,昆騰Scalar i6000等產品,集中式磁帶存儲技術更多的應用在一兩個數據中心中,單個磁帶庫可擴充至一萬甚至數萬個磁帶槽位,同時賦予大量I/O槽位以便磁帶離庫操作,軟件上配置齊全,如磁帶虛擬化,多路徑以滿足傳統的,大規模備份和歸檔需要。配置強大是集中式磁帶技術的優勢,但這種形態的磁帶庫劣勢同樣明顯,首先,其安裝相當復雜,很多情景下需要機房改造,全程需要原廠介入,其次,運維難度較高,有較高的學習成本,故障后只能依靠原廠資源,再有,部署無法靈活,遷移成本代價高昂,如果涉及到數據的大規模遠程復制難度幾乎無法想象,最后,集中式存儲的硬件價格,軟件許可,售后維保成本都比較昂貴。
如上文所述,分布式磁帶存儲技術是類似于云歸檔存儲部署的最佳選擇,集中式磁帶技術的劣勢在新的技術環境中則成為優勢,分布式磁帶技術從機械構件上相對簡單,通常單機架部署,可充分利用現有機架空間,容量可通過3U或6U模塊擴充;安裝及維護簡單,部件可熱插拔或僅需要較短的停機窗口更換并重新啟用,這些過程基本上可不需要原廠參與,在數據需要大規模遷移的情況下,甚至可以直接以物理遷移的方式,將一個數據中心的磁帶庫運送并掛載到新的數據中心使用,數據使用完畢后,再拆卸運送回原處或其他數據中心使用,這會極大降低網絡開銷并切實提升業務效率。
在實際部署中,分布式磁帶存儲技術可以圖2所示類似以細胞(Cell)形式無限擴展,每個細胞都由一組磁帶庫模塊構成,單個細胞內獨立擁有一個緩存及數據庫節點(服務器),也可多個細胞共享一個節點(服務器),節點提供的功能包括元數據(metadata)管理,HTTP接口服務, 或作為備份服務器,另外最重要的的是作為讀寫緩存(cache),作為應用和帶庫之間的臨時性存儲池。
圖2:分布式磁帶存儲細胞化部署
在細胞化結構中,節點之間通過以太網連接,節點和磁帶庫之間囿于現有技術可以FC或SAS方式直連,也可通過FC SAN交換機集中式管理,在一些商業軟件中,節點和磁帶機之間構筑分區,這種分區可以專有也可以動態方式存在,每個分區所管理的磁帶(catridge)則固定不變。節點之間可互為冗余,當某個節點發生故障時,其他節點可接管故障節點所管理的分區。如圖3所示:
圖3:PAG的動態分區架構 (使用交換機及3/4 EC部署)
2.?鼎甲infostor-TL分布式磁帶存儲產品
2.1 INFOSTOR-TL磁帶庫總體情況
INFOSTOR-TL磁帶庫大致可分為兩類,一類為中小客戶備份所需的入門級自動加載器及磁帶庫, 均為機架安裝,包括1U和2U兩種形態;另一類則為模塊化分布式磁帶庫,每個模塊以3U或6U形式體現,可擴展至1個標準機架。
表2:為入門級自動加載器及磁帶庫技術參數匯總如下:
1U磁帶自動加載器 | 2U磁帶庫 | |
型號 | FlexStor 1U | FlexStor 2U |
安裝方式及機架高度 | 機架, 1U | 機架, 2U |
磁帶機數量 | 1個半高 | 1個全高或2個半高 |
磁帶機接口 | SAS, iSCSI, FC | SAS, iSCSI, FC |
可支持的磁帶機 | LTO6, 7, 8, 9* | LTO6, 7, 8, 9* |
磁帶總槽位數 | 8 | 24 |
I/O槽位數 | 1 | 1 |
機器人MCBF | 50萬次 | 50萬次 |
電源數量 | 1 | 1 |
電源功率 | 80W | 160W |
噪音輻射 | ≤ 5.8dB | ≤ 5.8dB |
溫度 | 10°C – 35°C | 10°C – 35°C |
相對濕度 | 20% -80% | 20% – 80% |
尺寸 | 447.5x740x43.8mm | 447.5x740x87.6mm |
重量 | 10Kg (不含磁帶) | 12Kg (不含磁帶) |
*表示計劃; |
2.2?INFOSTOR-TL分布式磁帶庫
INFOSTOR-TL分布式磁帶庫技術參數可匯總如下:
- (1)3U/42U塊化磁帶庫
3U模塊 | 42U磁帶庫 | |
型號 | Multistor 3U | / |
安裝方式及機架高度 | 機架, 3U | 機架, 42U, 1個基本模塊, 13個擴展模塊 |
磁帶機數量 | 3個半高或1個全高或1個全高+1個半高 | 14個全高或42個半高或14個全高+14個半高 |
磁帶機接口 | SAS, FC | |
可支持的磁帶機 | LTO6, 7, 8, 9* | |
磁帶總槽位數 | 80 | 560 |
I/O槽位數 | 5 | 最大70個 |
帶倉數量 | 2 | 28 |
操作前面板 | 3.5”顯示器; 配置, 管理, 狀態及診斷菜單 | |
遠程管理接口 | 通過標準以太網連接(10/100/1000 Mbit), 基于Web管理 | |
安全 | SSL/TLS 1.2, 用戶管理/LDAP集成 | |
網絡協議 | IPv4/IPv6 | |
錯誤及告警(alert)管理 | SNMP Trap告警, 錯誤及警報郵件告警系統 | |
分區 | 20 | |
機器人MCBF | 100萬次 | |
電源數量 | 2 | 最大28個 |
單個電源最大功率 | 300W | |
噪音輻射 | ≤ 5.8dB | |
海拔 | 5000m | |
溫度 | 10°C – 35°C | 10°C – 35°C |
相對濕度 | 20% -80% | 20% – 80% |
單模塊尺寸 | 475x892x134mm | 475x892x134mm |
重量 | 20Kg (不含磁帶) | 280Kg (不含磁帶) |
*表示計劃; |
- (2)6U/42U塊化磁帶庫
6U模塊 | 42U磁帶庫 | |
型號 | Multistak 6U | / |
安裝方式及機架高度 | 機架, 6U | 機架, 42U, 1個基本模塊, 6個擴展模塊 |
磁帶機數量 | 6個半高或3個全高 | 21個全高或42個半高 |
磁帶機接口 | SAS, FC | |
可支持的磁帶機 | LTO6, 7, 8, 9* | |
磁帶總槽位數 | 80 | 560 |
I/O槽位數 | 5 | 最大70個 |
帶倉數量 | 2 | 14 |
操作前面板 | 5.7”觸碰顯示器; 配置, 管理, 狀態及診斷菜單 | |
遠程管理接口 | 通過標準以太網連接(10/100/1000 Mbit), 基于Web管理 | |
安全 | SSL/TLS 1.2, 用戶管理/LDAP集成 | |
網絡協議 | IPv4/IPv6 | |
錯誤及告警(alert)管理 | SNMP Trap告警, 錯誤及警報郵件告警系統 | |
分區 | 20 | |
機器人MCBF | 200萬次 | |
電源數量 | 2 | 最大14個 |
單個電源最大功率 | 300W | |
噪音輻射 | ≤ 5.8dB | ≤ 5.8dB |
海拔 | 5000m | |
溫度 | 10°C – 35°C | 10°C – 35°C |
相對濕度 | 20% -80% | 20% – 80% |
單模塊尺寸 | 475x892x268mm | |
重量 | 44Kg (不含磁帶) | 308Kg (不含磁帶) |
*表示計劃; |
- (3)適配的LTO驅動器
LTO驅動器 | 接口及高度 |
LTO 6 | LTO 6 HH FC 單口半高
LTO 6 HH FC 雙口半高 LTO 6 HH SAS 雙口半高 |
LTO 7 | LTO 7 HH FC 單口半高
LTO 7 HH FC 雙口半高 LTO 7 HH SAS 雙口半高 |
LTO 8 | LTO 8 HH FC 單口半高
LTO 8 HH FC 雙口半高 LTO 8 FH FC 雙口半高 LTO 8 HH SAS 雙口全高 |
- (4)支持的SAS及FC接口速度
接口 | LTO磁帶機 | 端口速率 |
SAS | LTO 6/7/8/9 | 1.5 Gbps, 3 Gbps, 6 Gbps |
FC | LTO 6/7/8/9 | 2 Gbps, 4 Gbps, 8 Gbps |
- (5)Ultrium LTO 讀寫兼容性表
LTO 5磁帶機 | LTO 6磁帶機 | LTO 7磁帶機 | LTO 8磁帶機 | |
LTO 5磁帶(未加密) | 讀/寫 | 讀/寫 | 只讀 | |
LTO 5磁帶(加密) | 讀/寫(使用密鑰) | 讀/寫(使用密鑰) | 只讀(使用密鑰) | |
LTO 6磁帶(未加密) | 讀/寫 | 讀/寫 | ||
LTO 6磁帶(加密) | 讀/寫(使用密鑰) | 讀/寫(使用密鑰) | ||
LTO 7磁帶(未加密) | 讀/寫 | 讀/寫 | ||
LTO 7磁帶(加密) | 讀/寫(使用密鑰) | 讀/寫(使用密鑰) | ||
LTO 8磁帶(未加密) | 讀/寫 | |||
LTO 8磁帶(加密) | 讀/寫(使用密鑰) |