6月11日消息,根據國際調研機構 IDC 發布的《數據時代2025》預測,全球數據總量將從 2018年的33ZB 增至 2025 年的175ZB,增長超過5倍。
中國電子信息產業發展研究院發布的《中國數字經濟發展現狀與趨勢洞察》顯示,中國已成為數據量最大、數據類型最豐富的國家之一。預計到2025年,中國數據總量在全球占比將接近30%。
數據總量、數據類型如此之多,可謂“橫看成嶺側成峰,遠近高低各不同”。面對紛繁的數據,存儲能力作為云廠商的基本功如何創新升級?近期,亞馬遜云科技大中華區產品部總經理陳曉建分享了亞馬遜云科技在存儲領域的實踐創新。
在陳曉建看來,數據快速增長給存儲帶來三方面新挑戰:
第一、敏捷和成本之間的平衡。市場上更快的數據存取服務往往需要更高的費用來獲取,如何應對海量數據增長所帶來的成本急速上升與數據存儲服務敏捷性能之間根深蒂固的矛盾。
第二,數據本身多樣化的需求。企業業務數據來自于各個渠道,各業務數據本身性質不同,使用方式也不一樣,如何設計不同的存儲服務滿足不同業務的需求?
第三,數據安全與合規的問題。
面對這三個挑戰,亞馬遜云科技通過三種不同對策來解決:
第一,智能分層。通過智能分層徹底解決數據的成本和數據的可用性、敏捷性之間的矛盾。
第二,專門構建。開發多種針對于不同場景下數據應用的存儲產品來解決企業應用多種多樣,需求各有不同的問題。
第三,統一數據保護。通過一站式云服務備份系統,解決數據安全合規的問題,同時也解決數據備份所帶來成本增加的問題。
數據有冷熱 智能分層
從8層對象存儲Amazon S3 到4層文件存儲Amazon EFS
2006年3月14日亞馬遜云科技推出第一個對象存儲產品Amazon S3,至今已經整整16年。
陳曉建稱:“談到數據存儲,每個用戶都會關心成本。16年來Amazon S3非常重要的工作就是不斷優化成本,為用戶節約存儲所需要花的錢。16年間,整個存儲成本降低了大約7倍,一份數據在2006年的時候如果需要100塊錢存儲的話,到今天只需要花15塊錢。”
Amazon S3如何做到節省成本的同時又不能影響到用戶的數據存儲體驗?
陳曉建介紹,將數據按照訪問頻度,即冷熱程度(訪問越頻繁則越熱)進行智能分層來存儲,是數據存儲“降成本”和“保敏捷”非常重要的一個解決方法。
在過去一年,亞馬遜云科技進一步細化其對象存儲服務Amazon S3的存儲層級。2021年12月份推出了革命性新產品Amazon S3 Glacier Instant Retrieval。它的價格和普通Glacier產品相當,但是它的用戶數據的取回速度升級至毫秒級。
“我們估算發現,客戶如果將每年僅訪問幾次的數據從 Amazon S3 Standard-IA 遷移到Amazon S3 Glacier Instant Retrieval ,可節省高達近70%的存儲成本”,陳曉建舉例表示,有了Amazon S3 Glacier Instant Retrieval,用戶數據存儲可以兼顧低成本和高性能。
隨著Amazon S3 Glacier Instant Retrieval的推出,至此,Amazon S3的存儲層級達到8級。
Amazon S3存儲層級如此之多,新的問題隨之而來:對于普通用戶而言又該如何因應自身業務需要來選擇最合適的存儲層級呢?
為了幫助用戶判斷數據的溫度,實現根據數據溫度的變化進行存儲策略調整,2018年亞馬遜云科技推出Amazon S3智能分層服務,它會對每一份數據的實際訪問頻率做智能分析,再自動判斷把數據分到合適的存儲層級,徹底解決用戶的存儲選擇困惑。
另外,亞馬遜云科技還將這一“智能分層思路”擴展至云原生文件存儲Amazon EFS。
據陳曉建介紹,目前Amazon EFS提供了四種存儲等級分層,客戶可以制定數據生命周期策略,將數據移動到非頻繁訪問層,需要訪問時可以自動移動數據到標準層,通過這項分層存儲功能,可幫助客戶節省高達72%的存儲成本。
專門構建
不同數據類型的來源不同、使用方式不一樣、用戶需求也不同。陳曉建表示,亞馬遜云科技的應對策略是專門構建不同的云存儲服務。目前,亞馬遜云科技存儲服務已經覆蓋了對象存儲、塊存儲、文件存儲、數據備份、數據容災、以及數據傳輸與邊緣處理各個方面,用戶可根據自身需求靈活選擇。
為了幫助用戶應對不同工作負載,在云端輕松且經濟地啟動和運行主流的文件系統,亞馬遜云科技在過去一年不斷豐富“專門構建”的Amazon FSx文件存儲系列服務,在Amazon FSx for Windows File Server基礎上,新推出新一代Amazon FSx for Lustre、基于開源OpenZFS 文件系統構建的Amazon FSx for OpenZFS以及云上首個完整且全面托管NetApp ONTAP文件存儲系統的Amazon FSx for NetApp ONTAP。
其中新一代Amazon FSx for Lustre跟上一代相比,能夠更好地支持HPC計算密集型工作負載,可提供5倍于前一代服務的單位存儲吞吐量,每TB存儲的吞吐量高達1GB/秒。Amazon FSx for OpenZFS基于開源的OpenZFS 文件系統構建,適用于對可擴展性、性能和成本效率要求較高的工作負載,如機器學習、電子芯片設計自動化、應用程序構建環境、媒體處理和金融分析等。
統一數據保護
在存儲數據的保護方面,Amazon Backup可統一保護用戶應用程序的數據,跨越亞馬遜云科技的計算、數據庫以及文件,對象和塊存儲服務。
陳曉建稱,在過去一年,亞馬遜云科技將Amazon Backup擴展至Amazon S3和VMware工作負載,讓用戶使用統一的數據保護策略,即可配置、管理和監督數據的備份與恢復,此外還涵蓋Amazon Elastic Compute Cloud (Amazon EC2)、 Amazon EBS、Amazon Relational Database Service (Amazon RDS)、Amazon Aurora、Amazon DynamoDB、Amazon DocumentDB、Amazon Neptune、Amazon FSx、Amazon EFS和Amazon Storage Gateway。用戶還可以使用Amazon Backup Audit Manager生成審計報告來幫助其滿足合規要求,并使用Amazon Backup中內置的細粒度訪問控制以及Amazon Backup Vault Lock,保持備份不變,防止意外或惡意刪除。
“2006年到今天整整16年時間,我們持續了解客戶訴求并進行科技創新。僅2021年一年亞馬遜云科技在存儲方面就頒布了130多項新的特性和功能”,陳曉建總結道,亞馬遜云科技存儲服務已經成為IT行業的“水”和“電”,讓各行各業的業務都能從存儲服務中獲得價值。
原標題:亞馬遜云科技陳曉建:數據也有冷熱,如何存儲才能更省更快?