對于可視化有以下幾點建議
大數據是大容量、高速度并且數據之間差異很大的數據集,因此需要新的處理方法來優化決策的流程。大數據的挑戰在于數據采集、存儲、分析、共享、搜索和可視化
1、“所有數據都必須可視化”:不要過分依賴可視化,一些數據不需要可視化方法來表達它的消息。
2、“只有好的數據才應該做可視化”:簡便的可視化可以便于找到錯誤就像數據有助于發現有趣的趨勢一樣。
3、“可視化總是能做出正確的決定”:可視化并不能代替批判性思維。
4、“可視化將意味著準確性”:數據可視化并不著重于顯示一個準確的圖像,而是它可以表達出不同的效果。
可視化方法可通過創建表格、圖標、圖像等直觀地表示數據。大數據可視化并不是傳統的小數據集。一些傳統的大數據可視化工具的延伸雖然已經被開發出來,但這些遠遠不夠。在大規模數據可視化中,許多研究人員用特征提取和幾何建模在實際數據呈現之前大大減少數據大小。當我們在進行可視化大數據時,選擇合適的數據也是非常重要的。
本文的目的是通過介紹傳統可視化方法及其在處理大數據時的擴展方法,來展現大數據可視化的前沿技術。同時討論大數據可視化的挑戰,并其取得的進步。
在研究過程中,筆者首先尋找了近幾年通過大學圖書館系統發表的數據可視化相關論文。此階段筆者主要總結了傳統的數據可視化方法和該領域的新進展。隨后筆者搜索了相關大數據可視化的論文,因為大數據是一個較新的領域,所以大多數的論文是在過去三年里發表的。同時筆者發現大多數傳統的數據可視化方法并不適用于大數據,用一些從傳統的可視化中發展而來的方法來處理大數據也是遠遠不夠的。筆者著重關注大數據可視化的新方法、技術的進步和大數據可視化的工具開發以及隨之而來的挑戰。