本頁使用了標題或全文手工轉換

數據視覺化

維基百科,自由的百科全書
跳至導覽 跳至搜尋

數據視覺化(英語:Data visualization)被許多學科視為與視覺傳達含義相同的現代概念。它涉及到數據視覺化表示的建立和研究。[1]

為了清晰有效地傳遞資訊,數據視覺化使用統計圖形圖表資訊圖表和其他工具。可以使用點、線或條對數字數據進行編碼,以便在視覺上載達定量資訊。[2] 有效的視覺化可以幫助用戶分析和推理數據和證據。它使複雜的數據更容易理解、理解和使用。用戶可能有特定的分析任務(如進行比較或理解因果關係),以及該任務要遵循的圖形設計原則。表格通常用於用戶尋找特定的度量,而各種類型的圖表用於顯示一個或多個變數的數據中的模式或關係。

數據視覺化既是一門藝術也是一門科學。[3] 有些人認為它是描述統計學的一個分支,但也有些人認為它是一個紮根理論開發工具。互聯網活動產生的數據量的增加和環境中感測器數量的增加被稱為"大數據"或物聯網。處理、分析和交流這些數據對數據視覺化來說是道德和分析方面的挑戰。[4] 數據科學領域和被稱為數據科學家的從業人員可以幫助應對這一挑戰。[5]

概述[編輯]

數據視覺化主要旨在藉助於圖形化手段,清晰有效地傳達與溝通訊息。但是,這並不就意味着,數據視覺化就一定因為要實現其功能用途而令人感到枯燥乏味,或者是為了看上去絢麗多彩而顯得極端複雜。為了有效地傳達思想概念,美學形式與功能需要齊頭並進,通過直觀地傳達關鍵的方面與特徵,從而實現對於相當稀疏而又複雜的數據集的深入洞察。然而,設計人員往往並不能很好地把握設計與功能之間的平衡,從而創造出華而不實的數據視覺化形式,無法達到其主要目的,也就是傳達與溝通訊息[6]

數據視覺化與資訊圖形資訊視覺化科學視覺化以及統計圖形密切相關。目前,在研究、教學和開發領域,數據視覺化乃是一個極為活躍而又關鍵的方面。「數據視覺化」這條術語實現了成熟的科學視覺化領域與較年輕的資訊視覺化領域的統一[7]

歷史[編輯]

法國工程師查爾斯·約瑟夫·密納德於1861年繪製的關於拿破崙入侵俄羅斯的資訊圖

數據視覺化領域的起源可以追溯到1950年代初的電腦圖學。當時,人們利用電腦建立出了首批圖形圖表。1987年,由布魯斯·麥考梅克英語Bruce H. McCormick湯姆斯·蒂凡提英語Thomas A. DeFanti瑪克辛·布朗英語Maxine D. Brown所編寫的美國國家科學基金會報告《Visualization in Scientific Computing》(意為「科學計算之中的視覺化」)[8],對於這一領域產生了大幅度的促進和刺激。這份報告之中強調了新的基於電腦視覺化技術方法的必要性。隨着電腦運算能力的迅速提升,人們建立了規模越來越大,複雜程度越來越高的數值模型,從而造就了形形色色體積龐大的數值型數據集。同時,人們不但利用醫學掃描器和顯微鏡之類的數據採集裝置產生大型的數據集,而且還利用可以儲存文字、數值和多媒體資訊的大型數據庫來收集數據。因而,就需要進階的電腦圖學技術與方法來處理和視覺化這些規模龐大的數據集[7]

短語「Visualization in Scientific Computing」(意為「科學計算之中的視覺化」)後來變成了「Scientific Visualization」(即「科學視覺化」),而前者最初指的是作為科學計算之組成部分的視覺化:也就是科學與工程實踐當中對於電腦建模模擬的運用。更近一些的時候,視覺化也日益尤為關注數據,包括那些來自商業財務行政管理數碼媒體等方面的大型異質性數據集合。1990年代初,人們發起了一個新的,稱為「資訊視覺化」的研究領域,旨在為許多應用領域之中對於抽象的異質性數據集的分析工作提供支援。因此,目前人們正在逐漸接受這個同時涵蓋科學視覺化資訊視覺化領域的新生術語「數據視覺化」[7]

自那時起,數據視覺化就是一個處於不斷演變之中的概念,其邊界在不斷地擴大;因而,最好是對其加以寬泛的定義。數據視覺化指的是技術上較為進階的技術方法,而這些技術方法允許利用圖形、圖像處理電腦視覺以及使用者介面,通過表達、建模以及對立體、表面、屬性以及動畫的顯示,對數據加以視覺化解釋。與立體建模之類的特殊技術方法相比,數據視覺化所涵蓋的技術方法要廣泛得多[9]

數據視覺化的適用範圍[編輯]

北京地鐵2015年規劃圖
手繪心智圖

關於數據視覺化的適用範圍,目前存在着不同的劃分方法。一個常見的關注焦點就是資訊的呈現。例如,米高·弗蘭德利(2008)提出了數據視覺化的兩個主要的組成部分:統計圖形主題圖[1]。另外,《Data Visualization: Modern Approaches》(意為「數據視覺化:現代方法」,2007)一文則概括闡述了數據視覺化的下列主題[10]

所有這些主題全都與圖形設計和資訊表達密切相關。


另一方面,Frits H. Post(2002)則從電腦科學的視角,將這一領域劃分為如下多個子領域[7]

  • 視覺化演算法與技術方法
  • 立體視覺化
  • 資訊視覺化
  • 多解像度方法
  • 建模技術方法
  • 互動技術方法與體系架構

數據視覺化的成功應歸於其背後基本思想的完備性:依據數據及其內在模式和關係,利用電腦生成的圖像來獲得深入認識和知識。其第二個前提就是利用人類感覺系統的廣闊頻寬來操縱和解釋錯綜複雜的過程、涉及不同學科領域的數據集以及來源多樣的大型抽象數據集合的模擬。這些思想和概念極其重要,對於計算科學與工程方法學以及管理活動都有着精深而又廣泛的影響。《Data Visualization: The State of the Art》(意為「數據視覺化:尖端技術水平」)一書當中重點強調了各種應用領域與它們各自所特有的問題求解視覺化技術方法之間的相互作用[7]

相關領域[編輯]

核醫學成像:心臟SPECT英語SPECT圖像(短軸視圖)與心臟三維模型的融合
利用2004年來自哈伯太空望遠鏡的相片以及地基圖像所編制合成的螺旋星雲可見光圖像。
全球氣溫分佈圖

數據採集[編輯]

數據採集(有時縮寫為DAQDAS),又稱為「數據取得」或「數據收集」,是指對現實世界進行採樣,以便產生可供電腦處理的數據的過程。通常,數據採集過程之中包括為了獲得所需資訊,對於訊號波形進行採集並對它們加以處理的步驟。數據採集系統的組成元件當中包括用於將測量參數轉換成為電訊號感測器,而這些電訊號則是由數據採集硬件來負責取得的。

數據分析[編輯]

數據分析是指為了提取有用資訊和形成結論而對數據加以詳細研究和概括總結的過程。數據分析與數據探勘密切相關,但數據探勘往往傾向於關注較大型的數據集,較少側重於推理,且常常採用的是最初為另外一種不同目的而採集的數據。在統計學領域,有些人將數據分析劃分為描述性統計分析探索性數據分析以及驗證性數據分析;其中,探索性數據分析側重於在數據之中發現新的特徵,而驗證性數據分析則側重於已有假設的證實或證偽。

數據分析的類型包括:

  • 探索性數據分析:是指為了形成值得假設的檢驗而對數據進行分析的一種方法,是對傳統統計學假設檢驗手段的補充。該方法由美國著名統計學家約翰·圖基命名。
  • 定性數據分析:又稱為「定性資料分析」、「定性研究」或者「質性研究資料分析」,是指對諸如詞語、相片、觀察結果之類的非數值型數據(或者說資料)的分析。

數據治理[編輯]

數據治理涵蓋為特定組織機構之數據建立協調一致的企業級視圖(enterprise view)所需的人員、過程和技術;數據治理旨在:

  • 增強決策制定過程中的一致性與信心
  • 降低遭受監管罰款的風險
  • 改善數據的安全性
  • 最大限度地提高數據的創收潛力
  • 指定資訊質素責任

數據管理[編輯]

數據管理,又稱為「數據資源管理」,包括所有與管理作為有價值資源的數據相關的學科領域。對於數據管理,DAMA所提出的正式定義是:「數據資源管理是指用於正確管理企業或機構整個數據生命周期需求的體系架構、政策、規範和操作程式的制定和執行過程」。這項定義相當寬泛,涵蓋了許多可能在技術上並不直接接觸低層數據管理工作(如關聯式數據庫管理)的職業

數據探勘[編輯]

數據探勘是指對大量數據加以分類整理並挑選出相關資訊的過程。數據探勘通常為商業智能組織和金融分析師所採用;不過,在科學領域,數據探勘也越來越多地用於從現代實驗與觀察方法所產生的龐大數據集之中提取資訊。

數據探勘被描述為「從數據之中提取隱含的,先前未知的,潛在有用資訊的非凡過程」[11],以及「從大型數據集或數據庫之中提取有用資訊的科學」[12]。與企業資源規劃相關的數據探勘是指對大型交易數據集進行統計分析和邏輯分析,從中尋找可能有助於決策制定工作的模式的過程[13]

參考文獻[編輯]

  1. ^ 1.0 1.1 Michael Friendly (2008). "Milestones in the history of thematic cartography, statistical graphics, and data visualization".
  2. ^ Stephen Few-Perceptual Edge-Selecting the Right Graph for Your Message-2004 (PDF). 
  3. ^ Manuela Aparicio and Carlos J. Costa. Data visualization. Communication Design Quarterly Review. November 2014, 3 (1): 7–11. doi:10.1145/2721882.2721883. 
  4. ^ Nikos Bikaks (2018) "Big Data Visualization Tools" Encyclopedia of Big Data Technologies, Springer 2018.
  5. ^ Press, Gil. A Very Short History Of Data Science. 
  6. ^ (英文) "Data Visualization and Infographics" in: Graphics, Monday Inspiration, January 14th, 2008.
  7. ^ 7.0 7.1 7.2 7.3 7.4 (英文) Frits H. Post, Gregory M. Nielson and Georges-Pierre Bonneau (2002). Data Visualization: The State of the Art 互聯網檔案館存檔,存檔日期2009-10-07..
  8. ^ (英文) Bruce H. McCormick英語Bruce H. McCormick, Thomas A. DeFanti英語Thomas A. DeFanti and Maxine D. Brown英語Maxine D. Brown (eds.) (1987). Visualization in Scientific Computing. ACM Press
  9. ^ (英文)Paul Reilly, S. P. Q. Rahtz (eds.) 1992. Archaeology and the Information Age: A Global Perspective. p.92.
  10. ^ (英文)"Data Visualization: Modern Approaches". in: Graphics, August 2nd, 2007
  11. ^ (英文)W. Frawley and G. Piatetsky-Shapiro and C. Matheus. Knowledge Discovery in Databases: An Overview. AI Magazine. Fall 1992: pp. 213–228. ISSN 0738-4602. 
  12. ^ (英文)D. Hand, H. Mannila, P. Smyth. Principles of Data Mining. MIT Press, Cambridge, MA. 2001. ISBN 0-262-08290-X. 
  13. ^ (英文)Ellen Monk, Bret Wagner. Concepts in Enterprise Resource Planning, Second Edition. Thomson Course Technology, Boston, MA. 2006. ISBN 0-619-21663-8. 

延伸閱讀[編輯]

  • (英文)Chandrajit Bajaj, Bala Krishnamurthy (1999). 'Data Visualization Techniques.
  • (英文)William S. Cleveland (1993). Visualizing Data. Hobart Press.
  • (英文)William S. Cleveland (1994). The Elements of Graphing Data. Hobart Press.
  • (英文)Alexander N. Gorban, Balázs Kégl and Andrey Zinovyev (2007). Principal Manifolds for Data Visualization and Dimension Reduction.
  • (英文)John P. Lee and Georges G. Grinstein (eds.) (1994). Database Issues for Data Visualization: IEEE Visualization '93 Workshop, San Diego.
  • (英文)Peter R. Keller and Mary Keller (1993). Visual Cues: Practical Data Visualization.
  • (英文)Frits H. Post, Gregory M. Nielson and Georges-Pierre Bonneau (2002). Data Visualization: The State of the Art.

外部連結[編輯]

參見[編輯]

軟件程式/視覺化用於程式/圖學工具箱
組織機構