一、圖表的組成


1. 圖表的構成


當我們把圖表的結構進(jìn)行拆解后,就會(huì )發(fā)現一個(gè)圖表是由很多個(gè)細小構件組成的,這些構件有自己的名字和用途,分別是標題、軸、圖形、圖例、標簽、提示信息。在平常使用的過(guò)程中,會(huì )根據場(chǎng)景去修飾刪減一些構件元素,以此來(lái)減少冗余信息,用最適量的數據墨水比(Data-ink Ratio),幫助用戶(hù)快速達成目標,在最少的時(shí)間內獲取更多的信息。


  • 標題 - 描述圖表的主題(包含主標題和副標題)

  • 標簽 - 對當前這一組數據進(jìn)行的內容標注

  • 軸 - 用來(lái)定義坐標系中數據在方向和值的映射關(guān)系

  • 圖例 - 對圖形本身的概括

  • 提示信息 - 當tap或者hover的時(shí)候,以交互提示信息的形式展示該點(diǎn)的數據詳情

  • 圖形 - 統計圖表的視覺(jué)通道在形狀上映射的視覺(jué)展現

接下來(lái),我會(huì )一點(diǎn)一點(diǎn)地為大家講解它們,方便大家合理的使用它們。但在此之前,我們先來(lái)了解一個(gè)知識點(diǎn) - 數據墨水比,以便更好的理解接下來(lái)的內容。


2. 數據墨水比


數據墨水比——"data-ink ratio",是1983年視覺(jué)大師愛(ài)德華·塔夫特(Edward Tufte)在《The Visual Display of Quantitative Information》中提出的一個(gè)概念:一幅圖表的絕大部分筆墨應該用于展示數據信息,數據變化則筆墨也變化。他將數據油墨比定義為圖表中用于數據的墨水量除以總油墨量。其中數據墨水指的是圖表中不可刪除的核心內容。比如,我可以刪除圖例、刪除坐標軸、刪除網(wǎng)格線(xiàn),這可能不會(huì )影響你從圖表中讀取相關(guān)的信息。但如果我刪除柱形圖、餅圖這些圖表的主體元素,那么圖表就失去所要表達的內容了。


我個(gè)人更喜歡用“信噪比”= 信號/(信號+噪音) 這個(gè)概念去理解,因為通過(guò)可視化傳達的信息不僅僅是數據,還有業(yè)務(wù)洞察,像觀(guān)點(diǎn)、結論性的信息往往需要用文字來(lái)呈現的也是至關(guān)重要。不過(guò)無(wú)論使用哪個(gè)詞,最終的目的都是突出傳達“信息”部分,去除那些干擾的“噪音”。


因此,圖表中的數據墨水占比越多,那么該圖表的冗余信息就越少,信息傳遞效果就越好。所以,在創(chuàng )建圖表和圖形時(shí),我們的目標應該是在合理范圍內最大化數據墨水比。


二、圖表元素詳解


1.標題


一個(gè)明確、相符的標題可以迅速讓讀者理解圖表要表達的內容。通常圖表的標題是根據圖表所需要表達的內容決定的,大多數小伙伴可能認為命名沒(méi)有太多問(wèn)題。但當這個(gè)圖表的結論是單一且唯一的時(shí)候,建議在概括圖表內容的標題中加入結論性的信息點(diǎn)。這樣能減少讀者誤解你的意圖的可能,而且能夠確保他們將注意力集中于你想著(zhù)重強調的數據上 。


2. 軸(坐標軸)


2.1 定義


軸是能夠使每個(gè)數組在維度空間內找到映射關(guān)系的定位系統,更偏向數學(xué)/物理概念。換句話(huà)說(shuō),軸的功能像是把可視化對象置于共同的基準上,再以標尺進(jìn)行數值量測。在數據可視化中,一般存在于笛卡爾坐標系(直角坐標系)和極坐標系中。對軸進(jìn)行「原子」要素的拆分,我們可以得到以下幾種元素,分別為:軸線(xiàn)、軸刻度線(xiàn)、軸標簽、軸標題(單位)以及網(wǎng)格線(xiàn)。


2.2 分類(lèi)


根據對應變量是連續數據還是離散數據,軸可以分為:分類(lèi)軸,時(shí)間軸,連續軸。


2.3 使用建議


2.3.1 軸線(xiàn)


軸線(xiàn)一般只考慮是否顯示,結合上面所講的數據墨水比,在有網(wǎng)格線(xiàn)的情況下,柱狀圖/折線(xiàn)圖會(huì )隱藏 y 軸線(xiàn),條形圖則是隱藏 x 軸線(xiàn),以達到信息降噪,突出視覺(jué)重點(diǎn)的目的。


2.3.2 軸刻度線(xiàn)


軸刻度線(xiàn)是軸線(xiàn)上的小線(xiàn)段, 可以提供數值標簽在坐標軸上的明確位置。軸刻度線(xiàn)有3種類(lèi)型,分別為:置內、置中(即交叉方式)、置外。但刻度應置于數值坐標軸外側, 不建議刻度采用置中或置內方式顯示。

軸刻度線(xiàn)的使用就是加強映射關(guān)系,快速的對應到數據點(diǎn)。分類(lèi)軸較多出現在柱狀、條形中,對于映射有天然的對應關(guān)系,故在分類(lèi)軸中習慣隱藏軸上的刻度線(xiàn)。


2.3.3 網(wǎng)格線(xiàn)


網(wǎng)格線(xiàn)是用來(lái)輔助圖表優(yōu)化映射關(guān)系的。使用網(wǎng)格線(xiàn)可以增加數據的可閱讀性,網(wǎng)格線(xiàn)提供了兩種功能:一是延伸數值刻度至可視化對象中,以便觀(guān)察數據值之大??;二是增加可視化對象之間的比較基礎 ,利于比較。


網(wǎng)格線(xiàn)一般跟隨值域軸的位置單向顯示,柱狀圖采用水平網(wǎng)格,條形圖采用垂直網(wǎng)格。在使用網(wǎng)格線(xiàn)時(shí),應該注意遵從主次原則,以軸線(xiàn)為主,網(wǎng)格線(xiàn)為輔,樣式上可采用實(shí)線(xiàn)或者虛線(xiàn)。避免顏色過(guò)重,不要使用純黑或者純白,在視覺(jué)層級上不能搶了圖表中的信息。



2.3.4 軸標題 



軸標題(單位)主要用于說(shuō)明定義域軸、值域軸的數據含義。當可視化圖表的其他部分內容(標題、圖例、軸標簽等)已經(jīng)能充分表達數據含義,根據奧卡姆剃刀定律,可以略去軸標題,近一步增大數據油墨比,精簡(jiǎn)畫(huà)面元素。


2.3.5 軸標簽 


軸標簽的設計較為復雜,涉及到的細節點(diǎn)比較多。這里將圍繞直角坐標系的X軸和Y軸這兩個(gè)方向進(jìn)行討論。


X軸標簽

x 軸標簽的設計重點(diǎn)在顯示規則上,在可視化圖表設計中,我們常常會(huì )碰到軸標簽內容過(guò)長(cháng)的情況,當空間有限時(shí),軸標簽會(huì )重疊在一起。如何處理此類(lèi)問(wèn)題,這里根據軸的不同類(lèi)型給了對應的解決方案 。


A. 連續/時(shí)間軸標簽


在連續軸和時(shí)間軸中,我們可以利用抽樣顯示的手段來(lái)優(yōu)化軸標簽重疊的問(wèn)題。這里不推薦使用旋轉來(lái)縮減寬度。一方面從美觀(guān)度上,旋轉可能會(huì )破壞界面整體協(xié)調。另一方面,連續/時(shí)間軸并不需要顯示所有的軸標簽,參考格式塔中的[連續性原理],盡管軸標簽未能完全展示,但用戶(hù)會(huì )在腦海中把缺失的部分補齊,軸標簽仍然會(huì )像連續著(zhù)的一樣。


B. 分類(lèi)軸標簽


在分類(lèi)軸中,由于標簽與標簽之間并沒(méi)有緊密的邏輯關(guān)聯(lián)關(guān)系。若采用抽樣規則,隱藏了一些標簽,則加大了用戶(hù)對圖表信息的提取難度,這是我們不想看到的。對于分類(lèi)軸,這里建議通過(guò)標簽旋轉或轉換成其他圖表(條形圖)來(lái)縮減寬度。


Y軸標簽


y 軸標簽的設計重點(diǎn)在標簽數量、取值范圍和數據格式上。標簽顯示區域一般根據最長(cháng)標簽寬度自適應縮放。如果數組是固定的,就寫(xiě)成固定寬度,節省圖表計算量,提高渲染速度。


A. 軸標簽的數量


軸標簽的數量不建議過(guò)多,太多的標簽必定導致橫向網(wǎng)格線(xiàn)變多,造成元素冗余,干擾圖形信息表達。根據 7±2 法則,Y軸標簽數量應盡量控制在這個(gè)范圍內。


B. 軸標簽的取值范圍


一般來(lái)說(shuō),y 軸標簽的取值應從 0 基線(xiàn)開(kāi)始,以恰當反映數值。展示被截斷的數據可能會(huì )誤導用戶(hù)做出錯誤的判斷。比如數據本身沒(méi)有那么起伏變化,處理上下限的顆粒度,把刻度拉長(cháng),一樣能顯得“長(cháng)勢喜人”。

從上面就能明白,在看圖表的時(shí)候千萬(wàn)不要被表面給欺騙,僅僅觀(guān)看柱狀圖的高低趨勢往往不能得出正確結論,需要注意坐標軸起始位置有沒(méi)有被人做過(guò)虛假處理。


但存在是有根源的,對于此類(lèi)的取值方式不做過(guò)多評價(jià)。這里主要想講一下我常用的取值方式:對于Y軸的上限即最大值根據實(shí)際數據進(jìn)行動(dòng)態(tài)計算。比如一排數字中最大的為1190,那么軸標簽最高位為1200;一排數字中最大的是1210,那么軸標簽最高位為1400。其中的1400和2100是根據軸上的分段數決定的。

但有些人對Y軸標簽的取值給出了如下建議:在折線(xiàn)圖中,取值一般保證圖形約占繪圖區域的2/3,或者將柱狀的高度控制在圖表高度的85%左右。

但我認為這種方式太刻意了,并且規則定制的比較細。但是得承認這樣子確認會(huì )顯的好看,做案例可以,做真實(shí)數據不行。因為考慮到實(shí)際數據有的時(shí)候會(huì )出現極限情況,比如有些特別大有些特別小,為了保證用戶(hù)能從圖表中準確地獲取信息,不應該為了美感而破壞了它的真實(shí)性。因此并不推薦用這種方式來(lái)取值。


C. 軸標簽的數據格式

關(guān)于Y軸標簽的數據格式,這里重點(diǎn)講一些比較容易忽視的設計細節。第一,標簽保留的小數位數保持統一,不要因為某些軸標簽是整數值,就略去小數點(diǎn)。

第二,正負向的 y 軸標簽,由于負值帶“-”符號,整個(gè) y 軸看起來(lái)會(huì )有視覺(jué)偏差,特別是雙軸圖的右 y 軸更明顯。這里建議正負向 y 軸給正值標簽帶上“+”,以達到視覺(jué)平衡的效果。


3. 圖例


3.1 定義


圖例是對圖形本身的概括,在圖表元素中屬于輔助內容。它提供讀者以對照的方式來(lái)理解可視化對象的項目歸類(lèi)。由映射圖形形狀和文本組成。


3.2 類(lèi)型


根據數據類(lèi)型不同,分為連續型圖例和分類(lèi)型圖例;根據狀態(tài)不同,圖例可以被設置為靜態(tài)或可交互態(tài)。


3.3 使用建議


3.3.1 數字文本取整


正如,倫斯勒理工學(xué)院的行為經(jīng)濟學(xué)家高拉夫杰恩(Gaurav Jain)所說(shuō):“數字有一種語(yǔ)言的力量,能給予人一種特殊的感覺(jué)。當我們使用具體的整數數字時(shí),人的衡量會(huì )減少。這種行為沒(méi)有明顯的原因?!?/p>


當人們的大腦在處理不以零結尾的不規則數字時(shí),需要更多的腦力來(lái)處理,加大了獲取信息的難度。因此在使用數字時(shí),應該考慮這種偏好,傾向于一些取整的數字。同樣的,這不僅僅適用于圖例中的數字,同樣適用于坐標軸上下限的數字。


3.3.2水平圖例和垂直圖例


帶有連續性的傾向于使用水平圖例,因為更符合人們的閱讀習慣;帶有分類(lèi)屬性的傾向于使用豎直圖例,圖例的右邊可放置更長(cháng)的文本。


3.3.3 圖例的位置


默認把圖例放在左上角去做一個(gè)通用的方案看起來(lái)沒(méi)毛病。但考慮到人的視覺(jué)動(dòng)線(xiàn)是從上至下,從左到右。這里有一個(gè)更好的做法:縮短用戶(hù)對照圖例看圖形的本能路徑,可以提升對信息的獲取效率。如下圖所示:


3.3.4 多折線(xiàn)圖采用跟隨圖例


當我們在制作多折線(xiàn)圖時(shí),經(jīng)常會(huì )出現個(gè)數據系列之間相互交錯的情形,并使得各種數據標記與之前的出現順序不一致,即與圖例排列順序不同。因此用戶(hù)的眼睛必須在圖例與折線(xiàn)之間進(jìn)行連連看,最佳的做法是采用跟隨圖例形式,去標識出折線(xiàn)所屬于的維值信息,這樣會(huì )更直觀(guān)有效。


4. 標簽


4.1 定義


在圖表中,標簽是對當前的一組數據進(jìn)行的內容標注。包括數據點(diǎn)、拉線(xiàn)、文本數值等元素,根據不同的圖表類(lèi)型選擇使用。


4.2 使用建議


4.2.1 標簽的顯示策略


在繪制的圖表的時(shí)候,我們傾向將標簽直接打在圖形外,但在「堆疊類(lèi)」圖表中,標簽會(huì )顯示在圖形內。這樣做會(huì )有個(gè)后果,標簽的文本和圖形經(jīng)常需要交疊展示,所以可讀性需要足夠良好,所以通過(guò)對 HS 值的判斷,決定文字的顏色是否需要反思。這樣對比度就在可控范圍內,不會(huì )出現可讀性的問(wèn)題。有時(shí),還需要增加描邊,讓標簽更清晰。

當數據特別多并且密的時(shí)候會(huì )造成全部標簽擠在一起的情況。在標簽重疊時(shí),采用動(dòng)態(tài)計算的抽樣顯示方式,自動(dòng)隱藏其中一個(gè),同時(shí)當 Hover 圖表時(shí),顯示被隱藏的對應的數據。這樣保證了圖表的清晰度,也保證了信息的完整性。


5. 提示信息


5.1 定義


提示信息一般是tap或者hover的時(shí)候,圖表以交互的方式吐出該位置的數據,幫助用戶(hù)更深入的了解數據。一般由視覺(jué)標記圖形,文本標簽,數值標記這3中元素構成。


5.2 類(lèi)型


提示信息的展現形式由4種。按不同的圖表類(lèi)型,分為懸浮、固定位置、固定在軸上、固定在圖形上。


6. 圖形


6.1 定義


人類(lèi)從圖形中獲取信息的效率遠高于文本,可以說(shuō)如今人類(lèi)早已進(jìn)入了讀圖時(shí)代。圖形是統計圖表的視覺(jué)通道在形狀上映射的視覺(jué)展現,是圖表的必備元素,承載著(zhù)數據背后蘊含的信息。按照組件原子化的思路來(lái)定義現在千奇百怪的圖表,大致可以分為六種基礎樣式:折線(xiàn),面積,散點(diǎn),氣泡,餅/環(huán),柱形,條形。


6.2 使用建議


這里主要想重點(diǎn)講一下,如何通過(guò)設計來(lái)強化圖表信息的表達,以便簡(jiǎn)化用戶(hù)獲取信息的成本。關(guān)于具體某個(gè)圖表的制作規范和運用場(chǎng)景,會(huì )在之后的文章中提及。


6.2.1  改變顏色 - 明暗/深淺/色彩對比


通過(guò)明暗對比、顏色對比以及色彩對比等手段可以有效的區分信息,在視覺(jué)層級上也是明顯的處理了視覺(jué)噪音,便于用戶(hù)區分信息。


6.2.2 添加標注


通過(guò)添加標注,人為去干預信息的表達,多用于一前一后的標識,便于用戶(hù)識別信息。


三、選擇合適的圖表


我們做數據分析的有句話(huà)叫“一圖勝千言”,圖表是展現數據的一種重要展現形式,選對了圖表就能幫助我們更加快速、直觀(guān)的傳達數據信息。


那如何挑選合適的圖表呢?在我看來(lái)大致分為三步:

1. 確定核心內容:明確要用圖表傳達的核心信息;

2.判斷比較關(guān)系:判斷數據之間的比較類(lèi)型(如占比、數量、趨勢等);

3.選擇圖表類(lèi)型:選擇對應含義的圖表(如餅圖、柱狀圖、折線(xiàn)圖等)。

很多朋友在判定和選擇圖表類(lèi)型時(shí)會(huì )不知所措,但其實(shí)你只需要記住一句話(huà):決定圖表形式的不是數據,而是你要傳達的信息。


1. 確定核心內容


同一組數據用不同的角度看,有不同的主題,比如下面這組數據:

從另一個(gè)角度看同樣是5月份的數據,你還可能會(huì )將側重點(diǎn)放在每個(gè)產(chǎn)品占銷(xiāo)售額的百分比上。那你的圖表主題應該是“5月份,產(chǎn)品 A 占公司產(chǎn)品總銷(xiāo)售額的比例位居首位”。


綜上所述,選擇合適圖表的關(guān)鍵,最初也是最重要的,就是明確要用圖表傳達的核心信息。


2. 判斷比較關(guān)系


在實(shí)際工作中需要用圖表反映數據的場(chǎng)景五花八門(mén),但按數據關(guān)系分類(lèi)無(wú)非以下幾種情況,給大家簡(jiǎn)單舉幾個(gè)例子:

  • “預計在今后 10 年多的時(shí)間里,銷(xiāo)售額將增長(cháng) ”對應的關(guān)系為時(shí)間趨勢;

  • “雇員的最高工資額在 30000 到 35000 美元之間 ”對應的關(guān)系為頻率分布;

  • “汽油并不是牌子越響價(jià)格越高其性能就越好”對應的關(guān)系為相關(guān)性;

  • “9 月份里,6 個(gè)區域的營(yíng)業(yè)額大致相同”對應的關(guān)系為排名對比;

  • “銷(xiāo)售部經(jīng)理在他的領(lǐng)域內只花費了他 15% 的時(shí)間”對應的關(guān)系為占比。


3. 選擇圖表類(lèi)型


國外專(zhuān)家Andrew Abela曾整理了一份圖表類(lèi)型選擇指南圖示(如下圖),他把數據的關(guān)系分成了4種類(lèi)型,幫助我們去選出合適的圖表來(lái)呈現。

但其實(shí)結合我自己的經(jīng)驗,考慮到日常企業(yè)的數據分析場(chǎng)景,圖中有些圖表使用頻率是非常低的。所以我參考了上圖的部分內容,對其進(jìn)行了總結,替換掉了一些圖表并對其進(jìn)行了美化,總體上我認為這是會(huì )更適合商務(wù)圖表展示,而且會(huì )更接地氣,適合大家參考使用。

undefined


四、常見(jiàn)的可視化圖表


1. 折線(xiàn)圖


1.1 定義


折線(xiàn)圖是通過(guò)線(xiàn)條的波動(dòng)(上升或下降)來(lái)顯示連續數據隨時(shí)間或有序類(lèi)別變化的圖表,常用于反映數據隨著(zhù)時(shí)間推移而產(chǎn)生的變化趨勢。


2.2 適用場(chǎng)景


橫軸為連續類(lèi)別(如時(shí)間)且注重變化趨勢、預測,適用于折線(xiàn)圖。


舉個(gè)例子:比如想看2020年上半年商品的營(yíng)業(yè)額情況,并對走勢做一個(gè)分析。由于每個(gè)月份的商品營(yíng)業(yè)額相關(guān)的,它們代表一種數據在不同時(shí)間下的數據值,因此我們可以用折線(xiàn)圖將它們連接起來(lái)。


但如果想看2020年上半年北京、上海、廣州、深圳、南京五個(gè)省份的營(yíng)業(yè)額情況,由于每個(gè)省份的營(yíng)業(yè)額是不相關(guān)的,所以我們不能隨便用折線(xiàn)圖來(lái)替代柱狀圖。

undefined


2.3 使用建議


2.3.1 使用合適的時(shí)間間隔,使鋸齒狀的線(xiàn)條平滑


如果折線(xiàn)圖上下浮動(dòng)過(guò)于劇烈,那么可以嘗試拉長(cháng)時(shí)間間隔,比如不每天采樣而以周為單位來(lái)采樣。用戶(hù)不太原因去閱讀鋸齒狀的線(xiàn)條,或者說(shuō)他們不會(huì )喜歡這樣的圖表。


但是如果有強需求說(shuō)是一定要在某個(gè)范圍,這條略過(guò)。

undefined


2.3.2  善用數據點(diǎn)標記、特殊標記


當有些特定的數值特別重要時(shí),我們可以在線(xiàn)條上標注出他們,但全部標清數據點(diǎn)在大多數情況下標記出來(lái)的意義不大,從視覺(jué)上來(lái)看會(huì )顯得非?,嵥?。


2.3.3 分清主次關(guān)系,加強數據感知


若對比數據較多,為了避免信息繁雜??刹捎脤?shí)線(xiàn)的強弱和色彩的對比來(lái)區分主次內容,讓用戶(hù)更關(guān)注在主折線(xiàn),獲取主數據的波動(dòng)感知。


知識擴展:折線(xiàn)圖與曲線(xiàn)圖的區別


折線(xiàn)圖:更關(guān)注于點(diǎn)的數據,相對短的一段時(shí)間數據隨時(shí)間變化的趨勢;

曲線(xiàn)圖:更關(guān)注點(diǎn)構成的線(xiàn)點(diǎn)數據,一段時(shí)間內整體數據隨時(shí)間變化的趨勢。

曲線(xiàn)圖是折線(xiàn)圖中的一種,當圖表數據點(diǎn)過(guò)于密集時(shí),使用曲線(xiàn)圖更能表達數據隨時(shí)間變化的趨勢、周期性。


2. 面積圖


2.1 定義


面積圖又叫區域圖,是一種隨有序變量的變化,反映數值變化的統計圖表,原理與折線(xiàn)圖相似。它在折線(xiàn)圖的基礎上多了一個(gè)面積概念,填充的區域可以表示“累積”的含義(當X軸為連續的數值時(shí))。


2.2 適用場(chǎng)景


當注重隨時(shí)間的趨勢變化和累計的值時(shí),適用于面積圖。


例如:想要查看今年10月和去年10月每日的商品營(yíng)業(yè)額走勢,并對整月?tīng)I業(yè)額進(jìn)行比較,這時(shí)就可以采用面積圖。但當自變量不是順序性的變量,則不適合用面積圖。


2.3 使用建議


2.3.1 使用透明填充色



透明度可以很好的幫助使用者觀(guān)察不同序列之間的重疊關(guān)系,沒(méi)有透明度的面積會(huì )導致不同序列之間相互遮蓋減少可以被觀(guān)察到的信息。


2.3.2 當X軸數據較少,考慮其他圖表


當數據值相距很遠時(shí),區域是模糊不清的,此時(shí)不太適合使用面積圖展示。


如下方示例雖然仔細分析能確定只展示了兩個(gè)類(lèi)別,乍一看,很可能會(huì )誤以為圖表上顯示三種不同的顏色,但使用分組柱狀圖就可以很好解決這個(gè)問(wèn)題。



2.3.3 不要超過(guò)4個(gè)數據系列


面積圖只適合展現少量的數據,最多建議不要超過(guò)四個(gè)類(lèi)別,否則就會(huì )導致非常難以識別。因此在多個(gè)類(lèi)別下,要盡量避免使用面積圖,采用相似圖表來(lái)表示,比如折線(xiàn)圖。


3.堆疊面積圖


3.1 定義


堆疊面積圖與面積圖類(lèi)似,都是在折線(xiàn)圖的基礎上,將折線(xiàn)與自變量坐標軸之間區域填充起來(lái)的統計圖表。


唯一的區別是堆疊面積圖有多個(gè)數據系列,它們一層層的堆疊起來(lái),每個(gè)數據系列的起始點(diǎn)是上一個(gè)數據系列的結束點(diǎn)。


3.2 適用場(chǎng)景



適用于觀(guān)察多變量隨時(shí)間的變化情況,且既能看到整體趨勢又能看到各變量的構成情況。


3.3 使用建議


3.3.1 盡量不要對Y軸進(jìn)行裁切


為了保證數據傳遞的準確性,在適用堆疊面積圖時(shí),盡量不要對Y軸進(jìn)行裁剪。

undefined


3.3.2 不要超過(guò)7個(gè)數據系列


當數據系列過(guò)多時(shí),往往造成難以觀(guān)察,所以建議使用堆疊面積圖時(shí)數據系列最好不要超過(guò)7個(gè)。


3.3.3 變化量大的數據置于上方


建議堆疊面積圖中把變化量較大的數據放在上方,變化量較小的數據放在下方會(huì )獲得更加的展示效果。

3.3.4 不適合帶有負值的數據系列


堆積面積圖要展示部分和整體之間的關(guān)系,所以不能用于包含負值的數據的展示。


4.柱狀圖


4.1 定義


柱狀圖,是一種使用矩形條,對不同類(lèi)別進(jìn)行數值比較的統計圖表。使用垂直或水平的柱子的長(cháng)短對比數值大小,其中一個(gè)軸表示需要對比的分類(lèi)維度;另一個(gè)軸代表相應的數值。


在柱狀圖上,分類(lèi)變量的每個(gè)實(shí)體都被表示為一個(gè)矩形(通俗講即為“柱子”),而數值則決定了柱子的高度??v向柱狀圖的柱是垂直方向的,如圖:

undefined

橫向柱狀圖的柱是水平方向的,又稱(chēng)條形圖,如圖:


4.2 適用場(chǎng)景


柱狀圖最適合對分類(lèi)的數據進(jìn)行比較,尤其是當數值比較接近時(shí),由于人眼對于高度的感知優(yōu)于其他視覺(jué)元素(如面積、角度等),因此使用柱狀圖更加合適。


如下圖所示,5組數據的數值很接近,若采用餅圖,這無(wú)法直觀(guān)的進(jìn)行比較,右邊的柱狀圖則能更好地傳遞圖表信息。


4.3 使用建議


4.3.1 使用合適的寬度去適配柱條的寬度



當柱子太窄時(shí),用戶(hù)的視覺(jué)可能會(huì )集中在兩個(gè)柱中間的負空間,而這里是不承載任何數據的。寬度推薦使用在1/2 柱寬到 1 柱寬之間,但也要視情況而定。


4.3.2 不推薦采用全圓角


保證柱形圖有精確的圓角,以確保柱形頂部精確測量柱形的長(cháng)度;全圓角則有可能歪曲可視化圖表的表達。


4.3.3 避免適用過(guò)多的顏色


柱形圖一般比較一組分類(lèi)數據,柱子的高低已經(jīng)傳遞了相關(guān)信息,不必通過(guò)顏色來(lái)區分,所以建議使用相同的顏色或同一顏色的不同色調,過(guò)多的顏色會(huì )增加理解成本。


如果需要強調某個(gè)數據時(shí),可以使用對比色或者變化色調來(lái)突出顯示有意義的數據點(diǎn)。


4.3.4 采用有序排列,軸標簽右對齊


對多個(gè)數據系列排序時(shí),如果不涉及到日期等特定數據,最好能符合一定的邏輯用直觀(guān)的方式引導用戶(hù)更好的查看數據。


可以通過(guò)升序或降序排布,例如按照數量從多到少來(lái)對數據進(jìn)行排序,也可以按照字母順序等來(lái)排布??傊?,按照邏輯排序可以一定程度上引導人們更好地閱讀數據。


4.3.5 標簽直接顯示在柱體上


條形圖還可以通過(guò)省略橫軸和縱軸,并直接在柱子上表明數值,來(lái)降低數據墨水比,進(jìn)一步提高信息的獲取效率。


5.堆疊柱狀圖


5.1 定義


堆疊柱狀圖(Stacked Column Chart),又稱(chēng)堆疊柱形圖,是一種用來(lái)分解整體、比較各部分的圖表。


它是柱狀圖的擴展,不同的是,柱狀圖的數據值為并行排列,堆疊柱圖則是一個(gè)個(gè)疊加起來(lái)的。它可以展示每一個(gè)分類(lèi)的總量,以及該分類(lèi)包含的每個(gè)小分類(lèi)的大小及占比,并且這些子類(lèi)別一般用不同的顏色來(lái)指代。


5.2 適用場(chǎng)景


對比不同類(lèi)別數據的數值大小,同時(shí)對比每一類(lèi)別數據中,子類(lèi)別的構成及大小。


例如下圖顯示的是每種化妝品在各個(gè)產(chǎn)品的銷(xiāo)售情況,通過(guò)堆疊柱狀圖,我們可以很清晰低對比同一種化妝品到底在哪個(gè)城市銷(xiāo)量更好。


5.3 使用建議


5.3.1 縱向堆疊柱狀圖 – 最多不要超過(guò)6個(gè)數據



堆疊柱狀圖最好的展示效果是每個(gè)組只包含兩到三個(gè)類(lèi)別,最多不要超過(guò)6個(gè),因為太多的數據系列會(huì )很容易讓人眼花繚亂, 如下圖:


5.3.2 數值標簽居中對齊


堆疊條狀圖的數值建議在圖形之間,居中對齊,在圖形左側容易產(chǎn)生誤解。


5.3.3 避免用堆疊柱狀圖展示包含負數的數據


由于要分析部分數據在整體中的占比,避免用堆疊柱狀圖展示包含負數的數據。因為柱子的高度必須為正數,有負數則無(wú)法直觀(guān)顯示在圖上。


5.3.4 數據標簽特別長(cháng)時(shí),采用水平堆疊柱狀圖


大多數的堆疊柱狀圖都是垂直繪制的,但是如果你的數據標簽特別長(cháng)時(shí),考慮更好地展示效果,可以選擇使用水平堆疊的方式。


6. 分組柱狀圖


6.1 定義


分組柱狀圖,又叫聚集柱狀圖。跟柱狀圖類(lèi)似,使用柱子的長(cháng)短來(lái)映射和對比數據值。每個(gè)分組中的柱子使用不同的顏色或者相同顏色不同透明的方式區別各個(gè)分類(lèi),各個(gè)分組之間需要保持間隔。


6.2 適用場(chǎng)景


對比不同分組內相同分類(lèi)的大小,對比相同分組內不同分類(lèi)的大小。其中,分組個(gè)數不要超過(guò) 12 個(gè),每個(gè)分組下的分類(lèi)不要超過(guò) 6 個(gè)。


6.3 使用建議



6.3.1 數據的數值差異大,建議使用雙軸


分組柱狀圖適合比較多組數值差異不大的數據,比如,對于要同時(shí)查看一個(gè)數值和百分比的時(shí)間趨勢,雙軸圖就派上大用場(chǎng)了。


為了瀏覽起來(lái)更直觀(guān),建議用柱圖來(lái)表示數值類(lèi)數據,用線(xiàn)圖來(lái)表示百分比。


6.3.2 組之間的間距 > 柱子之間的間距


分組柱狀圖強調組的概念,組是一個(gè)個(gè)重復單元。按照格式塔原理,每?jì)蓚€(gè)分組之間的間距要大于組內不同系列之間的間距,以免造成視覺(jué)上錯誤的歸類(lèi)和區分。


7. 雙向柱狀圖


7.1 定義


雙向柱狀圖是使用正向和反向的柱子顯示類(lèi)別之間的數值比較,其中分類(lèi)軸表示需要對比的分類(lèi)維度,連續軸代表相應的數值,分為兩種情況,一種是正向刻度值與反向刻度值完全對稱(chēng);另一種是正向刻度值與反向刻度值反向對稱(chēng),即互為相反數。


同樣的,可分為垂直方和水平兩個(gè)方向,其中水平雙向柱狀圖又叫正負條形圖。


7.2 適用場(chǎng)景


雙向柱狀圖一般用于正負兩份相反數據的對比,例如一周內個(gè)人收入和支出的統計,其中收入為正數,支出為負數。


使用雙向柱狀圖可以很明確的對收入和支出做出對比,并能從單個(gè)系列中分析收入和支出的數值及波動(dòng)。

undefined


7.3 使用建議


7.3.1 不適合不含相反含義的數據


雙向柱狀圖多用于展示含相反含義的數據,因此要避免不具有正負含義的數據使用而造成的誤解。


如下圖人口統計圖表中使用雙向柱狀圖一邊繪制男性一邊繪制女性,只是單純的兩類(lèi)不同數據的對比,并不存在負數。這種情況將兩個(gè)數據序列繪制成一個(gè)分組柱狀圖是更合適的。


7.3.2 采用色彩差異較大的顏色


向柱狀圖正向和負向的數據具有對比性,因此一般選用差值較大的具有對比性的顏色,保證高效的獲取有效的信息。


8. 餅圖


8.1 定義


餅圖,或稱(chēng)餅狀圖,是一個(gè)劃分為幾個(gè)扇形的圓形統計圖表。在餅圖中,每個(gè)扇形的弧長(cháng)(以及圓心角和面積)大小,表示該種類(lèi)占總體的比例,且這些扇形合在一起剛好是一個(gè)完全的圓形。


8.2 適用場(chǎng)景


餅圖主要用于展現不同類(lèi)別數值相對于總數的占比情況,尤其是想要突出表示某個(gè)部分在整體中所占比例,且該部分所占比例達到總體的25%或50%時(shí),很適合用餅圖。


8.3 使用建議


8.3.1 分塊數量盡量控制在5個(gè)以?xún)?,最多不要超過(guò)9個(gè)


餅圖不適用于多分類(lèi)的數據,因為隨著(zhù)分類(lèi)的增多,每個(gè)切片的面積變小,視覺(jué)區分度隨之降低。


當數據類(lèi)別較多時(shí),我們可以把較小或不重要的數據合并成第五個(gè)模塊命名為”其它”。如果一定要保證數據的完整性和準確性,此時(shí)選擇柱狀圖或堆積柱狀圖或許更合適。


8.3.2 切片大小相似時(shí),建議采用柱狀圖或南丁格爾玫瑰圖


由于人類(lèi)對“角度”的感知力并不如“長(cháng)度”,在需要準確的表達數值(尤其是當數值接近、或數值很多)時(shí),餅圖常常不能勝任,因此當各類(lèi)別數據占比較接近時(shí)(如下左圖),我們很難對比出每個(gè)類(lèi)別占比的大小。


此時(shí)建議選用柱狀圖或南丁格爾玫瑰圖(如下右圖)來(lái)獲取更好的展示效果。


8.3.3 正確放置切片位置,提高圖表可讀性


大多數人視覺(jué)習慣是按照順時(shí)針和自上而下的順序去觀(guān)察。因此在繪制餅圖時(shí),建議從12點(diǎn)鐘開(kāi)始沿順時(shí)針右邊第一個(gè)分塊繪制餅圖最大的數據分塊,有效的強調其重要性。


其余的數據分塊有兩種建議:一種是按照數據大小依次順時(shí)針排列;另一種在12點(diǎn)鐘的左邊繪制第二大的分塊,其余的分塊按照逆時(shí)針排列,最小的分塊放在底部。


讓用戶(hù)的視線(xiàn)焦點(diǎn)集中在上半部分,增強獲取信息的速度。


9. 環(huán)形圖


9.1 定義


環(huán)形圖,又叫做甜甜圈圖,是由兩個(gè)及兩個(gè)以上大小不一的餅圖疊在一起,挖去中間的部分所構成的圖形。


9.2 適用場(chǎng)景


適用于展示分類(lèi)的占比情況,與餅圖用法相似,但環(huán)圖相對于餅圖空間的利用率更高,比如我們可以使用它的空心區域顯示文本信息,比如標題等。

undefined


9.3 使用建議


9.3.1 不適用于分類(lèi)過(guò)多的場(chǎng)景


關(guān)于環(huán)圖不適用分類(lèi)過(guò)多的場(chǎng)景,否則閱讀會(huì )將很差(如下圖)。


可行的辦法:一是將一些不重要的變量合并為“其他”,避免扇區超過(guò)5個(gè);二是改用條形圖或者表格。尤其是,如果你想讓讀者清楚的閱讀到每一條數據,選用表格會(huì )更加直截了當。


9.3.2 不適用于分類(lèi)占比差別不明顯的場(chǎng)景


下圖中游戲公司的不同種類(lèi)的游戲的銷(xiāo)售量相近,所以不太適合使用環(huán)圖,此時(shí)可以使用柱狀圖。


10. 南丁格爾玫瑰圖


10.1 定義


南丁格爾玫瑰圖又名雞冠花圖、極坐標區域圖,盡管外形很像餅圖,但它是用半徑來(lái)反映數值大小的(而餅圖是以扇形的弧度來(lái)表示數據的)。


10.2 適用場(chǎng)景


對比不同分類(lèi)的大小,且各分類(lèi)值差異不是太大時(shí)。由于半徑和面積之間是平方的關(guān)系,視覺(jué)上,南丁格爾玫瑰圖會(huì )將數據的比例夸大。


10.3 使用建議


10.3.1 分類(lèi)過(guò)少的場(chǎng)景,直接用餅圖或者環(huán)圖來(lái)表示


如下圖展示一個(gè)班級男女同學(xué)的個(gè)數,這種場(chǎng)景下,使用餅圖或者環(huán)形圖比用南丁格爾玫瑰圖更合適。


10.3.2 希望精確的比較數值大小時(shí),推薦使用柱狀圖


南丁格爾玫瑰圖是將數值映射到半徑上,而扇形的面積和半徑是平方關(guān)系,因此視覺(jué)上看,數值的差異會(huì )被擴大。

因此,當數值差異較大、或者希望精確的比較數值大小時(shí),推薦使用柱狀圖。


下面使用南丁格爾玫瑰圖展示各個(gè)省份的人口數據,這種場(chǎng)景下使用玫瑰圖不合適,原因是在玫瑰圖中數值過(guò)小的分類(lèi)會(huì )非常難以觀(guān)察,推薦使用條形圖(橫向柱狀圖)。


11. 散點(diǎn)圖


11.1 定義


散點(diǎn)圖,又名點(diǎn)圖、散布圖、X-Y圖,它是將所有的數據以點(diǎn)的形式展現在平面直角坐標系上的統計圖表。它至少需要兩個(gè)不同變量,一個(gè)沿x軸繪制,另一個(gè)沿y軸繪制,每個(gè)點(diǎn)在X、Y軸上都有一個(gè)確定的位置。


11.2 適用場(chǎng)景


散點(diǎn)圖適用于分析變量之間是否存在某種關(guān)系或相關(guān)性。其中,相關(guān)性包含正相關(guān)(兩個(gè)變量值同時(shí)增加)、負相關(guān)(一個(gè)變量值增加另一個(gè)變量值下降)、不相關(guān)、線(xiàn)性相關(guān)、指數相關(guān)、U形相關(guān)等。


11.3 使用建議


11.3.1 盡量為散點(diǎn)圖添加趨勢線(xiàn)


在觀(guān)察兩個(gè)變量之間的關(guān)系時(shí),趨勢線(xiàn)是非常有用的,趨勢線(xiàn)的形狀走向解釋了兩個(gè)變量之間的關(guān)系類(lèi)型,還可以用來(lái)預測未來(lái)的值。但需要注意的是趨勢線(xiàn)最可只能使用兩條,以免干擾正常的數據的閱讀。


11.3.2 數據量過(guò)少時(shí),不推薦使用散點(diǎn)圖


散點(diǎn)圖只有有足夠多的數據點(diǎn),并且數據之間有相關(guān)性時(shí)才能呈現很好的結果。如果一份數據只有極少的信息或者數據間沒(méi)有相關(guān)性,那么繪制一個(gè)很空的散點(diǎn)圖和不相關(guān)的散點(diǎn)圖都是沒(méi)有意義的。


11.3.3 用顏色、形狀來(lái)區分不同的數據類(lèi)別


如果數據包含不同系列,可以給不同系列使用不同的顏色,例如藍色代表男性,紅色代表女性,并增加圖例標注出藍色代表的含義。


幫助用戶(hù)快速獲取相關(guān)信息。但要注意,要避免數據分類(lèi)過(guò)多的情況,過(guò)多的數據分類(lèi),會(huì )導致無(wú)法快速識別,失去可視化的意義和價(jià)值。


12. 氣泡圖


12.1 定義


氣泡圖是顯示變量之間相關(guān)性的一種圖表,由笛卡爾坐標系(直角坐標系)和大小不一的圓組成,可以看作是散點(diǎn)圖的變形。


與散點(diǎn)圖不同的是,氣泡圖是一個(gè)多變量圖,它增加了第三個(gè)數值即氣泡大小的變量,在氣泡圖中,較大的氣泡表示較大的值??梢酝ㄟ^(guò)氣泡的位置分布和大小比例,來(lái)分析數據的規律。


12.2 適用場(chǎng)景


一般而言,氣泡圖需要3個(gè)變量,其中2個(gè)決定了氣泡在笛卡爾坐標系中的位置(即x,y軸上的值),另外一個(gè)則通過(guò)氣泡的大小來(lái)表示。


當然,氣泡圖也可以容納更多維的數據,例如用第4個(gè)變量決定氣泡的顏色、透明度等。


特殊地,氣泡圖也可以用于二維數據,即y軸和氣泡大小使用同一維度的數據(y軸和氣泡大小的雙視覺(jué)編碼)。


這種情況下,相比于柱狀圖它能達到更美觀(guān)的目的。例如,下圖表示了2014年每個(gè)季度的銷(xiāo)售額。x軸代表時(shí)間,y軸和氣泡大小代表了銷(xiāo)售業(yè)績(jì)。


12.3 使用建議



12.3.1 氣泡的大小應體現為面積,而非半徑


繪制氣泡圖時(shí),需注意氣泡的大小是映射到面積而不是半徑或者直徑繪制的。


以下圖為例,如果兩個(gè)數值是1:2的關(guān)系,如果按照半徑1:2來(lái)繪制,那么實(shí)際的圓面積,將會(huì )是1:4的比例,這就夸大了數據之間的差異。


13. 雷達圖


13.1 定義


雷達又叫戴布拉圖、蜘蛛網(wǎng)圖。它是一種顯示多變量數據的圖形方法。通常從同一中心點(diǎn)開(kāi)始等角度間隔地射出三個(gè)以上的軸,每個(gè)軸代表一個(gè)定量變量,各軸上的點(diǎn)依次連接成線(xiàn)或幾何圖形。


每個(gè)變量都有一個(gè)從中心向外發(fā)射的軸線(xiàn),所有的軸之間的夾角相等,同時(shí)每個(gè)軸有相同的刻度,將軸到軸的刻度用網(wǎng)格線(xiàn)鏈接作為輔助元素,連接每個(gè)變量在其各自的軸線(xiàn)的數據點(diǎn)成一條多邊形。


13.2 適用場(chǎng)景


雷達圖對于查看哪些變量具有相似的值、變量之間是否有異常值都很有用。雷達圖表也可用于查看哪些變量在數據集內得分較高或較低,因此非常適合顯示性能(見(jiàn)下圖)。


同樣,雷達圖也常用于排名、評估、評論等數據的展示。


13.3 使用建議


13.3.1 多邊形數量控制在五個(gè)左右


一個(gè)雷達圖包含的多邊形數量是有限的,如果有五個(gè)以上要評估的事物,無(wú)論是輪廓還是填充區域,都會(huì )產(chǎn)生覆蓋和混亂,使得數據難以閱讀。


13.3.2 控制變量的數量


如果變量過(guò)多,也會(huì )造成可讀性下降,因為一個(gè)變量對應一個(gè)坐標軸,這樣會(huì )使坐標軸過(guò)于密集,使圖表給人感覺(jué)很復雜,所以最佳實(shí)踐就是盡可能控制變量的數量使雷達圖保持簡(jiǎn)單清晰。


14. 漏斗圖



14.1 定義


漏斗圖,形如“漏斗”,在開(kāi)始和結束之間由N個(gè)流程環(huán)節組成。


漏斗圖總是起始于100%的數量,并在各個(gè)環(huán)節依次減少,每個(gè)環(huán)節用一個(gè)梯形來(lái)表示,整體形如漏斗。與餅圖一樣,漏斗圖呈現的也不是具體的數據,而是該數據相對于總數的占比、漏斗圖不需要使用任何數據軸。


14.2 適用場(chǎng)景


漏斗圖適用于業(yè)務(wù)流程比較規范、周期長(cháng)、環(huán)節多的單流程單向分析,通過(guò)漏斗各環(huán)節業(yè)務(wù)數據的比較能夠直觀(guān)地發(fā)現和說(shuō)明問(wèn)題所在的環(huán)節,進(jìn)而做出決策。


其中,數據是要有序的,彼此之間有邏輯上的順序關(guān)系,階段最好大于3個(gè)。


14.3 使用建議


14.3.1 數據要邏輯上的順序關(guān)系


漏斗圖不適合沒(méi)有邏輯關(guān)系的數據,換句話(huà)說(shuō),如果數據不構成“流程”,那么不能使用漏斗圖。例如,想要展示不同游戲類(lèi)型的銷(xiāo)量對比,用漏斗圖就是不合適的。


14.3.2 梯形的高度、面積都是有意義的,不應想當然的篡改


漏斗圖作為一種統計圖表,漏斗圖的“長(cháng)相”,本質(zhì)上是由數據決定的。在傳達數據時(shí),漏斗圖是通過(guò)“面積”表示的,對于人眼來(lái)說(shuō),面積的識別本來(lái)就不太容易。


如果我們在制作漏斗圖時(shí),再人為的改變漏斗中每一個(gè)梯形的高度,那么識別起來(lái)就十分困難。以下圖為例,抹掉數字后,你幾乎不可能知道第一層是第二層的三倍。