2021-03-11
在日常(chang)(chang)工作(zuo)中,我們(men)經(jing)常(chang)(chang)會進行探(tan)索性數據分析(EDA),來(lai)查找不(bu)同數據間的模式、關(guan)(guan)系或(huo)異常(chang)(chang)情(qing)況,以便(bian)為(wei)我們(men)后續(xu)工作(zuo)提供參(can)考(kao)。散點圖就是我們(men)常(chang)(chang)用的工具之一(yi),它可以讓我們(men)看到兩個(ge)變量之間的相(xiang)關(guan)(guan)性。
然而實際作圖時,面對琳瑯滿目的工具,我們經常無所適從,當散點圖密密麻麻,雜亂無章時,我們也很難發現數據間的相關性和趨勢。那該怎么破呢?今天就給大家從Excel,Python,云平臺三個方面講解下分組散點圖,密度圖的繪制方法,大家可以選擇性查看對應內容,希望這篇分享能夠給大家在數據可視化精進的道路上有所幫助!
一、Excel:三(san)步實現分組散點圖
首先我們看(kan)看(kan)示例數據。如下(xia)圖所示,數據包含三列,第一列為分組(zu):A,B,C三個組(zu),第二列為變(bian)量:長(chang)度(Length)和深度(Depth)的值。主要目的是(shi)想了解下(xia)不同組(zu)的數據長(chang)度和深度分布(bu)相關情況。
為了(le)便于大(da)家練習,示(shi)例數據已上傳基(ji)因(yin)云平臺,大(da)家可以(yi)從 “基(ji)因(yin)云(//www.genescloud.cn/home)”,【云圖匯→組合(he)密(mi)度圖】 中下(xia)圖所示(shi)位置下(xia)載(zai)。
數據準備好了,接(jie)(jie)下來我(wo)們(men)開始EDA。按照(zhao)常規(gui)的(de)操作,【選(xuan)中數據→插入散點圖】,結果(guo)發現無論(lun)選(xuan)擇哪個類型的(de)散點圖,出現的(de)都只有Length和(he)Depth兩個系列的(de)值,并沒有按照(zhao)我(wo)們(men)想要的(de)分組進行展示。如何解決呢?接(jie)(jie)下來我(wo)們(men)就看(kan)看(kan),如何實現繪制分組散點圖。
1.1、插入空白散點圖
把鼠(shu)標放在空(kong)白單元格(重點(dian)(dian)!),依次點(dian)(dian)擊【插(cha)入→散點(dian)(dian)圖】,插(cha)入空(kong)白的散點(dian)(dian)圖。
1.2、為空白圖(tu)添加數據
【選擇空白圖(tu)(tu)(tu)表右(you)鍵→選擇數據】彈出【選擇數據源】窗口(kou),【圖(tu)(tu)(tu)例項(xiang)(系(xi)列(lie))】下點擊“添(tian)加(jia)”圖(tu)(tu)(tu)標,彈出【編(bian)輯(ji)數據系(xi)列(lie)】窗口(kou),輸入系(xi)列(lie)名稱,選擇好對應組別的(de) X Y軸(zhou)系(xi)列(lie)值,這里分別是Length,Depth對應的(de)值。
下圖演示的是添(tian)加A組的數(shu)據,類似操作依次選擇添(tian)加B,C組的數(shu)據。最終(zhong)可以看到三個組的數(shu)據用不同顏色進行了顯示。
從圖中可以(yi)看出,初始圖中存(cun)在很多的空白(bai),很多點堆積在一起(qi),也沒有(you)圖例,離(li)高質(zhi)量(liang)圖表還有(you)很大的差(cha)距呢(ni)。別急,接下來我(wo)們(men)進一步調整(zheng)下相關參數(shu)。
1.3、更改圖表樣式參(can)數
① 【右鍵圖表區(qu)域→設置(zhi)坐(zuo)標軸(zhou)格式】調整(zheng)XY軸(zhou)最小(xiao)值,本(ben)例分(fen)別為40,15,使得點充分(fen)展開。
② 【點擊(ji)圖表右上(shang)角的“+”圖標→勾選圖例(li)】 可以看(kan)到包含A,B,C三個組的圖例(li)出(chu)現(xian)了。
為了進一步美化,達到期刊發表(biao)級別要求,我們(men)還可以(yi)嘗(chang)試添加(jia)XY軸刻度(du),去掉多余(yu)的網格(ge)線,給(gei)圖例添加(jia)邊框,設置點的填(tian)充透(tou)明度(du)等使得(de)圖表(biao)更(geng)加(jia)簡潔,有層次感和(he)呼(hu)吸感。到此(ci),一個分組散點圖就完成(cheng)了!
操作(zuo)到這,小伙伴們可能會問了,要(yao)是(shi)我們的數據(ju)有(you)很多組,上(shang)述操作(zuo)就太(tai)費勁了,還有(you)上(shang)面的散(san)點(dian)圖很多數據(ju)點(dian)是(shi)重疊的,不(bu)能很好(hao)的查看數據(ju)實(shi)際(ji)分布密度情況。有(you)沒有(you)解決辦(ban)法呢(ni)?接下來(lai)向大家介紹python實(shi)現分組散(san)點(dian)圖和密度圖的繪(hui)制方(fang)法。
二、Python:一行命令實現(xian)分組散點密度圖
數(shu)據還是上面Excel所用的(de)數(shu)據,按(an)照如(ru)下(xia)命(ming)令,依(yi)次導(dao)入需要(yao)的(de)模塊(kuai)和數(shu)據,然后利用一條命(ming)令就(jiu)可以繪制出(chu)散(san)點(dian)密度圖!只(zhi)要(yao)一條命(ming)令!!!簡(jian)單的(de)是不是難(nan)以置(zhi)信!此(ci)處應該有掌聲!
接下(xia)來,小伙(huo)伴們(men)又要舉手了(le),上面的圖(tu)要是想調整下(xia)顏色,透明(ming)度,點的大小形(xing)狀,標題(ti)標簽樣式等(deng)如何實現呢(ni)?還有(you)上面的圖(tu)好像有(you)點重復,可不可以合并成(cheng)一個散(san)點圖(tu)和(he)密(mi)度分(fen)布圖(tu)呢(ni)?數(shu)據點密(mi)集(ji)還是看(kan)不清數(shu)據的密(mi)度分(fen)布情況。怎么辦,繼續(xu)寫(xie)代(dai)碼(ma),加入(ru)更多參數(shu)嗎?要是我不會(hui)寫(xie)代(dai)碼(ma)如何實現呢(ni)?為此,基(ji)因云平(ping)臺小伙(huo)伴們(men)特此精心(xin)研發了(le)一款“組合密(mi)度圖(tu)”,輕松解決(jue)上述所有(you)問題(ti)和(he)煩惱,趕緊的上車去學習使用吧......
三、基(ji)因云:一(yi)鍵出圖,百款樣式隨意調
進入基因云平臺(tai)【云圖匯→組合(he)密度圖】,在【圖表數(shu)據(ju)→文件上傳】頁面選擇數(shu)據(ju)文件后(hou),點擊“提交繪圖”,即可獲得漂亮的組合(he)密度圖。
進(jin)入(ru)【圖表調(diao)整(zheng)】頁面,可(ke)以實現核密度(du)圖、回歸密度(du)圖、直方密度(du)圖等多種(zhong)類型圖表的(de)隨意(yi)切換,分組(zu)的(de)任意(yi)刪減和排序,以及上百(bai)種(zhong)樣式的(de)自由(you)調(diao)整(zheng)。
趕(gan)緊來試(shi)(shi)一(yi)試(shi)(shi)吧,百度搜(sou)索(suo)“派(pai)森諾基因(yin)(yin)云”或者(zhe)直(zhi)接訪問//www.genescloud.cn/home,進(jin)入(ru)“云圖(tu)匯(hui)”搜(sou)索(suo)“組合(he)密度圖(tu)”嘗試(shi)(shi)體驗,并(bing)提寶貴(gui)建議至平臺消息中心-》反(fan)饋(kui)列表(biao),或者(zhe)發送(song)到郵箱:gc_support@doudin.cn。"派(pai)森諾基因(yin)(yin)云" 一(yi)直(zhi)持續上心上新,接下來會有更(geng)多好圖(tu)好工具陸續和大家(jia)見面,歡(huan)迎大家(jia)關注(zhu)并(bing)進(jin)行體驗。