2021-11-11
在(zai)(zai)任(ren)何一(yi)種測(ce)量中,無論所用儀器多么精密,方法(fa)多么完善,實驗(yan)者多么細(xi)心(xin),不同時(shi)間所測(ce)得(de)的結果不一(yi)定完全(quan)相同,會有一(yi)定的誤差(cha)和偏差(cha),嚴格來講,誤差(cha)是指(zhi)實驗(yan)測(ce)量值(zhi)(包(bao)括直接和間接測(ce)量值(zhi))與真(zhen)值(zhi)(客觀(guan)存在(zai)(zai)的準確值(zhi))之差(cha),偏差(cha)是指(zhi)實驗(yan)測(ce)量值(zhi)與平均值(zhi)之差(cha)。
誤差分(fen)析(xi)的(de)目的(de)就是評定實驗數據(ju)的(de)準確性,通(tong)過誤差分(fen)析(xi),認清誤差的(de)來源及其影響,依據(ju)分(fen)析(xi)結果減小誤差,提高數據(ju)的(de)準確性。
接下來,給大家(jia)介紹一款,誤差分析的可視化工具(ju)。
圖(tu)(tu)1 誤(wu)差(cha)折(zhe)線(xian)圖(tu)(tu)
正(zheng)式介(jie)紹實現方法之(zhi)前,我們先來了解下誤(wu)差折線圖涉及(ji)的三個統計概念。
01、三個概念
1. 標準誤(Standard Error,SE)
標準誤差(簡稱標準誤)表示的是抽樣的誤差。因為從一個總體中可以抽取出無數多種樣本,每一種樣本的數據都是對總體的數據的估計。標準誤代表的就是當前的樣本對總體數據的估計,標準誤是由樣本的標準差除以樣本容量的開平方來計算的。從公式可以看到,標準誤更大的是受到樣本容量的影響。樣本容量越大,標準誤越小,那么抽樣誤差就越小,就表明所抽取的樣本能夠較好地代表總體。
se = sd(vec) / sqrt(length(vec))
2.標準差(Standard Deviation,SD)
標準偏差(簡稱標(biao)準差(cha))是樣本平均數方差的開平方。它反映組內個體間的離散程度。標準差通常是相對于樣本數據的平均值而定的,通常用M±SD來表示樣本數據觀察值和平均值的差距。從公式可以看出,標準差會受到極值的影響。標準差越(yue)小,表明數據越聚集;標準差越(yue)大(da),表明數據(ju)越離散。
# R 語言實現函數
sd <- sd(vec)
sd <- sqrt(var(vec))
3. 置信區間(Confidence Interval,CI)
所(suo)謂置信(xin)區(qu)(qu)間(jian)就是分別(bie)以統計量的(de)置信(xin)上(shang)(shang)限和置信(xin)下限為上(shang)(shang)下界構成(cheng)的(de)區(qu)(qu)間(jian),是這個參數的(de)真實值在(zai)(zai)一定概率條件下落(luo)在(zai)(zai)測量結果周圍的(de)程度(du)。
# R 語言實現
alpha=0.05
t=qt((1-alpha)/2 + .5, length(vec)-1) # tend to 1.96 if sample size is big enough
CI=t*se
02、平臺實現
首先,登入(ru)派森諾基因云, 進入(ru)【云圖(tu)匯→誤(wu)差折線圖】
1. 準備數據
準備圖(tu)2所示(shi)數據(ju),數據(ju)文件第一列(lie)(lie)對應的(de)(de)是(shi)分組,第二列(lie)(lie)對應的(de)(de)是(shi)變(bian)量名(ming)稱,第三列(lie)(lie)對應的(de)(de)是(shi)變(bian)量數值。
圖2 數據示例
2. 提交繪圖
上傳數據后,一鍵提交繪圖即可(ke)。
圖3 上傳數據示例
3. 參數調整
1.圖表樣式:添(tian)加(jia)網絡(luo)線(xian)和邊框。
圖4 添加網絡線和邊框示例
2.線條樣式:大(da)家可以(yi)選(xuan)擇添加平滑曲線,讓(rang)線段更自然,更好看。同時也可以(yi)調整線條的粗(cu)細,以(yi)及樣式。
圖5 平滑曲線示例
圖6 線條粗細和樣式示例
3.差(cha)值計(ji)算:可切換(huan)為標準誤,標準差,置信(xin)度。多(duo)角(jiao)度描述圖表信(xin)息(xi)。
圖7 差值計算示例
更多資訊,請關注派森諾官網