2022-01-26
在任何一種測量中,無論(lun)所用儀器多(duo)么精密,方法多(duo)么完善(shan),實驗者多(duo)么細心,不同(tong)時間所測得的(de)(de)結果(guo)不一定完全相同(tong),會有一定的(de)(de)誤差(cha)和偏(pian)差(cha),嚴格來講(jiang),誤差(cha)是指實驗測量值(zhi)(zhi)(包括(kuo)直接(jie)和間接(jie)測量值(zhi)(zhi))與真值(zhi)(zhi)(客(ke)觀(guan)存在的(de)(de)準(zhun)確值(zhi)(zhi))之差(cha),偏(pian)差(cha)是指實驗測量值(zhi)(zhi)與平均(jun)值(zhi)(zhi)之差(cha)。
誤(wu)差(cha)分(fen)析(xi)的(de)(de)目的(de)(de)就是評定實驗數(shu)據(ju)的(de)(de)準(zhun)確性(xing),通過誤(wu)差(cha)分(fen)析(xi),認清誤(wu)差(cha)的(de)(de)來源及(ji)其影響,依據(ju)分(fen)析(xi)結(jie)果減小誤(wu)差(cha),提高(gao)數(shu)據(ju)的(de)(de)準(zhun)確性(xing)。
接下來,給大(da)家介紹一款,誤差分析的可視化(hua)工具。
圖1 誤差折線圖
正式介紹實現方法之(zhi)前,我(wo)們先來了解下誤差折線圖涉及的三個統計概念。
01、三個概念
1. 標準誤(Standard Error,SE)
標準誤差(簡稱標準誤)表示的是抽樣的誤差。因為從一個總體中可以抽取出無數多種樣本,每一種樣本的數據都是對總體的數據的估計。標準誤代表的就是當前的樣本對總體數據的估計,標準誤是由樣本的標準差除以樣本容量的開平方來計算的。從公式可以看到,標準誤更大的是受到樣本容量的影響。樣本容量越大,標準誤越小,那么抽樣誤差就越小,就表明所抽取的樣本能夠較好地代表總體。
se = sd(vec) / sqrt(length(vec))
2.標準差(Standard Deviation,SD)
標準偏差(簡稱標(biao)準差)是樣本平均數方差的開平方。它反映組內個體間的離散程度。標準差通常是相對于樣本數據的平均值而定的,通常用M±SD來表示樣本數據觀察值和平均值的差距。從公式可以看出,標準差會受到極值的影響。標準差越(yue)小(xiao),表明數據越聚集;標準差越大,表明數據(ju)越(yue)離散。
# R 語言實現(xian)函數sd <- sd(vec)sd <- sqrt(var(vec))
3. 置信區間(Confidence Interval,CI)
所謂置信區間就是分別以統計量的置信上限(xian)(xian)和置信下限(xian)(xian)為上下界構成的區間,是這(zhe)個參數的真實值在(zai)一定(ding)概(gai)率條件下落在(zai)測(ce)量結果周(zhou)圍的程度。
# R 語言實(shi)現alpha=0.05t=qt((1-alpha)/2 + .5, length(vec)-1) # tend to 1.96 if sample size is big enoughCI=t*se
02、平臺實現
首先,登入派(pai)森諾基因云(//www.genescloud.cn/), 進入【云圖匯→誤差折線(xian)圖】
1. 準備數據
準備圖(tu)2所示數(shu)據,數(shu)據文件第一列(lie)(lie)對(dui)應(ying)的(de)(de)是(shi)分組,第二列(lie)(lie)對(dui)應(ying)的(de)(de)是(shi)變量名稱,第三列(lie)(lie)對(dui)應(ying)的(de)(de)是(shi)變量數(shu)值。
圖2 數據示例
2. 提交繪圖
上(shang)傳數據后,一鍵提交繪圖即可(ke)。
圖3 上傳數據示例
3. 參數調整
1.圖表樣式(shi):添(tian)加網絡線和邊框。
圖4 添加網絡線和邊框示例
2.線條樣式:大家可以選擇(ze)添加平滑曲(qu)線(xian)(xian),讓線(xian)(xian)段更自然,更好(hao)看。同時也可以調整線(xian)(xian)條的(de)粗細,以及樣式。
圖5 平滑曲線示例
圖6 線條粗細和樣式示例
3.差(cha)值計算:可(ke)切換為標準(zhun)(zhun)誤(wu),標準(zhun)(zhun)差,置信(xin)度。多角(jiao)度描述(shu)圖表信(xin)息。
圖7 差值計算示例
更多新聞資訊,請關注派森諾官網