国产午夜精品无码一区二区,国产成人无码网站,日本少妇xxxx做受,欧美视频二区欧美影视,女人被躁到高潮嗷嗷叫游戏

首頁> 關于我們 >新聞中心>技術分享>新聞詳情

Nature:與R語言一起探索未知的世界

2015-01-15

        多年以來,遺傳學家Helene Royo一直都使用商業化的計算機軟件完成她的數據分析工作。她提取正在發育中的小鼠精子細胞的DNA進行試驗分析,然后用一種名叫GeneSpring的軟件對試驗結果進行研究。“作為一名科學家,我希望對我正在開展的工作有一個全面的了解。但是這種軟件分析滿足不了我的需求,使用這種軟件時我只能按按電腦鍵盤,最后得到一個結果而已。” Royo這樣介紹道。Royo的主要工作是比較不同染色體的遺傳活性(genetic activity),隨著她的工作不斷的深入,她逐漸意識到,商業化的計算機軟件已經無法滿足她在科研工作中對數據處理的需求了。

        在(zai)(zai)Royo剛剛開(kai)始做博后的(de)時(shi)候,她拿到(dao)了(le)一(yi)份(fen)基因組測序試(shi)驗的(de)結果,當時(shi)她面臨一(yi)個選擇,將這(zhe)些數據(ju)(ju)交給相(xiang)關(guan)的(de)專家(jia)進(jin)行分析(xi),或者是(shi)自己學(xue)著去(qu)分析(xi)這(zhe)些數據(ju)(ju)。她選擇了(le)后者,開(kai)始學(xue)習如何(he)使用免費的(de)開(kai)源統計(ji)軟(ruan)件(jian)R來進(jin)行數據(ju)(ju)分析(xi)。在(zai)(zai)Royo供職的(de)瑞士Friedrich Miescher生物醫(yi)學(xue)研(yan)究所(Friedrich Miescher Institute for Biomedical Research in Basel, Switzerland)里(li),R軟(ruan)件(jian)已經被用于常規的(de)數據(ju)(ju)統計(ji)工作。但是(shi)Royo跟隨(sui)的(de)卻是(shi)一(yi)個更大的(de)潮流,很多學(xue)術(shu)科(ke)研(yan)機構都在(zai)(zai)嘗(chang)試(shi)擺脫商(shang)業化的(de)數據(ju)(ju)分析(xi)軟(ruan)件(jian),而R軟(ruan)件(jian)就(jiu)是(shi)一(yi)個很好的(de)選擇。

        R軟件(jian)之所以(yi)如此受歡迎,除了因為它是免費軟件(jian)之外,還有一個原(yuan)因就是因為它能以(yi)不同的(de)面(mian)目面(mian)對不同的(de)使(shi)用者。首先,也是重要的(de)一點,需要用命(ming)令(ling)行形式進行輸入的(de)編(bian)程(cheng)(cheng)語(yu)言(yan)對于(yu)非程(cheng)(cheng)序(xu)(xu)員而(er)言(yan)就是噩夢。但是R語(yu)言(yan)的(de)初學者就可以(yi)越(yue)過(guo)這(zhe)些復雜的(de)編(bian)程(cheng)(cheng)步(bu)驟,使(shi)用預(yu)設的(de)一套軟件(jian),這(zhe)里面(mian)包含有各種統計分(fen)析命(ming)令(ling)和(he)圖形化的(de)數(shu)據(ju)形式。這(zhe)樣一些預(yu)制的(de)軟件(jian)就在“黑匣(xia)子(zi)”般的(de)商(shang)業化的(de)軟件(jian)與專業的(de)程(cheng)(cheng)序(xu)(xu)員之間建起了一個中間地帶。“R語(yu)言(yan)讓一切都變(bian)得非常簡單(dan),能夠滿(man)足我的(de)所有需要。” Rojo評價(jia)道。

        實際上,這也正是(shi)R語(yu)言(yan)的(de)開(kai)發者(zhe)在20世紀90年代開(kai)發這套(tao)工具時的(de)初衷和設計(ji)。新西蘭(lan)奧克蘭(lan)大(da)學(University of Auckland in New Zealand)的(de)統計(ji)學家Ross Ihaka和 Robert Gentleman對計(ji)算(suan)機非(fei)常感興趣,但是(shi)他們找不到(dao)能夠(gou)滿足他們需要(yao)的(de)軟件(jian)。于是(shi)他們決定自己開(kai)發一(yi)套(tao)軟件(jian),完成數據分析和統計(ji)的(de)工作。他們將這套(tao)工具命名(ming)為(wei)R語(yu)言(yan),有一(yi)部(bu)分原(yuan)因(yin)是(shi)因(yin)為(wei)他們倆名(ming)字(zi)的(de)第一(yi)個字(zi)母都是(shi)“R”,另外一(yi)部(bu)分原(yuan)因(yin)是(shi)因(yin)為(wei)當時有一(yi)套(tao)非(fei)常流行(xing)的(de)編程語(yu)言(yan)名(ming)叫“S”,所以他們取名(ming)“R”。

        在互聯網剛剛興(xing)起(qi)的(de)年代,R語(yu)言(yan)(yan)就(jiu)迅速獲(huo)得了(le)全世界需(xu)要統計學(xue)(xue)軟件(jian)(jian),同時也(ye)愿意貢(gong)獻自(zi)己想法的(de)科學(xue)(xue)家的(de)廣泛(fan)關注(zhu)。Ihaka和(he)Gentleman決定向所有人(ren)免(mian)費開放(fang)R語(yu)言(yan)(yan)的(de)源代碼。很(hen)快,擅長寫程序的(de)科學(xue)(xue)家就(jiu)利用(yong)R語(yu)言(yan)(yan)開發(fa)出(chu)了(le)各種軟件(jian)(jian)包和(he)預(yu)設的(de)程序,以滿(man)足(zu)各種不同的(de)工作需(xu)要。據Gentleman介紹(shao),他(ta)也(ye)可(ke)以為(wei)從事(shi)天文(wen)學(xue)(xue)研究(jiu)的(de)人(ren)寫一套(tao)程序,但(dan)是(shi)如果是(shi)天文(wen)學(xue)(xue)家自(zi)己來寫這套(tao)程序,那(nei)肯定會好用(yong)得多。

數學解決方案

        Karline Soetaert是(shi)(shi)(shi)荷蘭皇家海(hai)洋(yang)研究所(Royal Netherlands Institute for Sea Research in Yerseke)的(de)一(yi)(yi)名海(hai)洋(yang)學(xue)(xue)(xue)家,她(ta)在(zai)2008年時(shi)想到(dao)要(yao)對(dui)Scheldt河河口(kou)里的(de)浮游生(sheng)物(wu)(zooplankton)的(de)健康狀(zhuang)況做一(yi)(yi)番了解。Soetaert想要(yao)沿著Scheldt河測算一(yi)(yi)下這些浮游生(sheng)物(wu)的(de)死(si)亡速度,但(dan)是(shi)(shi)(shi)當時(shi)還(huan)沒有(you)相應(ying)的(de)R語(yu)言(yan)軟(ruan)件(jian)可供(gong)她(ta)使(shi)用(yong)(yong)。為了解決這個問(wen)題,她(ta)與另(ling)外(wai)兩名生(sheng)態學(xue)(xue)(xue)家使(shi)用(yong)(yong)R語(yu)言(yan)開發了deSolve軟(ruan)件(jian),這也(ye)是(shi)(shi)(shi)一(yi)(yi)款使(shi)用(yong)(yong)R語(yu)言(yan)編寫的(de),能夠(gou)解微(wei)分方程(differential equations)的(de)軟(ruan)件(jian)。“其他的(de)軟(ruan)件(jian)也(ye)可以解決這個問(wen)題,但(dan)是(shi)(shi)(shi)都(dou)非常貴,而且都(dou)不是(shi)(shi)(shi)開源軟(ruan)件(jian)。” Soetaert著重強調道。現(xian)在(zai),deSolve軟(ruan)件(jian)已經被(bei)廣(guang)泛使(shi)用(yong)(yong),比如流行病學(xue)(xue)(xue)家在(zai)構建感染(ran)性疾病模型(xing)時(shi),遺傳學(xue)(xue)(xue)家在(zai)研究基因調控網絡問(wen)題時(shi),新藥(yao)研發人員在(zai)了解藥(yao)物(wu)的(de)藥(yao)代動力(li)學(xue)(xue)(xue)問(wen)題時(shi)都(dou)會用(yong)(yong)到(dao)deSolve軟(ruan)件(jian)。

        2003年是R語言問世十周年的日子,當時科學家已經開發了200多款不同的R語言軟件,而且也出現了一批引用“R項目(R Project)”的文獻。到今天為止,已經誕生了6000多個R語言軟件包,可以用來解決各種各樣、遍布各個科研領域的問題。其中有些軟件,比如Bioconductor(參見go.nature.com/s7mq39)能夠幫助科研人員對人類基因組與荷蘭人基因組(Neanderthal genome)進行比對;有些軟件,比如IPMpack(參見go.nature.com/cyhons)能夠對種群增長(population growth)進行建模;有些軟件,比如quantmod(參見go.nature.com/jxqasm)能夠幫助科研人員預測產權價格(equity prices);還有些軟件,比如ggplot2(參見ggplot2.org)能夠幫助科研人員使用漂亮的圖片將數據結果展示出來。專業人士還能夠利用R語言,比如knitr()寫出底稿,將原始的數據至于其中,供讀者使用。去年在Elsevier出版社的Scopus數據庫中,平均在每100篇專業文獻當中就大約有1篇文獻用到了R語言,或者R語言相關軟件,在農業科學和環境科學相關文獻中,這個比例會更高,詳見附圖“R語言的快速上漲趨勢”。

        R語(yu)言使用小貼士

        *可以在(zai)R的網站CRAN (Comprehensive R Archive Network)//cran.r-project.org上安裝(zhuang)R語言(yan)。這里提供了關(guan)于這個系統的介紹: go.nature.com/jh9jb8。

        *很(hen)多科研(yan)人(ren)員(yuan)都建議使用(yong)功能強大的、免(mian)費的交互(hu)式軟件(jian)RStudio,詳見www.rstudio.com。

        *有很多在線學習教程,比如DataCamp (go.nature.com/qndp6w), rOpenSci (ropensci.org), Software Carpentry (go.nature.com/wg3s9u)和R-bloggers (www.r-bloggers.com)。

        *到go.nature.com/zrhdkj網(wang)頁上(shang)瀏(liu)覽本文(wen)的在線版,獲取(qu)更多R語言軟(ruan)件包信息。

統計學威力

        對于很(hen)多使用者而言(yan)(yan),R語言(yan)(yan)作為(wei)一(yi)種統(tong)計(ji)學(xue)軟(ruan)(ruan)件(jian)是非常優秀的。美國田納西大學(xue)(University of Tennessee in Knoxville)的統(tong)計(ji)學(xue)家Robert Muenchen對各種統(tong)計(ji)學(xue)軟(ruan)(ruan)件(jian)都做(zuo)過(guo)分(fen)析,他(ta)認為(wei),R語言(yan)(yan)在(zai)統(tong)計(ji)學(xue)方面(mian)的功力(li)與SPSS或SAS這些專業化(hua)的統(tong)計(ji)學(xue)軟(ruan)(ruan)件(jian)不(bu)相上(shang)下。近十年來,R語言(yan)(yan)不(bu)僅跟上(shang)了(le)統(tong)計(ji)學(xue)軟(ruan)(ruan)件(jian)市場的領頭羊(yang),甚至(zhi)已(yi)經取(qu)代了(le)它們(men)的地位(wei)。據Muenchen介紹,R語言(yan)(yan)非常有可能在(zai)今年夏天(tian)的時候成為(wei)頭號統(tong)計(ji)學(xue)軟(ruan)(ruan)件(jian)。

        Bioconductor軟(ruan)(ruan)件(jian)也是一款基于(yu)R語(yu)言開(kai)發的(de)軟(ruan)(ruan)件(jian),主要應(ying)用于(yu)基因(yin)組學研究(jiu)領域(yu)和(he)分子(zi)生物(wu)學研究(jiu)領域(yu)。Bioconductor軟(ruan)(ruan)件(jian)能夠幫助科研人(ren)員對(dui)海量(liang)的(de)遺(yi)傳(chuan)(chuan)序(xu)列(lie)數(shu)(shu)據進行處理和(he)比較,對(dui)Gene Expression Omnibus等數(shu)(shu)據庫進行檢索,或者將(jiang)數(shu)(shu)據上傳(chuan)(chuan)到數(shu)(shu)據庫當(dang)中等。該軟(ruan)(ruan)件(jian)包含1000多個軟(ruan)(ruan)件(jian)包,其中有一些(xie)軟(ruan)(ruan)件(jian)還可(ke)以將(jiang)數(shu)(shu)百(bai)萬個由新一代(dai)DNA測序(xu)儀產出(chu)的(de)DNA片段與已注釋基因(yin)一一對(dui)應(ying)起來。

        在(zai)(zai)深(shen)入(ru)學(xue)(xue)(xue)習(xi)R語言的(de)過(guo)程中(zhong),Royo也在(zai)(zai)Friedrich Miescher研(yan)(yan)究所生(sheng)(sheng)物信息學(xue)(xue)(xue)組的(de)組長——Michael Stadler的(de)指導下接受(shou)(shou)了強化訓練。Royo花了大約半(ban)年來鉆研(yan)(yan)R語言和(he)Bioconductor軟件(jian)。但是美國(guo)加(jia)利(li)(li)福(fu)尼亞州伯克利(li)(li)數據科學(xue)(xue)(xue)研(yan)(yan)究所(Berkeley Institute for Data Science in California)的(de)生(sheng)(sheng)態學(xue)(xue)(xue)家,rOpenSci組織(zhi)(zhi)(該組織(zhi)(zhi)旨在(zai)(zai)幫助科研(yan)(yan)人(ren)員(yuan)(yuan)接受(shou)(shou)并使(shi)用R語言,促進R語言的(de)發(fa)展(zhan))的(de)創始人(ren)Karthik Ram認為,還(huan)有(you)更多(duo)的(de)學(xue)(xue)(xue)習(xi)機會。Ram等(deng)人(ren)會針對(dui)科研(yan)(yan)人(ren)員(yuan)(yuan)的(de)問題免費教授R語言課程,沒有(you)任何編程技巧的(de)人(ren)都可(ke)以學(xue)(xue)(xue)習(xi)。

        美國圣(sheng)地(di)亞哥州立大學(San Diego State University in California)的(de)(de)(de)生態學家Megan Jennings就接受了(le)(le)Ram等(deng)人(ren)的(de)(de)(de)培訓(xun)。Jennings跟蹤山貓(bobcats)、美洲獅(mountain lions)和(he)其他野生動(dong)物(wu),了(le)(le)解它們的(de)(de)(de)運動(dong)情況。用(yong)了(le)(le)將(jiang)近一(yi)(yi)(yi)年的(de)(de)(de)時間(jian),使用(yong)了(le)(le)36臺(tai)攝像機(ji),拍攝了(le)(le)40多萬張照片(pian),Jennings希望能(neng)夠(gou)在一(yi)(yi)(yi)年的(de)(de)(de)某一(yi)(yi)(yi)個(ge)時間(jian)跟蹤某個(ge)動(dong)物(wu)的(de)(de)(de)活動(dong)情況。一(yi)(yi)(yi)開始,Jennings決定(ding)用(yong)人(ren)工挑選(xuan)照片(pian),并且使用(yong)PRESENCE軟件處理的(de)(de)(de)方法來完成(cheng)這項任務。后(hou)來在Ram的(de)(de)(de)幫助下,Jennings自己寫了(le)(le)一(yi)(yi)(yi)個(ge)R語(yu)(yu)言程序,能(neng)夠(gou)自動(dong)識別(bie)帶標(biao)記的(de)(de)(de)照片(pian),并將(jiang)照片(pian)提純,然后(hou)將(jiang)特(te)定(ding)的(de)(de)(de)數據(ju)輸送給另外一(yi)(yi)(yi)個(ge)R語(yu)(yu)言建模工具。“我以前要花一(yi)(yi)(yi)個(ge)小(xiao)時才能(neng)完成(cheng)的(de)(de)(de)工作(zuo),現(xian)在只需要5分鐘(zhong)就搞定(ding)了(le)(le)。” Jennings介紹道。

        R語(yu)言(yan)優勢就(jiu)是它的(de)在(zai)線支持(chi)能力。據Muenchen介紹,在(zai)統(tong)計(ji)學論壇中,與R語(yu)言(yan)相關(guan)的(de)問題在(zai)所有商業化的(de)統(tong)計(ji)軟件當中名列(lie)第一。

        “我(wo)們經常能(neng)(neng)夠(gou)(gou)(gou)看到(dao)(dao),有(you)(you)人(ren)在論壇上發出了一個(ge)提(ti)問(wen)(wen)貼(tie),不到(dao)(dao)半個(ge)小(xiao)時(shi),相關軟件的(de)開發者就(jiu)(jiu)會出來回答(da)這個(ge)問(wen)(wen)題。” Muenchen介紹道。這種(zhong)快(kuai)速反應能(neng)(neng)力就(jiu)(jiu)是(shi)從(cong)事基礎科(ke)(ke)研工(gong)作的(de)科(ke)(ke)學(xue)家(jia)關注的(de)。Royo還(huan)指出,她(ta)幾乎能(neng)(neng)夠(gou)(gou)(gou)在網上找(zhao)到(dao)(dao)任何問(wen)(wen)題的(de)答(da)案。Royo現在基本上已經能(neng)(neng)夠(gou)(gou)(gou)完成她(ta)所有(you)(you)的(de)數(shu)據(ju)處理和(he)分析工(gong)作,同時(shi)也(ye)給(gei)很多同事提(ti)供了大量(liang)的(de)幫助。“不過我(wo)每(mei)天也(ye)都會在谷歌上尋(xun)找(zhao)答(da)案。” Royo說(shuo)道。學(xue)習R語言不僅教會了Royo編程技巧,同時(shi)也(ye)讓她(ta)能(neng)(neng)夠(gou)(gou)(gou)對其他科(ke)(ke)學(xue)家(jia)的(de)統計工(gong)作有(you)(you)更加深(shen)刻(ke)的(de)認(ren)識(shi)。

        據(ju)Ram介紹,雖然并(bing)不(bu)是(shi)每(mei)一(yi)(yi)位(wei)科學(xue)(xue)(xue)家都熱衷于(yu)學(xue)(xue)(xue)習R語(yu)(yu)(yu)言編程(cheng)技(ji)巧,但是(shi)與Python等語(yu)(yu)(yu)言(更不(bu)要說Perl或C語(yu)(yu)(yu)言了)相(xiang)比,R語(yu)(yu)(yu)言還是(shi)要容(rong)易(yi)多(duo)了。據(ju)Muenchen介紹,會(hui)有(you)越來(lai)越多(duo)的(de)科研人員樂于(yu)接受用戶友好式的(de)軟件,而非學(xue)(xue)(xue)習一(yi)(yi)門編程(cheng)語(yu)(yu)(yu)言。比如與Royo一(yi)(yi)樣,遺傳學(xue)(xue)(xue)家Rabih Murr在(zai)博后(hou)期間(jian)也學(xue)(xue)(xue)習了同一(yi)(yi)門R語(yu)(yu)(yu)言課程(cheng),但是(shi)他(ta)并(bing)沒有(you)花那么多(duo)的(de)時間(jian)去好好做練習。Murr認(ren)為,學(xue)(xue)(xue)習R語(yu)(yu)(yu)言,并(bing)且能夠用R語(yu)(yu)(yu)言解決(jue)相(xiang)應的(de)科學(xue)(xue)(xue)問(wen)題也需要下一(yi)(yi)番功夫,他(ta)表示(shi),這是(shi)一(yi)(yi)個按照重要性先后(hou)排序的(de)問(wen)題。但是(shi)自從Murr今(jin)年當上了瑞士日(ri)內瓦(wa)大(da)學(xue)(xue)(xue)(University of Geneva in Switzerland)實驗室主任之后(hou),他(ta)也打(da)算雇一(yi)(yi)個有(you)過(guo)R語(yu)(yu)(yu)言開(kai)發經驗的(de)員工了。

        與其他的技能(neng)一(yi)樣(yang),學習R語(yu)言編程也并非一(yi)日(ri)之功(gong)。但(dan)是(shi)Jennings認為投(tou)入產出比是(shi)非常(chang)高的。她(ta)說(shuo)道:“這就好比投(tou)資,現在花(hua)一(yi)番功(gong)夫,就能(neng)夠為日(ri)后的工作節省時間(jian),而且還(huan)能(neng)夠學到一(yi)門非常(chang)有用的新技能(neng),能(neng)夠解(jie)決我(wo)們科學家經常(chang)會碰到的各種問題。”

        原(yuan)文檢索: