日韩av大片在线观看欧美成人不卡|午夜先锋看片|中国女人18毛片水多|免费xx高潮喷水|国产大片美女av|丰满老熟妇好大bbbbbbbbbbb|人妻上司四区|japanese人妻少妇乱中文|少妇做爰喷水高潮受不了|美女人妻被颜射的视频,亚洲国产精品久久艾草一,俄罗斯6一一11萝裸体自慰,午夜三级理论在线观看无码

上海源葉生物科技有限公司

主營(yíng)產(chǎn)品: S30260異硫氰酸胍,30259鹽酸胍,嗜熱菌蛋白酶

15

聯(lián)系電話

15921386130

您現(xiàn)在的位置: 首頁(yè)> 技術(shù)文章 > 如何從零開(kāi)始掌握生物信息學(xué)分析(新手寶典)

如何從零開(kāi)始掌握生物信息學(xué)分析(新手寶典)

2015-8-13  閱讀(386)

今天的世界大不同,表現(xiàn)在生命科學(xué)研究領(lǐng)域,,就是一切都開(kāi)始進(jìn)入了大數(shù)據(jù)時(shí)代,,無(wú)論是DNA序列,,顯微圖片,,還是質(zhì)譜數(shù)據(jù),,研究人員都越來(lái)越需要對(duì)這些龐大的信息進(jìn)行收集、整合,、處理和詮釋,。
對(duì)于許多生物學(xué)家們來(lái)說(shuō),這并不容易完成,,傳統(tǒng)的科研培訓(xùn)方式主要集中于科學(xué)的基礎(chǔ)原理和實(shí)驗(yàn)方法,,而不是計(jì)算機(jī)編程和數(shù)據(jù)統(tǒng)計(jì),因此當(dāng)不少研究人員發(fā)現(xiàn)自己需要面對(duì)大量的數(shù)據(jù)量時(shí),,他們不知道如何處理這些問(wèn)題,。
目前其實(shí)也不乏現(xiàn)成的計(jì)算工具,而且不少都是免費(fèi)的,,但對(duì)于門外漢來(lái)說(shuō)還是有些難,。通常情況下研究人員還是需要深入了解這些界面并未友好的程序,才能運(yùn)行,,而這需要計(jì)算運(yùn)行的深厚知識(shí),。
這就會(huì)導(dǎo)致研究人員在進(jìn)行大數(shù)據(jù)研究的時(shí)候,不得不自己編寫(xiě)一些程序來(lái)進(jìn)行可重復(fù)和得到證實(shí)的信息處理,。然而這些過(guò)程也需要小心處理,,一不留意犯錯(cuò)了,就有可能危及數(shù)據(jù)本身,。
近期The Scientist雜志了幾位科學(xué)程序員,,了解他們所使用的工具是什么,如果是菜鳥(niǎo)需要進(jìn)行哪些訓(xùn)練等,。
選擇一種語(yǔ)言

生物學(xué)家可以從各種各樣的編程語(yǔ)言中選擇一種,,對(duì)于許多應(yīng)用來(lái)說(shuō),隨便選擇一種都可以,,不過(guò)目前zui流行的可能就是Python 和 R,。“就目前而言,,這就像是科學(xué)研究的二重奏",,來(lái)自加州大學(xué)戴維斯分校的生物信息學(xué)家Vince Buffalo說(shuō),他剛完成了一本名為《生物信息學(xué)數(shù)據(jù)分析技巧》(O’Reilly Media Inc.)的新書(shū),。
Python 和 R相對(duì)來(lái)說(shuō)都比較好用,,但前者能完成多項(xiàng)任務(wù),而后者主要針對(duì)的是統(tǒng)計(jì)方面的內(nèi)容,,兩種語(yǔ)言都有其各自的使用用戶群,,因此具有特定功能預(yù)生成代碼(prebuilt code)數(shù)據(jù)文庫(kù),,比如以R語(yǔ)言為基礎(chǔ)的Bioconductor Project (www.bioconductor。,。org),,能為顯微,測(cè)序和芯片數(shù)據(jù)提供模塊,。另外Python 公共文庫(kù)也有:Anaconda (continuum.io/downloads),。
來(lái)自華盛頓大學(xué)基因組科學(xué)系的助理教授Cole Trapnell利用R語(yǔ)言完成了單細(xì)胞基因組數(shù)據(jù)集的處理,“單一細(xì)胞基因組學(xué)問(wèn)題牽涉到許多的統(tǒng)計(jì)學(xué)方面的內(nèi)容,,R語(yǔ)言很適合,。"
此外,還有一種受到大家認(rèn)可的語(yǔ)言,,那就C/C++(Julia (www.julialang,。。org)),,這種語(yǔ)言特別合適用于那些相對(duì)較慢或內(nèi)存密集型任務(wù),,Trapnell說(shuō)。
如果能將Python的語(yǔ)法,,R語(yǔ)言的圖形靈敏性和C++的速度結(jié)合在一起,,那就了,“這也就是說(shuō),,這種代碼很好編寫(xiě),,而且也很快,",,來(lái)自加州大學(xué)戴維斯分校的遺傳學(xué)副教授Titus Brown說(shuō),,但這需要你花費(fèi)大量經(jīng)歷掌握這些語(yǔ)言,他建議,,可以選擇你同事已經(jīng)在應(yīng)用的語(yǔ)言,,這樣他就能幫助你解惑。
所需的工具
UNIX 和 Linux系統(tǒng)都有預(yù)安裝軟件,,如果你沒(méi)有,,那么通過(guò)操作系統(tǒng)管理員也很容易獲取。Macs系統(tǒng)包含一個(gè)現(xiàn)成的Python 解釋器和C/C++ 編譯器,,但必須單獨(dú)安裝 R(www.r-project。,。org),。Windows系統(tǒng)在默認(rèn)狀態(tài)下,不包含任何一種編程語(yǔ)言,,因此你可能需要自己安裝,。
程序員還需要的一個(gè)工具就是一個(gè)好用的文本編輯器,,這是用于處理純文本文件的程序,與之相對(duì)的就是處理特殊格式的程序,,如Microsoft Word,。核心程序員通常喜歡使用命令行編輯器 vi 或 emacs,在Linux 和 Mac系統(tǒng)中這兩者都有預(yù)裝?,F(xiàn)在也有一些很強(qiáng)大的可配置程序,,但是對(duì)于新手來(lái)說(shuō)很難掌握,“這要求你自己想代碼,,因此我還是建議使用自己擅長(zhǎng)的方法,,"Trapnell說(shuō)。
同時(shí)你還需要找到一種能夠用特定顏色標(biāo)記特殊語(yǔ)言關(guān)鍵詞(“syntax highlighting"),,語(yǔ)法檢查 (比如說(shuō)要能找到錯(cuò)誤的方括號(hào)和圓括號(hào)),,代碼格式,以及處理多種文件的編輯器,。
常用的兩種就是Windows系統(tǒng)的Notepad++ (notepad-plus-plus.org),,以及Mac和Windows、Linux系統(tǒng)通用的Sublime Text (www.sublimetext,。,。com)。同時(shí)還有一種Mac界面可用的AquaMacs (aquamacs.org),。
“我向我的學(xué)生強(qiáng)調(diào)的關(guān)鍵一點(diǎn)就是,,盡量少用鼠標(biāo),"威斯康辛大學(xué)麥迪遜分校生物統(tǒng)計(jì)學(xué)和醫(yī)學(xué)信息學(xué)教授Karl Broman說(shuō),,“每當(dāng)你將手從鍵盤中移開(kāi)的時(shí)候,,就在減慢速度。"
另外,,如果你計(jì)劃在某個(gè)平臺(tái)(如 Mac 或 Windows)上從一種特殊語(yǔ)言開(kāi)始的話,,那么也許你應(yīng)該嘗試一下集成開(kāi)發(fā)環(huán)境(IDE,integrated development environment),,這是用于程序開(kāi)發(fā)環(huán)境的應(yīng)用程序,,一般包括代碼編輯器、編譯器,、調(diào)試器和圖形用戶界面工具,,這能簡(jiǎn)化你的工作。
Mac C/C++程序員可以用免費(fèi)的Xcode (developer.apple.com/xcode), Windows 用戶可以使用Microsoft Visual Studio (www.visualstudio,。,。com)。而對(duì)于 R 編程來(lái)說(shuō),,常用的一種選擇就是RStudio (www.rstudio,。,。com)。Eclipse IDE (eclipse.org/ide)是一種支持多種語(yǔ)言的模塊化工具,,所有這些平臺(tái)的基本版本都是免費(fèi)下載,,有些適用于用戶的附加功能也可以獲取。



產(chǎn)品對(duì)比 產(chǎn)品對(duì)比 二維碼 在線交流

掃一掃訪問(wèn)手機(jī)商鋪

對(duì)比框

在線留言