您好, 歡迎來(lái)到化工儀器網(wǎng),! 登錄| 免費(fèi)注冊(cè)| 產(chǎn)品展廳| 收藏商鋪|
13524933993
提供商
研域(上海)化學(xué)試劑有限公司資料大小
0K資料圖片
下載次數(shù)
0次資料類(lèi)型
未傳瀏覽次數(shù)
1803次近年來(lái),,隨著人類(lèi)基因組計(jì)劃(HGP)在世界范圍內(nèi)的開(kāi)展,破譯人類(lèi)及多種模式生物的遺傳密碼已成為生物學(xué)領(lǐng)域的重要學(xué)科,。同時(shí)產(chǎn)生了巨量的基因組信息,。分析這些信息是人類(lèi)基因組研究*的重要內(nèi)容,從而也促成了生物信息學(xué)的產(chǎn)生與發(fā)展,。生物信息學(xué)作為一門(mén)新的學(xué)科領(lǐng)域,,它是把基因組DNA序列信息分析作為源頭,在獲得了蛋白質(zhì)編碼區(qū)的信息之后進(jìn)行蛋白質(zhì)空間結(jié)構(gòu)模擬和預(yù)測(cè),,然后依據(jù)特定蛋白質(zhì)的功能進(jìn)行必要的藥物設(shè)計(jì),。因此在基因組研究時(shí)代,基因組信息學(xué),、蛋白質(zhì)的結(jié)構(gòu)模擬以及藥物設(shè)計(jì)必然有機(jī)地連接在一起,,它們是生物信息學(xué)的三個(gè)重要組成部分。當(dāng)前,,生物信息學(xué)已在理論生物學(xué)領(lǐng)域占有了核心的地位,,并提出了大量的緊迫任務(wù)。
1 基因組相關(guān)信息的收集,、儲(chǔ)存,、管理與提供
到1998年12月GenBank中收集的核酸序列已達(dá)3044000條,它們包含的堿基數(shù)目是2162000000個(gè),。與此同時(shí)有二十個(gè)生物體的完整基因組已被破譯,,約有至少40個(gè)完整基因組正在破譯當(dāng)中。大量基因數(shù)據(jù)的出現(xiàn)促進(jìn)了數(shù)據(jù)庫(kù),、分析工具以及網(wǎng)絡(luò)連接等的快速發(fā)展,。
1.1 生物信息數(shù)據(jù)庫(kù)
建立數(shù)據(jù)庫(kù)是存儲(chǔ)基因組相關(guān)信息的重要步驟,當(dāng)前在互聯(lián)網(wǎng)絡(luò)上可找到與基因組信息相關(guān)的大量重要數(shù)據(jù)庫(kù),、服務(wù)器,。其中:GenBank、EMBL,、GDB,、PDB、PIR等數(shù)據(jù)庫(kù)更是頻繁地被用戶檢索。在基因組織關(guān)數(shù)據(jù)庫(kù)的發(fā)展中,,以及幾方面特別引起人們的重視:
a),、建立基因組信息的評(píng)估與檢測(cè)系統(tǒng)
b)、數(shù)據(jù)標(biāo)準(zhǔn)化
c),、進(jìn)行基因組信息的可視化和專(zhuān)家系統(tǒng)的研究
d),、發(fā)展次級(jí)與專(zhuān)業(yè)數(shù)據(jù)庫(kù)
原始數(shù)據(jù)是龐大的。在原始數(shù)據(jù)的基因上,,根據(jù)不同的特征將其加工,,而構(gòu)建出若干數(shù)據(jù)庫(kù),這不僅會(huì)給用戶帶來(lái)很多方便,,更重要的是專(zhuān)業(yè)人員注入的知識(shí)會(huì)對(duì)用戶有很大的啟發(fā),。的二級(jí)數(shù)據(jù)庫(kù)象:蛋白質(zhì)結(jié)構(gòu)分類(lèi)數(shù)據(jù)庫(kù)(SCoP),受體數(shù)據(jù)庫(kù),,克隆載體數(shù)據(jù)庫(kù)等……,。
1.2 以因特網(wǎng)(Internet)為基礎(chǔ)的基因組信息學(xué)傳輸網(wǎng)絡(luò)
用戶與數(shù)據(jù)庫(kù)間迅速、有效地傳遞信息是基因組信息的收集,、管理與使用的另一要素,。目前與基因組信息相關(guān)的數(shù)據(jù)庫(kù)都有了自己的Internet地址和主頁(yè)(Homepage),同時(shí)在網(wǎng)上還出現(xiàn)了很多相關(guān)的在線(online)服務(wù)器,。
我國(guó)在基因組信息的收集與提供方面也有了一定的工作:北京大學(xué)物理化學(xué)研究所建立的PDB數(shù)據(jù)庫(kù)的中國(guó)節(jié)點(diǎn),;北京大學(xué)生命科學(xué)院建立的EMBL數(shù)據(jù)庫(kù)的中國(guó)節(jié)點(diǎn)。中國(guó)科學(xué)院生物物理所與日本JIPID的合作,,收集了我國(guó)科學(xué)家測(cè)定的DNA和蛋白質(zhì)序列并與相應(yīng)數(shù)據(jù)庫(kù)進(jìn)行交流,。中國(guó)醫(yī)學(xué)科學(xué)院腫瘤研究所建立的MEE-HOW服務(wù)器等。在數(shù)據(jù)庫(kù)研究中有兩點(diǎn)特別重要,,一是構(gòu)建我國(guó)自己的數(shù)據(jù)庫(kù),;二是與常用數(shù)據(jù)庫(kù)的有效連接和及時(shí)更新。經(jīng)過(guò)努力,,相信這一領(lǐng)域在我國(guó)會(huì)迅速發(fā)展,。
2 新基因的發(fā)現(xiàn)與鑒定
發(fā)現(xiàn)一個(gè)新的基因就能了解與其相關(guān)的生理功能或疾病的本質(zhì),從而為新藥的開(kāi)發(fā),、設(shè)計(jì)奠定基礎(chǔ),。使用基因組信息學(xué)的方法是發(fā)現(xiàn)新基因的重要手段,比如在啤酒酵母完整基因組(約1200萬(wàn)bp)所包含的5932個(gè)基因中,,大約60%是通過(guò)信息分析得到的,。使用EST序列信息尋找新基因是當(dāng)前上基因爭(zhēng)奪戰(zhàn)的熱點(diǎn)。
2.1 利用EST數(shù)據(jù)庫(kù)(dbEST)發(fā)現(xiàn)新基因
eST序列(Expressed sequence Tags)是從基因表達(dá)的短c-DNA序列,,它們攜帶著完整基因某些片段的信息,。到1998年12月中在GenBank的EST數(shù)據(jù)庫(kù)中已收集了EST序列2,020,608條,,其中人EST序列為1,201,241條,它大約覆蓋了人類(lèi)基因的80%,。由于EST序列中包括了大量未發(fā)現(xiàn)的人類(lèi)基因的信息,,因此如何利用這些信息發(fā)現(xiàn)新基因成了近幾年的重要研究課題,。
2.2 從基因組DNA測(cè)序數(shù)據(jù)中確定編碼區(qū)
這一研究已經(jīng)進(jìn)行了很多年,,并建立了多種方法。這些方法概括說(shuō)來(lái)分為兩類(lèi),,一類(lèi)是基于編碼區(qū)所具有的*信號(hào),,比如起始密碼子、終止密碼子等,,另一類(lèi)是基于編碼區(qū)的堿基組成不同于非編碼區(qū),。這是由于蛋白質(zhì)中20種氨基酸出現(xiàn)的概率不同,每種氨基酸的密碼子兼并度不同,,同一種氨基酸的兼并密碼子使用頻率不同等原因造成的,。近年來(lái)一批新的確定編碼區(qū)的方法出現(xiàn)了,例如,,考慮高維分布的統(tǒng)計(jì)方法,、神經(jīng)網(wǎng)絡(luò)方法、分形方法等,。將密碼學(xué)方法用于識(shí)別編碼區(qū),,也取得了較好的結(jié)果。
3 非編碼區(qū)信息結(jié)構(gòu)分析
雖然對(duì)約占人類(lèi)基因組95%的非編碼區(qū)的作用人們還不清楚,,但從生物進(jìn)化的觀點(diǎn)看來(lái),,這部分序列必定具有重要的生物功能。普遍的認(rèn)識(shí)是,,它們與基因在四維時(shí)空的表達(dá)調(diào)控有關(guān),。因此尋找這些區(qū)域編碼特征,信息調(diào)節(jié)與表達(dá)規(guī)律是未來(lái)相當(dāng)長(zhǎng)時(shí)間內(nèi)的熱點(diǎn)課題,。
3.1 非編碼區(qū)中各種組分的分類(lèi)與確定
非編碼區(qū)(“Junk”DNA)占據(jù)了人類(lèi)基因組的大部分,,研究表明“Junk”是許多對(duì)生命過(guò)程富有活力的不同類(lèi)型的DNA的復(fù)合體,它們至少包含如下類(lèi)型的DNA成份或由其表達(dá)的RNA成分:內(nèi)含子(intron),、衛(wèi)星(Salite)DNA,、小衛(wèi)星(minisalite)DNA、微衛(wèi)星(Microsalite)DNA,、非均一核RNA(簡(jiǎn)稱(chēng)hmRNA)短散置元(short interspersed elements,,簡(jiǎn)稱(chēng)SINE)、長(zhǎng)散置元(long interspersed elements,,簡(jiǎn)稱(chēng)LINE),、偽基因(pseudogenes)等。除此之外順式調(diào)控元件,如啟動(dòng)子,、增強(qiáng)子等也屬于非編碼序列,。一些科學(xué)家認(rèn)為應(yīng)當(dāng)把染色體稱(chēng)為信息細(xì)胞器(information organelle)。了解“JunK”DNA是了解信息細(xì)胞器的關(guān)鍵步驟,。
3.2 尋找新的非三聯(lián)體的編碼方式
是否在基因組中僅存在三聯(lián)體的編碼方式呢,?是否傳遞不同的信息應(yīng)有不同字長(zhǎng)的碼呢?人們熟知三聯(lián)碼是用于將4個(gè)字符組成的基因中的信息傳遞給由20個(gè)字符組成的蛋白質(zhì),。只有堿基三聯(lián)體數(shù)(43=64)才是大于20(氨基酸的種類(lèi)數(shù))且zui接近20的堿基組合,。所以三聯(lián)體是DNA與蛋白質(zhì)間傳遞信息的編碼。按照這樣的推理人們可以認(rèn)為由DNA到結(jié)構(gòu)RNA間的信息傳遞是單聯(lián)體碼,,因?yàn)镈NA與RNA的結(jié)構(gòu)單元是一一對(duì)應(yīng)的,。如果考慮到人類(lèi)基因的總數(shù)約為5萬(wàn)到10萬(wàn),那么要調(diào)節(jié)單獨(dú)的一個(gè)基因的調(diào)節(jié)單元的數(shù)目也要與此相應(yīng),,達(dá)到若干萬(wàn)個(gè),。此時(shí)三聯(lián)體編碼方式的區(qū)分度就遠(yuǎn)為不足。這就是生物信息學(xué)家尋找其他非三聯(lián)體編碼方式的原因,。
3.3 編碼區(qū)和非編碼區(qū)中信息調(diào)節(jié)規(guī)律的研究
雖然Jacob和Monod的乳糖操縱子模型給出了基因表達(dá)調(diào)控的zui基本模式,,但近年來(lái)很多發(fā)現(xiàn)表明基因的調(diào)節(jié)是遠(yuǎn)為復(fù)雜與豐富的。隨著基因組研究進(jìn)入后基因組時(shí)代,,功能基因的表達(dá)譜得以測(cè)定,,這些深刻的問(wèn)題會(huì)逐步得到解決。
4 生物進(jìn)化的研究
自1859年Darwin的物種起源(Origin of Species)發(fā)表以來(lái),,進(jìn)化是對(duì)人類(lèi)自然科學(xué)和自然哲學(xué)發(fā)展的zui重要貢獻(xiàn)之一,。自本世紀(jì)中葉以來(lái),隨著分子生物學(xué)的不斷發(fā)展,,進(jìn)化論的研究也進(jìn)入了分子水平,。并建立了一套依賴(lài)于核酸、蛋白質(zhì)序列信息的理論方法?,F(xiàn)在隨著序列信息的大量出現(xiàn)開(kāi)展分子進(jìn)化的研究具有了*時(shí)機(jī),。
5 完整基因組的比較研究
在后基因組時(shí)代,生物信息學(xué)家面對(duì)的不僅是序列和基因而是越來(lái)越多的完整基因組,??茖W(xué)家們對(duì)zui早的七個(gè)完整基因組所做的分析得到了很多有意義的結(jié)論。這些生物體都是能獨(dú)立存活的,,zui大的是啤酒酵母,,它有5932個(gè)基因,zui小的是生殖道枝原體,,它只有470個(gè)基因,。有了這些資料人們就能估計(jì),,zui小獨(dú)立生活的生物至少需要多少基因,這些基因是如何使它們活起來(lái)的,?基因組研究還發(fā)現(xiàn),,鼠和人的基因組大小相似,都含有約三十億堿基對(duì),,基因的數(shù)目也類(lèi)似,。可是鼠和人差異確如此之大,,這是為什么,?同樣,有的科學(xué)家估計(jì)不同人種間基因組的差別不大于0.1%,;人猿間差別不大于1%。因此其表型差異不僅應(yīng)從基因,、DNA序列找原因,,也應(yīng)考慮染色體組織上的差異??傊?,由完整基因組研究所導(dǎo)致的比較基因組學(xué)必將為后基因組研究開(kāi)辟新的領(lǐng)域。
6 基因組信息分析的方法研究
6.1 發(fā)展有效的能支持大尺度作圖與測(cè)序需要的軟件和數(shù)據(jù)庫(kù)以及若干數(shù)據(jù)庫(kù)工具,,包括互聯(lián)網(wǎng)絡(luò)上的遠(yuǎn)程通訊工具,,使之能容易地處理日益增長(zhǎng)的物理圖、遺傳圖和序列信息,。改進(jìn)現(xiàn)有的理論分析方法,,象統(tǒng)計(jì)方法、隱含馬爾科夫過(guò)程方法,、分維方法,、神經(jīng)網(wǎng)絡(luò)方法、復(fù)雜性分析方法,、密碼學(xué)方法等,。創(chuàng)建一切適用于基因組信息分析的新方法、新技術(shù),。
6.2 建立快速,、嚴(yán)格的多序列比較方法
多序列比較是解決同源性分析等重要問(wèn)題的關(guān)鍵手段,但迄今為止只有近似方法,。雖然兩個(gè)序列比較有動(dòng)態(tài)規(guī)劃算法這樣的方法,,但要把它推廣到多序列的情況是不現(xiàn)實(shí)的。為此發(fā)展的多序列比較方法是當(dāng)務(wù)之急,。
7 大規(guī)?;蚬δ鼙磉_(dá)譜的分析
目前,,基因組的研究已從結(jié)構(gòu)基因組(structural genome)逐漸過(guò)度到功能基因組(functional genome)。因此獲得基因的功能表達(dá)譜,,將存在于人類(lèi)基因組上的靜的基因圖譜,,向時(shí)間、空間維上展開(kāi)是新一階段基因組研究的核心,。為了得到基因表達(dá)的功能譜,,上在核酸和蛋白質(zhì)兩個(gè)層次上都發(fā)展了新技術(shù)。在核酸層次上的新技術(shù)是DNA芯片,,在蛋白質(zhì)層次上則是二維凝膠電泳和測(cè)序質(zhì)譜技術(shù),。由此導(dǎo)致了大規(guī)模基因功能表達(dá)譜的分析問(wèn)題,。它們從數(shù)學(xué)角度看不是簡(jiǎn)單的NP問(wèn)題,、動(dòng)力系統(tǒng)問(wèn)題或不確定性問(wèn)題,因此需要發(fā)展新的方法和工具,。所以無(wú)論是生物芯片還是蛋白質(zhì)組技術(shù)的發(fā)展都更強(qiáng)烈地依賴(lài)于生物信息學(xué)的理論,、技術(shù)與數(shù)據(jù)庫(kù)。
8 蛋白質(zhì)分子空間結(jié)構(gòu)的預(yù)測(cè),、模擬和分子設(shè)計(jì)
隨著人類(lèi)基因組計(jì)劃的執(zhí)行,,找到人類(lèi)5萬(wàn)到10萬(wàn)個(gè)基因的堿基序列是指日可待的事,因而確定人的上千個(gè)原癌基因和幾萬(wàn)個(gè)與疾病相關(guān)基因表達(dá)產(chǎn)物的氨基酸順序也會(huì)逐漸實(shí)現(xiàn),。這無(wú)疑給人類(lèi)疾患的治療帶來(lái)了很大的希望,。然而要了解他們的功能、要找到這些蛋白質(zhì)致病的分子基礎(chǔ),,只有氨基酸順序的知識(shí)是不夠的,,必要知道它們的三維結(jié)構(gòu)。與此同時(shí),,要設(shè)計(jì)藥物治療這些疾患也需要了解蛋白質(zhì)的三維結(jié)構(gòu),。這是擺在科學(xué)家面前的緊迫任務(wù)。
當(dāng)前不論是還是國(guó)內(nèi),,蛋白質(zhì)空間結(jié)構(gòu)預(yù)測(cè)和蛋白質(zhì)分子的改性設(shè)計(jì)都在廣泛而快速地展開(kāi),。近年來(lái)對(duì)蛋白質(zhì)構(gòu)象模式的研究取得了很大進(jìn)展。比較*的看法是:蛋白質(zhì)的折疊類(lèi)型是有限的,,目前估計(jì)為幾百至幾千種,。這要遠(yuǎn)小于蛋白質(zhì)所具有的自由度數(shù)目。同時(shí)蛋白的折疊類(lèi)型是與它們的組分和一級(jí)序列相關(guān)的,,這樣就有可能從蛋白質(zhì)的初級(jí)信息中確定它們的zui終折疊類(lèi)型,。
9 藥物設(shè)計(jì)
傳統(tǒng)的藥物研制主要是從大量的天然產(chǎn)物,如動(dòng)物,、植物,、微生物和合成有機(jī),、無(wú)機(jī)化合物中進(jìn)行篩選。往往得到一個(gè)可供臨床使用的藥物要篩選1萬(wàn)種不同的化合物,,要經(jīng)過(guò)10年左右的時(shí)間和耗資2.5-3.0億美元,。當(dāng)前隨著組合化學(xué)和群集篩選的發(fā)展,這一狀況有了一定程度的改善,,但耗資,、耗時(shí)仍然是巨大的。近年來(lái)由于結(jié)構(gòu)生物學(xué)的發(fā)展,,相當(dāng)數(shù)量的蛋白質(zhì)以及一些核酸,、多糖的三維結(jié)構(gòu)已被了解。因此,,基于生物大分子結(jié)構(gòu)知識(shí)的藥物設(shè)計(jì)成為了當(dāng)前的熱點(diǎn),。生物信息學(xué)的研究不僅可提供生物大分子空間結(jié)構(gòu)的信息,還能提供電子結(jié)構(gòu)的信息,,如能級(jí),、表面電荷分布、分子軌道相互使用等以及動(dòng)力學(xué)行為的信息,,如生物化學(xué)反應(yīng)中的能量變化、電荷遷移,、構(gòu)象變化等,。理論模擬還可研究包括生物分子及其周?chē)h(huán)境(如水、離子等)的復(fù)雜體系和生物分子的量子效應(yīng),。上述的不少方面當(dāng)前是難以直接用分子生物學(xué)的實(shí)驗(yàn)手段加以研究的,。這些模擬的結(jié)構(gòu)對(duì)于在分子、亞分子和電子結(jié)構(gòu)層次上了解生命現(xiàn)象的基本過(guò)程具有重要意義,。并為天然生物大分子的改性和基于受體結(jié)構(gòu)的藥物分子設(shè)計(jì)提供了依據(jù),。
10 應(yīng)用與發(fā)展研究
基因組信息學(xué)的研究結(jié)果不僅具有重要的理論價(jià)值,也可直接應(yīng)用到工農(nóng)業(yè)生產(chǎn)和醫(yī)療實(shí)踐當(dāng)中去,。
10.1 與疾病相關(guān)的人類(lèi)基因信息的匯集以及病人樣品序列信息檢測(cè)技術(shù)的發(fā)展
很多的人類(lèi)基因是和疾病有關(guān),,有人估計(jì)與癌癥相關(guān)的原癌基因約有一千個(gè),抑癌基因約有一百個(gè),。約有六千種以上的人類(lèi)疾患與各種人類(lèi)基因的變化相關(guān)聯(lián),。隨著人類(lèi)基因組計(jì)劃的深入,當(dāng)我們知道了全部八萬(wàn)到十萬(wàn)個(gè)人類(lèi)基因在染色體上的位置和它們的序列特征以后,,人們就可以有效地判定各種分子疾患,。為了實(shí)現(xiàn)這一目標(biāo)有兩項(xiàng)工作是重要的,一是構(gòu)建與疾病相關(guān)的人類(lèi)基因信息數(shù)據(jù)庫(kù),,二是發(fā)展快速,、有效的對(duì)患者血液,、體液、組織等樣品進(jìn)行測(cè)試和序列信息檢測(cè)的技術(shù),。近幾年上已出現(xiàn)了若干與疾病相關(guān)的數(shù)據(jù)庫(kù),,其他技術(shù)也在發(fā)展中。
10.2 建立與動(dòng),、植物良種繁育相關(guān)的基因組數(shù)據(jù)庫(kù),。
隨著人類(lèi)基因組、水稻基因組以及各種模式生物基因組的解譯,,根據(jù)不同物種間的進(jìn)化距離和功能基因的同源性,,可以容易地找到各種家畜、經(jīng)濟(jì)作物與其經(jīng)濟(jì)效益相關(guān)的基因,,進(jìn)而對(duì)它們按照人們的愿望加以改造,。
10.3 發(fā)展基于序列信息的分子生物學(xué)技術(shù)
分子生物學(xué)常用的表達(dá)載體、PCR引物以及各種試劑盒的設(shè)計(jì)必須依賴(lài)于核酸的序列信息,?;蚪M信息學(xué)提供的大量信息為這類(lèi)技術(shù)的發(fā)展提供了廣闊的天地。
總之,,當(dāng)前是人類(lèi)基因組研究的一個(gè)有活力的新時(shí)代,。不少科學(xué)家還說(shuō)它是人類(lèi)基因組研究的收獲時(shí)代,它不僅將賦予人們基因研究重要成果,,也會(huì)帶來(lái)巨大的經(jīng)濟(jì)效益和社會(huì)效益,。在未來(lái)的幾年中DNA序列數(shù)據(jù)將以意想不到的速度增長(zhǎng),這是一個(gè)難得的機(jī)會(huì),,盡早利用這些數(shù)據(jù)就可能走在科學(xué)界的zui前沿,。
請(qǐng)輸入賬號(hào)
請(qǐng)輸入密碼
請(qǐng)輸驗(yàn)證碼
以上信息由企業(yè)自行提供,,信息內(nèi)容的真實(shí)性,、準(zhǔn)確性和合法性由相關(guān)企業(yè)負(fù)責(zé),,化工儀器網(wǎng)對(duì)此不承擔(dān)任何保證責(zé)任。
溫馨提示:為規(guī)避購(gòu)買(mǎi)風(fēng)險(xiǎn),,建議您在購(gòu)買(mǎi)產(chǎn)品前務(wù)必確認(rèn)供應(yīng)商資質(zhì)及產(chǎn)品質(zhì)量,。