一a一片一级一片啪啪-一a一级片-一a级毛片-一一级黄色片-国产免费福利片-国产免费福利网站

熱門關(guān)鍵字:  聽力密碼  聽力密碼  新概念美語(yǔ)  單詞密碼  巧用聽寫練聽力
圖書信息
當(dāng)前位置 : 萬(wàn)水書苑>圖書展示>專著類>

數(shù)據(jù)挖掘技術(shù)在生物信息學(xué)中的應(yīng)用

中國(guó)水利水電出版社
    【作 者】裴志利 著 【I S B N 】978-7-5084-9348-0 【責(zé)任編輯】楊元泓 【適用讀者群】 【出版時(shí)間】2012-02-27 【開 本】16開 【裝幀信息】平裝(光膜) 【版 次】第1版第1次印刷 【頁(yè) 數(shù)】88 【千字?jǐn)?shù)】1000 【印 張】5.5 【定 價(jià)】20 【叢 書】 【備注信息】
圖書詳情

    主要采用一些數(shù)據(jù)挖掘的技術(shù)和方法在生物信息學(xué)領(lǐng)域做了如下幾個(gè)方面的工作:提出了一種基于可變精度粗糙集理論為新的生物序列進(jìn)行功能注釋的方法;初步判斷四個(gè)種群,即尼日利亞Ibadan的Yoruba人、東京的日本人、北京的漢族、祖籍為歐洲西部和北部地區(qū)的美國(guó)居民在21號(hào)染色體上對(duì)疾病的易感程度的差距;提出了一種基于Y染色體SNP基因型頻率數(shù)據(jù)建立人類種群進(jìn)化關(guān)系的新方法,提出的方法支持“走出非洲”假說,為人類種群進(jìn)化研究提供了一個(gè)新思路;使用自組織特征映射模型(SOM)有效預(yù)測(cè)了蛋白質(zhì)的亞細(xì)胞位置,從而推斷出蛋白質(zhì)分子的功能。

    隨著包括人類基因組計(jì)劃在內(nèi)的生物基因組測(cè)序工程的里程碑式地進(jìn)展,由此產(chǎn)生的包括生物體生老病死的生物數(shù)據(jù)以前所未有的速度遞增,目前已達(dá)到每14個(gè)月翻一番的速度。同時(shí)隨著互聯(lián)網(wǎng)的普及,數(shù)以百計(jì)的生物學(xué)數(shù)據(jù)庫(kù)如雨后春筍般地迅速出現(xiàn)和成長(zhǎng)。毫無(wú)疑問,我們正從一個(gè)積累數(shù)據(jù)的時(shí)代向解釋數(shù)據(jù)的時(shí)代轉(zhuǎn)變,數(shù)據(jù)量的巨大積累往往蘊(yùn)含著潛在突破性發(fā)現(xiàn)的可能。在此背景下出現(xiàn)了以計(jì)算機(jī)科學(xué)、信息技術(shù)和數(shù)學(xué)的理論及方法來(lái)研究生物信息的交叉學(xué)科,也就是生物信息學(xué)。該領(lǐng)域的核心內(nèi)容是研究如何通過對(duì)DNA序列的統(tǒng)計(jì)計(jì)算分析更加深入地理解DNA序列、結(jié)構(gòu)、演化及其與生物功能之間的關(guān)系,其研究課題涉及到分子生物學(xué)、分子演化、結(jié)構(gòu)生物學(xué),統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)等諸多領(lǐng)域。生物信息學(xué)是內(nèi)涵豐富的學(xué)科,其核心是基因組信息學(xué),包括基因組信息的獲取、處理、存儲(chǔ)、分配和解釋。基因組信息學(xué)的關(guān)鍵是“讀懂”基因組的核苷酸順序,即全部基因在染色體上的確切位置和各DNA片段的功能;同時(shí)在發(fā)現(xiàn)了新基因信息后進(jìn)行蛋白質(zhì)空間結(jié)構(gòu)模擬和預(yù)測(cè),然后依據(jù)特定蛋白質(zhì)的功能進(jìn)行藥物設(shè)計(jì)。了解基因表達(dá)的調(diào)控機(jī)理也是生物信息學(xué)的重要內(nèi)容,根據(jù)生物分子在基因調(diào)控中的作用,描述人類疾病的診斷和治療的內(nèi)在規(guī)律,其研究目標(biāo)是揭示“基因組信息結(jié)構(gòu)的復(fù)雜性及遺傳語(yǔ)言的根本規(guī)律”,解釋生命的遺傳語(yǔ)言。生物信息學(xué)已成為整個(gè)生命科學(xué)發(fā)展的重要組成部分并成為生命科學(xué)研究的前沿。

    生物信息學(xué)在短短十幾年時(shí)間里已經(jīng)形成了以下多個(gè)研究方向:序列比對(duì)、蛋白質(zhì)結(jié)構(gòu)比對(duì)和預(yù)測(cè)、基因識(shí)別非編碼區(qū)分析研究、分子進(jìn)化和比較基因組學(xué)、序列重疊群裝配、遺傳密碼的起源、基于結(jié)構(gòu)的藥物設(shè)計(jì)、生物圖像、基因表達(dá)譜分析,代謝網(wǎng)絡(luò)分析、基因芯片設(shè)計(jì)和蛋白質(zhì)組學(xué)數(shù)據(jù)分析等,逐漸成為生物信息學(xué)中新興的重要研究領(lǐng)域;在學(xué)科方面,由生物信息學(xué)衍生的學(xué)科(包括結(jié)構(gòu)基因組學(xué)、功能基因組學(xué)、比較基因組學(xué)、蛋白質(zhì)學(xué)、藥物基因組學(xué)、中藥基因組學(xué)、腫瘤基因組學(xué)、分子流行病學(xué)和環(huán)境基因組學(xué)),成為系統(tǒng)生物學(xué)的重要研究方法。從如今的發(fā)展不難看出,基因工程已經(jīng)進(jìn)入了后基因組時(shí)代。

    大規(guī)模的生物信息給數(shù)據(jù)挖掘提出了新課題和挑戰(zhàn),需要新的思想加入。常規(guī)的計(jì)算機(jī)算法仍可以應(yīng)用于生物數(shù)據(jù)分析中,但越來(lái)越不適用于序列分析問題。究其原因是由于生物系統(tǒng)本質(zhì)上的模型復(fù)雜且缺乏在分子層上建立的完備的生命組織理論。數(shù)據(jù)挖掘使得利用計(jì)算機(jī)從海量的生物信息中提取有用知識(shí)、發(fā)現(xiàn)知識(shí)成為可能。機(jī)器學(xué)習(xí)方法在大樣本、多向量的數(shù)據(jù)分析工作中發(fā)揮著日益重要的作用,而目前大量的基因數(shù)據(jù)庫(kù)處理需要計(jì)算機(jī)能自動(dòng)識(shí)別和標(biāo)注,以避免既耗時(shí)又花費(fèi)巨大的人工處理方法。因此,生物信息學(xué)與數(shù)據(jù)挖掘相結(jié)合也就成為了必然趨勢(shì)。機(jī)器學(xué)習(xí)加速了生物信息學(xué)的進(jìn)展,也帶來(lái)了相應(yīng)的問題。機(jī)器學(xué)習(xí)方法大多假定數(shù)據(jù)符合某種相對(duì)固定的模型,而一般數(shù)據(jù)結(jié)構(gòu)通常是可變的,在生物信息學(xué)中尤為突出。因此,有必要建立一套不依賴于假定數(shù)據(jù)結(jié)構(gòu)的一般性方法來(lái)尋找數(shù)據(jù)集的內(nèi)在結(jié)構(gòu)。

    生物信息學(xué)的挑戰(zhàn)很多,例如從蛋白質(zhì)的氨基酸序列預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)問題。這個(gè)難題已困擾理論生物學(xué)家達(dá)半個(gè)多世紀(jì),如今找到問題的答案的要求正變得日益迫切。諾貝爾獎(jiǎng)獲得者W•Gilbert在1991年曾經(jīng)指出:“傳統(tǒng)生物學(xué)解決問題的方式是實(shí)驗(yàn)的,F(xiàn)在,基于全部基因都將知曉并以電子可操作的方式駐留在數(shù)據(jù)庫(kù)中,新的生物學(xué)研究模式的出發(fā)點(diǎn)應(yīng)該是理論的。一個(gè)科學(xué)家將從理論推測(cè)出發(fā),然后再回到實(shí)驗(yàn)中去追蹤或驗(yàn)證這些理論假設(shè)”。

    在上述背景下,有必要利用數(shù)據(jù)挖掘的方法在生物信息學(xué)領(lǐng)域中做一些有益的嘗試工作。本著作受到國(guó)家自然科學(xué)基金項(xiàng)目(項(xiàng)目編號(hào):61163034)資助。鑒于作者水平有限,書中難免有錯(cuò)誤之處,敬請(qǐng)專家和廣大讀者指正。

    作者

    2011年11月19日

    前言
    第1章 緒論 1
    1.1 數(shù)據(jù)挖掘技術(shù)簡(jiǎn)介 1
    1.1.1 數(shù)據(jù)挖掘的背景介紹 1
    1.1.2 數(shù)據(jù)挖掘的研究現(xiàn)狀 2
    1.1.3 數(shù)據(jù)挖掘的相關(guān)知識(shí) 4
    1.1.4 數(shù)據(jù)挖掘的應(yīng)用和研究方向 8
    1.2 數(shù)據(jù)挖掘技術(shù)在生物信息學(xué)中的應(yīng)用 9
    1.2.1 生物信息學(xué)的定義和研究范圍 9
    1.2.2 生物信息學(xué)中的數(shù)據(jù)挖掘過程 11
    1.2.3 數(shù)據(jù)挖掘在生物信息學(xué)中的應(yīng)用和展望 12
    1.3 本書工作 13
    第2章 基于可變精度粗糙集的基因功能預(yù)測(cè)方法 15
    2.1 引言 15
    2.2 GO術(shù)語(yǔ)屬性的離散化 17
    2.2.1 定義和GO術(shù)語(yǔ)的屬性 17
    2.2.2 GO術(shù)語(yǔ)屬性的離散化方法 18
    2.3 GO術(shù)語(yǔ)的決策規(guī)則提取方法 20
    2.3.1 可變精度粗糙集的相關(guān)定義 20
    2.3.2 基于可變精度粗糙集的規(guī)則提取算法 22
    2.4 規(guī)則提取實(shí)例 23
    2.4.1 統(tǒng)計(jì)術(shù)語(yǔ)所在單元及所在單元的相關(guān)屬性 23
    2.4.2 GO術(shù)語(yǔ)屬性的離散化 24
    2.4.3 GO術(shù)語(yǔ)決策規(guī)則的提取 25
    2.5 實(shí)驗(yàn)結(jié)果與分析 26
    2.5.1 實(shí)驗(yàn)結(jié)果評(píng)價(jià)方法 26
    2.5.2 實(shí)驗(yàn)數(shù)據(jù)集 26
    2.5.3 實(shí)驗(yàn)結(jié)果和分析 27
    2.6 本章小結(jié) 28
    第3章 基于21號(hào)染色體四個(gè)種群的單體型差異比較研究 29
    3.1 背景介紹 29
    3.2 研究對(duì)象和數(shù)據(jù)來(lái)源 30
    3.2.1 研究對(duì)象 30
    3.2.2 數(shù)據(jù)來(lái)源 31
    3.3 采用的研究方法 31
    3.3.1 準(zhǔn)備數(shù)據(jù) 31
    3.3.2 獲取四個(gè)種群的標(biāo)簽SNP文件 32
    3.3.3 獲取四個(gè)種群的SNP單體型數(shù)據(jù)文件 33
    3.4 四個(gè)種群?jiǎn)误w型差距比較的數(shù)學(xué)模型 34
    3.5 數(shù)據(jù)結(jié)果 35
    3.6 結(jié)論 36
    第4章 基于Y染色體SNP基因型頻率數(shù)據(jù)的種群進(jìn)化研究 37
    4.1 引言 37
    4.1.1 背景介紹 37
    4.1.2 相關(guān)工作 38
    4.2 單核苷酸多態(tài)性理論和國(guó)際單體型圖計(jì)劃介紹 39
    4.2.1 單核苷酸多態(tài)性基礎(chǔ)理論 39
    4.2.2 國(guó)際人類基因組單體型圖計(jì)劃介紹 43
    4.3 系統(tǒng)進(jìn)化樹的構(gòu)建理論 43
    4.3.1 人類起源學(xué)說 43
    4.3.2 系統(tǒng)進(jìn)化樹 45
    4.4 基于Y染色體SNP基因型頻率數(shù)據(jù)的種群進(jìn)化樹 49
    4.4.1 研究對(duì)象和數(shù)據(jù)來(lái)源 49
    4.4.2 采用的研究方法 50
    4.5 模擬實(shí)驗(yàn) 55
    4.6 本章小結(jié) 58
    第5章 基于SOM算法的蛋白質(zhì)亞細(xì)胞位置預(yù)測(cè)研究 59
    5.1 自組織特征映射SOM模型 59
    5.2 SOM算法的具體步驟 59
    5.3 SOM算法實(shí)際應(yīng)用中的幾個(gè)問題 60
    5.3.1 數(shù)據(jù)歸一化 60
    5.3.2 輸出節(jié)點(diǎn)的規(guī)模 61
    5.3.3 鄰居節(jié)點(diǎn)范圍和距離函數(shù)的選擇 61
    5.3.4 SOM加速算法Batch-Type SOM 62
    5.4 實(shí)驗(yàn)環(huán)境和實(shí)驗(yàn)數(shù)據(jù) 63
    5.5 實(shí)驗(yàn)結(jié)果評(píng)價(jià)方法 63
    5.6 實(shí)驗(yàn)結(jié)果分析 64
    5.6.1 算法有效性 64
    5.6.2 不同實(shí)驗(yàn)集合的準(zhǔn)確率 64
    5.6.3 Bacth-Type SOM的加速效果 65
    5.7 結(jié)論 65
    第6章 結(jié)論和展望 66
    參考文獻(xiàn) 68
最新評(píng)論共有 0 位網(wǎng)友發(fā)表了評(píng)論
發(fā)表評(píng)論
評(píng)論內(nèi)容:不能超過250字,需審核,請(qǐng)自覺遵守互聯(lián)網(wǎng)相關(guān)政策法規(guī)。
用戶名: 密碼:
匿名?
注冊(cè)
主站蜘蛛池模板: 免费特黄一级欧美大片 | 久久亚洲精品无码观看不卡 | 日本欧美一区二区三区高清 | 欧美hdvideosex4k | 9久久免费国产精品特黄 | 怡红院亚洲红怡院天堂麻豆 | 亚洲黄色三级网站 | 中文字幕乱码中文乱码51精品 | 欧美操操操操 | 欧美性群另类交 | 久久精品国产亚洲aa | 一级黄视频 | 91九色国产porny | 深夜成人性视频免费看 | 久久成人a毛片免费观看网站 | 夜色视频一区二区三区 | 伊人久久大香线焦综合四虎 | 国产精品欧美亚洲韩国日本不卡 | 男人天堂视频在线 | 亚洲高清无在码在线无弹窗 | 国产 一二三四五六 | 正在播放国产精品放孕妇 | 久久久久欧美精品 | 理论片亚洲 | 亚洲一级毛片欧美一级说乱 | 欧美xxxx色视频在线观看 | 久久精品综合 | 国产一级片毛片 | 亚洲国产精品久久久久666 | 国产亚洲人成网站在线观看不卡 | 久草久热 | 67194午夜 | 日本人的色道免费网站 | 欧美成人三级网站在线观看 | 久久加勒比 | 欧美一级免费片 | 亚洲人成网址在线播放a | 欧美怡红院免费全视频 | 在线小毛片 | 中文字幕曰韩一区二区不卡 | 99精品国产在现线免费 |