《生物信息學(xué)資源》由會員分享,可在線閱讀,更多相關(guān)《生物信息學(xué)資源(69頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、1生 物 信 息 學(xué)Bioinformatics 2 復(fù) 習(xí) : n 細 胞n 蛋 白 質(zhì)n 核 酸 3 Questions:1. 蛋 白 質(zhì) 二 級 結(jié) 構(gòu) 有 哪 些 ?2. 真 核 生 物 的 啟 動 子 有 什 么 作 用 ?3. TSS,外 顯 子 和 內(nèi) 含 子 的 概 念 。4. 如 何 判 斷 起 始 密 碼 子 和 終 止 密 碼 子 ?內(nèi) 含 子 ?5. 基 因 表 達 調(diào) 節(jié) 有 哪 些 ? 4 請 畫 出 示 意 圖 :1. 中 心 法 則2. 真 核 生 物 基 因 的 一 般 結(jié) 構(gòu) 5 核 酸 復(fù) 制 DNA 轉(zhuǎn) 錄 逆 轉(zhuǎn) 錄 復(fù) 制 RNA 蛋 白 質(zhì) 翻 譯
2、 調(diào) 控 6TATA盒 翻 譯 起 始植 物 C/GAANNATGG動 物 A/GNNATGG 各 內(nèi) 含 子 加 poly(A)信 號植 物 G/AATAA1-3動 物 AATAAA 終 止 密 碼 子 各 個 外 顯 子 AGGA或 CAAT盒 加 帽 位 點 5m7GpppNp 5端 真 核 基 因 的 一 般 結(jié) 構(gòu) TSS 7 8 9 提 綱 : n 模 式 生 物 測 序n 3大 核 酸 數(shù) 據(jù) 庫n 蛋 白 質(zhì) 數(shù) 據(jù) 庫 10 提 綱 : n 模 式 生 物 測 序n 3大 核 酸 數(shù) 據(jù) 庫n 蛋 白 質(zhì) 數(shù) 據(jù) 庫 11human Arabidopsis Thermotog
3、a maritimaEscherichia coliBuchnerasp. APS Rickettsia prowazekiiUreaplasma urealyticum Bacillus subtilis Drosophila melanogasterThermoplasma acidophilum Plasmodium falciparum Helicobacter pylori mouse Caenorhabitis elegans rat Borrelia burgorferiBorrelia burgorferi Aquifex aeolicus Neisseria meningit
4、idis Z2491 Mycobacterium tuberculosis 12 模 式 生 物 基 因 組 計 劃 酵 母 、 線 蟲 、 果 蠅 、 細 菌 、 擬 南 芥 等 共 約已 完 成 , 正 在 進 行 。 目 前 總 量 已 達 堿 基 對 ! virusesplasmids bacteriafungi plantsalgaeinsectsmollusksreptilesbirdsmammalsGenome sizes in nucleotide pairs (base-pairs) 104 108105 106 107 10111010109bony fishamphibi
5、ans 14 不 具 有 細 胞 形 態(tài) 結(jié) 構(gòu) , 僅 由 核 酸 和 蛋 白 質(zhì) 構(gòu) 成 ; 如 : 人 艾 滋 病 毒 HIV、 SARS冠 狀 病 毒 體 積 小 , 10 300nm; 嚴 格 的 專 性 細 胞 內(nèi) 寄 生 ; 對 抗 生 素 不 敏 感 。 電 子 顯 微 鏡 下 的 SARS冠 狀 病 毒100nm 15 Escherichia coli大 腸 桿 菌大 腸 桿 菌 是 研 究 得 最 為 詳 盡 的 一 個 模 式 生 物 。 這 種只 有 1.6微 米 長 的 、 可 以 迅 速 繁 殖 的 單 細 胞 原 核 生 物 ,已 經(jīng) 成 為 實 驗 室 和 基
6、因 工 程 的 重 要 工 具 。Escherichia coli O157:H7Escherichia coli K12 16 Saccharomyces cerevisiae釀 酒 酵 母真 菌 界 的 單 細 胞 真 核 生 物 , 它 的 全 基 因 組已 在 1996年 測 定 。 17 秀 麗 線 蟲 Caenorhabditis elegans一 種 透 明 的 、 生 活 在 海 灘 泥 沙 中 的 小 蟲 。 細 胞 數(shù) 目 一 定 : 成 蟲 細 胞 數(shù) 目 只 有 959個 , 其 中 包 括 302個 神 經(jīng) 元 ; 有 6條 染 色 體 , 全 基 因 組 于 199
7、8年 測 定 , 長 9.7Mb 18 Drosophila melanogaster果 蠅繁 殖 很 快 、 容 易 誘 發(fā) 變 異 的 小 昆 蟲 ???長 達 1.8億 核 苷 酸 。 19 Arabidopsis thaliana擬 南 芥?zhèn)€ 體 生 活 周 期 只 有 6周 的 十 字 花 科小 草 , 是 一 種 理 想 的 模 式 植 物 。 20 Oryza sativa水 稻單 子 葉 植 物 模 式 植 物 , 390-430MB 21 1個 受 精 卵 在 24小 時 內(nèi) 分 裂 到 各 種 器 官 初 具 雛 形 的 程 度 ; 22 身 體 透 明 的 小 魚 , 生
8、 活 周 期 約 3個 月 , 是 研 究 脊 椎 動 物 發(fā) 育過 程 的 良 好 對 象 。 23 基 因 組 大 小 與 人 類 相 近 , 約 30億 個 核 苷 酸 對 ; 24 25 26 提 綱 : n 模 式 生 物 測 序n 3大 核 酸 數(shù) 據(jù) 庫n 蛋 白 質(zhì) 數(shù) 據(jù) 庫 27 主 要 的 數(shù) 據(jù) 庫 資 源 核 酸 序 列 數(shù) 據(jù) 庫 主 要 有 GenBank, EMBL, DDBJ等 . 蛋 白 質(zhì) 序 列 數(shù) 據(jù) 庫 主 要 有 SWISS-PROT, PIR, TrEMBL等 , 蛋 白 結(jié) 構(gòu) 數(shù) 據(jù) 庫 有 PDB, MMDB等 , 與 基 因 組 有 關(guān)
9、的 數(shù) 據(jù) 庫 還 有 dbEST, OMIM等 , 28 3大 核 酸 數(shù) 據(jù) 庫 基 因 組 數(shù) 據(jù) 庫 的 相 關(guān) 背 景 。 主 要 的 基 因 組 數(shù) 據(jù) 庫 資 源 。 重 點 介 紹 GenBank 29ATTGACTA Primary vs. Derivative DatabasesACGTGCTTGACA CGTGAATTGACTA TATAGCCGACGTGCACGTGCACGTGCTTGACA TTGACATTGACACGTGA CGTGACGTGA ATTGACTAATTGACTA ATTGACTAATTGACTA TATAGCCGTATAGCCGTATAGCCGTAT
10、AGCCGGenBankAGCCG T TAGCCGTATAG C TATAGCCG ATGA CATT GAGA ATTATT CC GAGA ATTCCGAGA ATTATT CC GAGA ATTCCSequencingCenters GAGA ATTCC GAGA ATTCC UniGeneRefSeqGenomeAssemblyLabs CuratorsAlgorithms TATAGCCGAGCTCCGATACCGATGACAA 30 DNA序 列 數(shù) 據(jù) 庫 最 早 于 1982年 在 歐 洲 分 子 生 物 學(xué) 實驗 室 誕 生 , 隨 即 就 開 始 了 一 個 數(shù) 據(jù) 庫
11、爆 炸 的 時 代 。 此 后 不 久 因 一 項 美 國 國 家 健 康 研 究 中 心 與 洛 斯 阿 拉莫 斯 國 家 實 驗 室 的 合 同 而 誕 生 了 GenBank。 日 本 的 DNA數(shù) 據(jù) 庫 ( DDBJ) , 在 幾 年 后 加 入 了 數(shù) 據(jù)收 集 的 合 作 ?;?因 組 數(shù) 據(jù) 庫 的 發(fā) 展 歷 史 31 基 因 組 數(shù) 據(jù) 庫 的 發(fā) 展 歷 史 1988年 一 次 三 方 會 議 之 后 ( 現(xiàn) 在 稱 之 為 “ 國 際 DNA序 列 數(shù) 據(jù) 庫 合 作 計 劃 ” ) 達 成 協(xié) 議 , 對 數(shù) 據(jù) 庫 的 記錄 采 用 共 同 的 格 式 現(xiàn) 在 三
12、個 中 心 都 收 集 直 接 提 交 的 數(shù) 據(jù) , 并 在 三 者 之間 發(fā) 布 。 32 三 大 基 因 數(shù) 據(jù) 庫 GenbankGenbank庫 包 含 了 所 有 已 知 的 核 酸 序 列 和 蛋 白 質(zhì) 序 列 , 以 及 與它 們 相 關(guān) 的 文 獻 著 作 和 生 物 學(xué) 注 釋 。 它 是 由 美 國 國 立 生 物 技 術(shù)信 息 中 心 (NCBI)建 立 和 維 護 的 。NCBI的 網(wǎng) 址 是 : http:/www.ncbi.nlm.nih.gov。 EMBL核 酸 序 列 數(shù) 據(jù) 庫由 歐 洲 生 物 信 息 學(xué) 研 究 所 (EBI)維 護 的 核 酸 序 列
13、 數(shù) 據(jù) 構(gòu) 成 , 查詢 檢 索 可 以 通 過 通 過 因 特 網(wǎng) 上 的 序 列 提 取 系 統(tǒng) (SRS)服 務(wù) 完 成 。數(shù) 據(jù) 庫 網(wǎng) 址 是 : http:/www.ebi.ac.uk/embl/。 DDBJ數(shù) 據(jù) 庫日 本 DNA數(shù) 據(jù) 倉 庫 (DDBJ)也 是 一 個 全 面 的 核 酸 序 列 數(shù) 據(jù) 庫 ,與 Genbank和 EMBL核 酸 庫 合 作 交 換 數(shù) 據(jù) 。 使 用 其 主 頁 上 提 供的 SRS工 具 進 行 數(shù) 據(jù) 檢 索 和 序 列 分 析 。DDBJ的 網(wǎng) 址 是 : http:/www.ddbj.nig.ac.jp/。 33GenBank P
14、ublicfreeAvailableviaInternetEMBL Data Library DDBJ (DNA Data Bank of Japan)三 大 基 因 數(shù) 據(jù) 庫 之 間 的 關(guān) 系 34 http:/www.ncbi.nlm.nih.gov/http:/www.ddbj.nig.ac.jp/searches-e.htmlhttp:/www.ebi.ac.uk/embl/ 35 美 國 的 核 酸 數(shù) 據(jù) 庫 GenBank Banson,D.A. et al. (1998) Nucleic Acids Res. 26, 1-7 從1979年 開 始 建 設(shè) , 1982年 正
15、 式 運 行 ; 36 37 歐 洲 分 子 生 物 學(xué) 實 驗 室 的 EMBL數(shù) 據(jù)庫 也 于 1982年 開 始 服 務(wù) 38 39 日 本 于 1984年 開 始 建 立 國 家 級 的 核 酸數(shù) 據(jù) 庫 DDBJ, 并 于 1987年 正 式 服 務(wù) 。 40 41 http:/www.ncbi.nlm.nih.gov/http:/www.ddbj.nig.ac.jp/searches-e.htmlhttp:/www.ebi.ac.uk/embl/ 42 43 44 45 46 47 提 綱 : n 模 式 生 物 測 序n 3大 核 酸 數(shù) 據(jù) 庫n 蛋 白 質(zhì) 數(shù) 據(jù) 庫 48
16、49 主 要 的 數(shù) 據(jù) 庫 資 源 核 酸 序 列 數(shù) 據(jù) 庫 主 要 有 GenBank, EMBL, DDBJ等 . 蛋 白 質(zhì) 序 列 數(shù) 據(jù) 庫 主 要 有 SWISS-PROT, PIR, TrEMBL等 , 蛋 白 結(jié) 構(gòu) 數(shù) 據(jù) 庫 有 PDB, MMDB等 , 與 基 因 組 有 關(guān) 的 數(shù) 據(jù) 庫 還 有 dbEST, OMIM等 , 50 51 除 了 PIR外 , 另 一 個 重 要 的 蛋 白 質(zhì) 序 列 數(shù) 據(jù) 庫 則 是SwissProt。 該 數(shù) 據(jù) 庫 由 瑞 士 日 內(nèi) 瓦 大 學(xué) 于 1986年 創(chuàng) 建 , 目 前 由瑞 士 生 物 信 息 學(xué) 研 究 所
17、 和 歐 洲 生 物 信 息 學(xué) 研 究 所 EBI共同 維 護 和 管 理 。 52 PIR和 SwissProt是 創(chuàng) 建 最 早 、 使 用 最 為 廣 泛 的 兩個 蛋 白 質(zhì) 數(shù) 據(jù) 庫 。 蛋 白 質(zhì) 序 列 數(shù) 據(jù) 庫 TrEMBL是 從 EMBL中 的 cDNA序 列 翻譯 得 到 的 。 該 數(shù) 據(jù) 庫 采 用 SwissProt數(shù) 據(jù) 庫 格 式 , 包 含EMBL數(shù) 據(jù) 庫 中 所 有 編 碼 序 列 的 翻 譯 。 53 54 55 1. 由 美 國 NCBI翻 譯 自 GenBank的 DNA序 列 (1984年 ); 2. 在 EMBL和 GenBank數(shù) 據(jù) 庫
18、上 均 建 立 了 鏡 像 站 點 ; 3. 數(shù) 據(jù) 依 據(jù) 注 釋 的 質(zhì) 量 分 為 4類 。 網(wǎng) 址 : 分 類 名 稱(Name) 說 明(Comment) 記 錄 數(shù)(Number of entries)PIR1 已 分 類 、 已 注 釋(Classified and annotated) 13572PIR2 已 注 釋 (Annotated) 69368PIR3 未 核 實 (Unverified) 7508 PIR4 未 翻 譯 (Unencoded or untranslated) 196 56 57 58 主 要 的 數(shù) 據(jù) 庫 資 源 核 酸 序 列 數(shù) 據(jù) 庫 主 要
19、有 GenBank, EMBL, DDBJ等 . 蛋 白 質(zhì) 序 列 數(shù) 據(jù) 庫 主 要 有 SWISS-PROT, PIR, TrEMBL等 , 蛋 白 結(jié) 構(gòu) 數(shù) 據(jù) 庫 有 PDB, MMDB等 , 與 基 因 組 有 關(guān) 的 數(shù) 據(jù) 庫 還 有 dbEST, OMIM等 , 59 1. 目 前 最 主 要 的 蛋 白 質(zhì) 分 子 結(jié) 構(gòu) 數(shù) 據(jù) 庫 ; 2. 1970年 代 建 立 , 美 國 Brookhaven國 家 實 驗 室 維 護 管理 ; 3. 1988年 , 由 美 國 RCSB(research collaboratory for structural biology)
20、管 理 ; 4. 以 文 本 格 式 存 放 數(shù) 據(jù) , 包 括 原 子 坐 標 、 物 種 來 源 、測 定 方 法 、 提 交 者 信 息 、 一 級 結(jié) 構(gòu) 、 二 級 結(jié) 構(gòu) 等 ; PDB的 網(wǎng) 址 : http:/www.rcsb.org/pdb(美 國 ) 60 61 62 如 何 Access PDB記 錄 ? 63 如 何 Access PDB記 錄 ? 64 如 何 Access PDB記 錄 ? 65 如 何 Access PDB記 錄 ?DownloadPDB file ViewPDB file Structure viewoptions 66 如 何 Access PDB記 錄 ? 67 如 何 Access PDB記 錄 ? 68 提 綱 : n 模 式 生 物 測 序n 3大 核 酸 數(shù) 據(jù) 庫n 蛋 白 質(zhì) 數(shù) 據(jù) 庫 69 Questions:下 列 數(shù) 據(jù) 庫 分 別 是 什 么 類 型 的 數(shù) 據(jù) 庫 ? GenBank, PIR, DDBJ, SWISS-PROT, PDB, EMBL, TrEMBL,