生物信息學(xué)本科教學(xué)課件
生物信息學(xué)本科教學(xué)課件,生物信息學(xué),本科教學(xué)課件,生物,信息學(xué),本科,教學(xué),課件
多序列比較的實(shí)際應(yīng)用多序列比較的實(shí)際應(yīng)用主講教師:趙雨杰主講教師:趙雨杰多序列比較的實(shí)際應(yīng)用多序列比較的實(shí)際應(yīng)用多序列比較的實(shí)際應(yīng)用多序列比較的實(shí)際應(yīng)用多序列比較就是把兩條以上可能有系統(tǒng)進(jìn)化關(guān)系的多序列比較就是把兩條以上可能有系統(tǒng)進(jìn)化關(guān)系的多序列比較就是把兩條以上可能有系統(tǒng)進(jìn)化關(guān)系的多序列比較就是把兩條以上可能有系統(tǒng)進(jìn)化關(guān)系的序列進(jìn)行比較的方法。序列進(jìn)行比較的方法。序列進(jìn)行比較的方法。序列進(jìn)行比較的方法。目前對(duì)多序列比較的研究還在不斷前進(jìn)中,現(xiàn)有的目前對(duì)多序列比較的研究還在不斷前進(jìn)中,現(xiàn)有的目前對(duì)多序列比較的研究還在不斷前進(jìn)中,現(xiàn)有的目前對(duì)多序列比較的研究還在不斷前進(jìn)中,現(xiàn)有的大多數(shù)算法都基于漸進(jìn)比較的思想,在序列兩兩比大多數(shù)算法都基于漸進(jìn)比較的思想,在序列兩兩比大多數(shù)算法都基于漸進(jìn)比較的思想,在序列兩兩比大多數(shù)算法都基于漸進(jìn)比較的思想,在序列兩兩比較的基礎(chǔ)上逐步優(yōu)化多序列比較的結(jié)果。進(jìn)行多序較的基礎(chǔ)上逐步優(yōu)化多序列比較的結(jié)果。進(jìn)行多序較的基礎(chǔ)上逐步優(yōu)化多序列比較的結(jié)果。進(jìn)行多序較的基礎(chǔ)上逐步優(yōu)化多序列比較的結(jié)果。進(jìn)行多序列比較后可以對(duì)比較結(jié)果進(jìn)行進(jìn)一步處理,尤其是列比較后可以對(duì)比較結(jié)果進(jìn)行進(jìn)一步處理,尤其是列比較后可以對(duì)比較結(jié)果進(jìn)行進(jìn)一步處理,尤其是列比較后可以對(duì)比較結(jié)果進(jìn)行進(jìn)一步處理,尤其是在尋找基因和致力于發(fā)現(xiàn)新蛋白的努力中,人們習(xí)在尋找基因和致力于發(fā)現(xiàn)新蛋白的努力中,人們習(xí)在尋找基因和致力于發(fā)現(xiàn)新蛋白的努力中,人們習(xí)在尋找基因和致力于發(fā)現(xiàn)新蛋白的努力中,人們習(xí)慣于把新的序列同已知功能的蛋白序列作比較。慣于把新的序列同已知功能的蛋白序列作比較。慣于把新的序列同已知功能的蛋白序列作比較。慣于把新的序列同已知功能的蛋白序列作比較。在搜集的比較序列中,可以看出隱含于蛋白之中的在搜集的比較序列中,可以看出隱含于蛋白之中的在搜集的比較序列中,可以看出隱含于蛋白之中的在搜集的比較序列中,可以看出隱含于蛋白之中的物種進(jìn)化關(guān)系,以便于更好地理解蛋白的進(jìn)化。研物種進(jìn)化關(guān)系,以便于更好地理解蛋白的進(jìn)化。研物種進(jìn)化關(guān)系,以便于更好地理解蛋白的進(jìn)化。研物種進(jìn)化關(guān)系,以便于更好地理解蛋白的進(jìn)化。研究一個(gè)家族中的相關(guān)蛋白的差異,分析進(jìn)化壓力和究一個(gè)家族中的相關(guān)蛋白的差異,分析進(jìn)化壓力和究一個(gè)家族中的相關(guān)蛋白的差異,分析進(jìn)化壓力和究一個(gè)家族中的相關(guān)蛋白的差異,分析進(jìn)化壓力和生物秩序?qū)τ诠δ芟嚓P(guān)的蛋白進(jìn)化影響。研究完多生物秩序?qū)τ诠δ芟嚓P(guān)的蛋白進(jìn)化影響。研究完多生物秩序?qū)τ诠δ芟嚓P(guān)的蛋白進(jìn)化影響。研究完多生物秩序?qū)τ诠δ芟嚓P(guān)的蛋白進(jìn)化影響。研究完多序列比較中的高度保守區(qū)域,我們可以對(duì)蛋白質(zhì)的序列比較中的高度保守區(qū)域,我們可以對(duì)蛋白質(zhì)的序列比較中的高度保守區(qū)域,我們可以對(duì)蛋白質(zhì)的序列比較中的高度保守區(qū)域,我們可以對(duì)蛋白質(zhì)的整個(gè)結(jié)構(gòu)進(jìn)行預(yù)測(cè),并且猜測(cè)這些保守區(qū)域?qū)τ诰S整個(gè)結(jié)構(gòu)進(jìn)行預(yù)測(cè),并且猜測(cè)這些保守區(qū)域?qū)τ诰S整個(gè)結(jié)構(gòu)進(jìn)行預(yù)測(cè),并且猜測(cè)這些保守區(qū)域?qū)τ诰S整個(gè)結(jié)構(gòu)進(jìn)行預(yù)測(cè),并且猜測(cè)這些保守區(qū)域?qū)τ诰S持三維結(jié)構(gòu)的重要性。持三維結(jié)構(gòu)的重要性。持三維結(jié)構(gòu)的重要性。持三維結(jié)構(gòu)的重要性。分析一群相關(guān)蛋白質(zhì)時(shí),很有必要了解比較正確的分析一群相關(guān)蛋白質(zhì)時(shí),很有必要了解比較正確的分析一群相關(guān)蛋白質(zhì)時(shí),很有必要了解比較正確的分析一群相關(guān)蛋白質(zhì)時(shí),很有必要了解比較正確的構(gòu)成。發(fā)展用于多序列比較的程序是一個(gè)很有活力構(gòu)成。發(fā)展用于多序列比較的程序是一個(gè)很有活力構(gòu)成。發(fā)展用于多序列比較的程序是一個(gè)很有活力構(gòu)成。發(fā)展用于多序列比較的程序是一個(gè)很有活力的研究領(lǐng)域,絕大多數(shù)方法都是基于漸進(jìn)比較的研究領(lǐng)域,絕大多數(shù)方法都是基于漸進(jìn)比較的研究領(lǐng)域,絕大多數(shù)方法都是基于漸進(jìn)比較的研究領(lǐng)域,絕大多數(shù)方法都是基于漸進(jìn)比較(progressive alignmentprogressive alignment)的概念。漸進(jìn)比較的思想)的概念。漸進(jìn)比較的思想)的概念。漸進(jìn)比較的思想)的概念。漸進(jìn)比較的思想依賴(lài)于使用者用作比較的序列之間確實(shí)存在的生物依賴(lài)于使用者用作比較的序列之間確實(shí)存在的生物依賴(lài)于使用者用作比較的序列之間確實(shí)存在的生物依賴(lài)于使用者用作比較的序列之間確實(shí)存在的生物學(xué)上的或者更準(zhǔn)確地說(shuō)是系統(tǒng)發(fā)生學(xué)上的相互關(guān)聯(lián)。學(xué)上的或者更準(zhǔn)確地說(shuō)是系統(tǒng)發(fā)生學(xué)上的相互關(guān)聯(lián)。學(xué)上的或者更準(zhǔn)確地說(shuō)是系統(tǒng)發(fā)生學(xué)上的相互關(guān)聯(lián)。學(xué)上的或者更準(zhǔn)確地說(shuō)是系統(tǒng)發(fā)生學(xué)上的相互關(guān)聯(lián)。與數(shù)據(jù)庫(kù)檢索的關(guān)系與數(shù)據(jù)庫(kù)檢索的關(guān)系l l1 1、對(duì)數(shù)據(jù)庫(kù)搜索,檢索結(jié)果未知;、對(duì)數(shù)據(jù)庫(kù)搜索,檢索結(jié)果未知;l l2 2、數(shù)據(jù)庫(kù)檢索后尋找到一組相似序列;、數(shù)據(jù)庫(kù)檢索后尋找到一組相似序列;l l3 3、構(gòu)建進(jìn)化樹(shù)。、構(gòu)建進(jìn)化樹(shù)。CLUSTAL主講教師:趙雨杰主講教師:趙雨杰1.CLUSTAL Omega1.CLUSTAL OmegaCLUSTAL CLUSTAL 算法算法算法算法是一個(gè)最廣泛使用的多序列比較程序,是一個(gè)最廣泛使用的多序列比較程序,是一個(gè)最廣泛使用的多序列比較程序,是一個(gè)最廣泛使用的多序列比較程序,在任何主要的計(jì)算機(jī)平臺(tái)上都可以免費(fèi)使用。這個(gè)程在任何主要的計(jì)算機(jī)平臺(tái)上都可以免費(fèi)使用。這個(gè)程在任何主要的計(jì)算機(jī)平臺(tái)上都可以免費(fèi)使用。這個(gè)程在任何主要的計(jì)算機(jī)平臺(tái)上都可以免費(fèi)使用。這個(gè)程序基于漸進(jìn)比較的思想,將得到的一系列序列輸入,序基于漸進(jìn)比較的思想,將得到的一系列序列輸入,序基于漸進(jìn)比較的思想,將得到的一系列序列輸入,序基于漸進(jìn)比較的思想,將得到的一系列序列輸入,對(duì)于每?jī)蓚€(gè)序列進(jìn)行雙重比較并且計(jì)算結(jié)果?;谶@對(duì)于每?jī)蓚€(gè)序列進(jìn)行雙重比較并且計(jì)算結(jié)果?;谶@對(duì)于每?jī)蓚€(gè)序列進(jìn)行雙重比較并且計(jì)算結(jié)果?;谶@對(duì)于每?jī)蓚€(gè)序列進(jìn)行雙重比較并且計(jì)算結(jié)果?;谶@些比較,計(jì)算得到一個(gè)距離矩陣,反映了每對(duì)序列的些比較,計(jì)算得到一個(gè)距離矩陣,反映了每對(duì)序列的些比較,計(jì)算得到一個(gè)距離矩陣,反映了每對(duì)序列的些比較,計(jì)算得到一個(gè)距離矩陣,反映了每對(duì)序列的關(guān)系,然后,基于鄰近加入方法,這個(gè)矩陣被用來(lái)計(jì)關(guān)系,然后,基于鄰近加入方法,這個(gè)矩陣被用來(lái)計(jì)關(guān)系,然后,基于鄰近加入方法,這個(gè)矩陣被用來(lái)計(jì)關(guān)系,然后,基于鄰近加入方法,這個(gè)矩陣被用來(lái)計(jì)算出一個(gè)系統(tǒng)發(fā)生輔助樹(shù)。算出一個(gè)系統(tǒng)發(fā)生輔助樹(shù)。算出一個(gè)系統(tǒng)發(fā)生輔助樹(shù)。算出一個(gè)系統(tǒng)發(fā)生輔助樹(shù)。這個(gè)輔助樹(shù),加權(quán)后可以證實(shí)極相近的序列,然后這個(gè)輔助樹(shù),加權(quán)后可以證實(shí)極相近的序列,然后這個(gè)輔助樹(shù),加權(quán)后可以證實(shí)極相近的序列,然后這個(gè)輔助樹(shù),加權(quán)后可以證實(shí)極相近的序列,然后以雙重比較極相近的序列開(kāi)始,為組建比較提供基以雙重比較極相近的序列開(kāi)始,為組建比較提供基以雙重比較極相近的序列開(kāi)始,為組建比較提供基以雙重比較極相近的序列開(kāi)始,為組建比較提供基礎(chǔ),重新比較下一個(gè)加入的比較序列,依次類(lèi)推。礎(chǔ),重新比較下一個(gè)加入的比較序列,依次類(lèi)推。礎(chǔ),重新比較下一個(gè)加入的比較序列,依次類(lèi)推。礎(chǔ),重新比較下一個(gè)加入的比較序列,依次類(lèi)推。如果加入的序列較多,那么毫無(wú)疑問(wèn),必須加入空如果加入的序列較多,那么毫無(wú)疑問(wèn),必須加入空如果加入的序列較多,那么毫無(wú)疑問(wèn),必須加入空如果加入的序列較多,那么毫無(wú)疑問(wèn),必須加入空位以適應(yīng)序列的差異,但是加入空位必須接受空位位以適應(yīng)序列的差異,但是加入空位必須接受空位位以適應(yīng)序列的差異,但是加入空位必須接受空位位以適應(yīng)序列的差異,但是加入空位必須接受空位開(kāi)放罰分和空位擴(kuò)展罰分。開(kāi)放罰分和空位擴(kuò)展罰分。開(kāi)放罰分和空位擴(kuò)展罰分。開(kāi)放罰分和空位擴(kuò)展罰分。在絕大多數(shù)情況下,使用者不會(huì)在比較時(shí)加入結(jié)構(gòu)在絕大多數(shù)情況下,使用者不會(huì)在比較時(shí)加入結(jié)構(gòu)在絕大多數(shù)情況下,使用者不會(huì)在比較時(shí)加入結(jié)構(gòu)在絕大多數(shù)情況下,使用者不會(huì)在比較時(shí)加入結(jié)構(gòu)信息,但是空位開(kāi)放補(bǔ)償利用了可以出現(xiàn)在信息,但是空位開(kāi)放補(bǔ)償利用了可以出現(xiàn)在信息,但是空位開(kāi)放補(bǔ)償利用了可以出現(xiàn)在信息,但是空位開(kāi)放補(bǔ)償利用了可以出現(xiàn)在-螺旋螺旋螺旋螺旋或或或或-折疊末端的特殊殘基以及空位罰分所偏好的殘折疊末端的特殊殘基以及空位罰分所偏好的殘折疊末端的特殊殘基以及空位罰分所偏好的殘折疊末端的特殊殘基以及空位罰分所偏好的殘基。已經(jīng)存在的空位的擴(kuò)展原則很簡(jiǎn)單,只是要在基。已經(jīng)存在的空位的擴(kuò)展原則很簡(jiǎn)單,只是要在基。已經(jīng)存在的空位的擴(kuò)展原則很簡(jiǎn)單,只是要在基。已經(jīng)存在的空位的擴(kuò)展原則很簡(jiǎn)單,只是要在那些極有可能在結(jié)構(gòu)中形成彎曲的位點(diǎn)擴(kuò)展空位,那些極有可能在結(jié)構(gòu)中形成彎曲的位點(diǎn)擴(kuò)展空位,那些極有可能在結(jié)構(gòu)中形成彎曲的位點(diǎn)擴(kuò)展空位,那些極有可能在結(jié)構(gòu)中形成彎曲的位點(diǎn)擴(kuò)展空位,這些空位擴(kuò)展罰分計(jì)算是由位置決定的。這些空位擴(kuò)展罰分計(jì)算是由位置決定的。這些空位擴(kuò)展罰分計(jì)算是由位置決定的。這些空位擴(kuò)展罰分計(jì)算是由位置決定的。為了介紹為了介紹為了介紹為了介紹CLUSTAL CLUSTAL 的的的的使用,考察一下從四種不同使用,考察一下從四種不同使用,考察一下從四種不同使用,考察一下從四種不同物種來(lái)源的物種來(lái)源的物種來(lái)源的物種來(lái)源的matrix metalloproteinase 9 matrix metalloproteinase 9 preproproteinpreproprotein蛋白(蛋白(蛋白(蛋白(Homo sapiensHomo sapiens,Paralichthys Paralichthys olivaceusolivaceus,Rattus norvegicusRattus norvegicus,Bos taurusBos taurus)。)。)。)。將下將下將下將下列蛋白序列放入一個(gè)列蛋白序列放入一個(gè)列蛋白序列放入一個(gè)列蛋白序列放入一個(gè)獨(dú)立的純文本文件獨(dú)立的純文本文件獨(dú)立的純文本文件獨(dú)立的純文本文件中中中中。lgi|14786152|ref|XP_029934.1|matrix metalloproteinase 9 preproprotein Homo sapienslMSLWQPLVLVLLVLGCCFAAPRQRQSTLVLFPGDLRTNLTDRQLAEEYLYRYGYTRVAEMRGESKSLGPALLLLQKQLSLPETGELDSATLKAMRTPRCGVPDLGRFQTFEGDLKWHHHNITYWIQNYSEDLPRAVIDDAFARAFALWSAVTPLTFTRVYSRDADIVIQFGVAEHGDGYPFDGKDGLLAHAFPPGPGIQGDAHFDDDELWSLGKGVVVPTRFGNADGAACHFPFIFEGRSYSACTTDGRSDGLPWCSTTANYDTDDRFGFCPSERLYTQDGNADGKPCQFPFIFQGQSYSACTTDGRSDGYRWCATTANYDRDKLFGFCPTRADSTVMGGNSAGELCVFPFTFLGKEYSTCTSEGRGDGRLWCATTSNFDSDKKWGFCPDQGYSLFLVAAHEFGHALGLDHSSVPEALMYPMYRFTEGPPLHKDDVNGIRHLYGPRPEPEPRPPTTTTPQPTAPPTVCPTGPPTVHPSERPTAGPTGPPSAGPTGPPTAGPSTATTVPLSPVDDACNVNIFDAIAEIGNQLYLFKDGKYWRFSEGRGSRPQGPFLIADKWPALPRKLDSVFEERLSKKLFFFSGRQVWVYTGASVLGPRRLDKLGLGADVAQVTGALRSGRGKMLLFSGRRLWRFDVKAQMVDPRSASEVDRMFPGVPLDTHDVFQYREKAYFCQDRFYWRVSSRSELNQVDQVGYVTYDILQCPEDlgi|15718389|dbj|BAB68366.1|gelatinase Paralichthys olivaceuslMRCCALAVCLVLVIVQDGWSLPLRSISVTFPGDILKNVTDTDLAETYLKRFGYLDKMHRSGFQSMVSTAKALKMMQRQMGLKETGKLDKSTLEAMKQPRCGVPDVANYQTFEGDLKWDHNDVTYRTLNYSPDMESSLIDDAFARAFKVWSDVTPLTFTRLYEGTADIMISFGKADHGDPYPFDGRNGLLAHAYPPGEGVQGDAHFDDDEHWTLGNGPAVKTLYGNADGAMCHFPFTFEGKSYTSCTTDGRTDNLPWCATTADYSRDGKYGFCPSELLYTVGGNADGAKCVFPFVFLEKEYDSCTKEGRSDGYRWCATTANFDQDQKYGFCPSRDTAVFGGNSEGEPCHFPFVFLGKEYDSCTSEGREDGKLWCSTTDNYDEDAKWGFCDDEGYSLFLVAAHEFGHALGLDHSNIREALMYPMYTYVEDFSLHKDDIEGIQYLYGRGTGPDPTPPQPTSTTTTPNPTEEPEPTTPQPVDPTRDACKLTKFDTITMIENELHFFENGNYWKMPSRGDGGLKGPFSLSERWPALPAVIDSAFEDLLTKNMYFFSGNRFWVYTKEGVLGPRSIEKLGLPTSIQKVEGALQRGKGKVLLFTEESFWKFDLKSQKMDKGYPKSTDYVFGGVPNDAHDVFQYKGHMYFCRDSFYWRMNSRRQVDRVGYVKYDLLKCSDSYlgi|13591993|ref|NP_112317.1|matrix metalloproteinase 9(gelatinase B,92-kDa type IV collagenase)Rattus norvegicuslMNPWQPLLLVLLALGYSFAAPHQRQPTYVVFPRDLKTSNLTDTQLAEDYLYRYGYTRAAQMMGEKQSLRPALLMLQKQLSLPQTGELDSETLKAIRSPRCGVPDVGKFQTFEGDLKWHHHNITYWIQSYTEDLPRDVIDDSFARAFAVWSAVTPLTFTRVYGLEADIVIQFGVAEHGDGYPFDGKDGLLAHAFPPGPGIQGDAHFDDDELWSLGKGAVVPTYFGNANGAPCHFPFTFEGRSYLSCTTDGRNDGKPWCGTTADYDTDRKYGFCPSENLYTEHGNGDGKPCVFPFIFEGHSYSACTTKGRSDGYRWCATTANYDQDKLYGFCPTRADVTVTGGNSAGEMCVFPFVFLGKQYSTCTGEGRSDGRLWCATTSNFDADKKWGFCPDQGYSLFLVAAHEFGHALGLDHSSVPEALMYPMYHYHEDSPLHEDDIKGIQHLYGRGSKPDPRPPATTAAEPQPTAPPTMCPTAPPMAYPTGGPTVAPTGAPSPGPTGPPTAGPSEAPTESSTPVDNPCNVDVFDAIADIQGALHFFKDGRYWKFSNHGGSQLQGPFLIARTWPALPAKLNSAFEDPQSKKIFFFSGRKMWVYTGQTVLGPRSLDKLGLGSEVTLVTGLLPRRGGKALLISRERIWKFDL KSQKVDPQSVTRLDNEFSGVPWNSHNVFHYQDKAYFCHDKYFWRVSFHNRVNQVDHVAYVTYDLLQCPlgi|467621|emb|CAA55127.1|matrix metalloproteinase 9 Bos tauruslMSPLQPLVLALLVLACCSAVPRRRQPTVVVFPGEPRTNLTNRQLAEEYLYRYGYTPGAELSEDGQSLQRALLRFQRRLSLPETGELDSTTLNAMRAPRCGVPDVGRFQTFEGELKWHHHNITYWIQNYSEDLPRAVIDDAFARAFALWSAVTPLTFTRVYGPEADIVIQFGVREHGDGYPFDGKNGLLAHAFPPGKGIQGDAHFDDEELWSLGKGVVIPTYFGNAKGAACHFPFTFEGRSYSACTTDGRSDDMLWCSTTADYDADRQFGFCPSERLYTQDGNADGKPCVFPFTFQGRTYSACTSDGRSDGYRWCATTANYDQDKLYGFCPTRVDATVTGGNAAGELCVFPFTFLGKEYSACTREGRNDGHLWCATTSNFDKDKKWGFCPDQGYSLFLVAAHEFGHALGLDHTSVPEALMYPMYRFTEEHPLHRDDVQGIQHLYGPRPEPEPRPPTTTTTTTTEPQPTAPPTVCVTGPPTARPSEGPTTGPTGPPAAGPTGPPTAGPSAAPTESPDPAEDVCNVDIFDAIAEIRNRLHFFKAGKYWRLSEGGGRRVQGPFLVKSKWPALPRKLDSAFEDPLTKKIFFFSGRQVWVYTGASLLGPRRLDKLGLGPEVAQVTGALPRPEGKVLLFSGQSFWRFDVKTQKVDPQSVTPVDQMFPGVPISTHDIFQYQEKAYFCQDHFYWRVSSQNEVNQVDYVGYVTFDLLKCPED 這四種輸入序列放在一個(gè)單獨(dú)的文件中,作成這四種輸入序列放在一個(gè)單獨(dú)的文件中,作成這四種輸入序列放在一個(gè)單獨(dú)的文件中,作成這四種輸入序列放在一個(gè)單獨(dú)的文件中,作成7 7種可種可種可種可以接受的格式中的一種,以接受的格式中的一種,以接受的格式中的一種,以接受的格式中的一種,NBRF/PIR NBRF/PIR;EMBL/UniProtKB/Swiss-ProtEMBL/UniProtKB/Swiss-Prot;Pearson(Fasta)Pearson(Fasta);GDE GDE;ALN/ClustalW GCG/MSF ALN/ClustalW GCG/MSF;RSFRSF進(jìn)入進(jìn)入進(jìn)入進(jìn)入http:/www.ebi.ac.uk/Tools/msa/clustalo/http:/www.ebi.ac.uk/Tools/msa/clustalo/站點(diǎn),站點(diǎn),站點(diǎn),站點(diǎn),將需要比較的序列輸入工具程序中將需要比較的序列輸入工具程序中將需要比較的序列輸入工具程序中將需要比較的序列輸入工具程序中 ,在在在在“序列輸入序列輸入序列輸入序列輸入窗口窗口窗口窗口”中中中中輸入輸入輸入輸入或粘貼需要比較的序列,也可以在或粘貼需要比較的序列,也可以在或粘貼需要比較的序列,也可以在或粘貼需要比較的序列,也可以在“文件輸入窗口文件輸入窗口文件輸入窗口文件輸入窗口”將含有需要比較序列的文件名輸入將含有需要比較序列的文件名輸入將含有需要比較序列的文件名輸入將含有需要比較序列的文件名輸入ClustalClustal運(yùn)行運(yùn)行運(yùn)行運(yùn)行程序中,進(jìn)行多序列比較。程序中,進(jìn)行多序列比較。程序中,進(jìn)行多序列比較。程序中,進(jìn)行多序列比較。CLUSTA OCLUSTA O結(jié)束時(shí),會(huì)顯示最終的比較結(jié)果,在結(jié)束時(shí),會(huì)顯示最終的比較結(jié)果,在結(jié)束時(shí),會(huì)顯示最終的比較結(jié)果,在結(jié)束時(shí),會(huì)顯示最終的比較結(jié)果,在比較下方,一些位點(diǎn)被標(biāo)記為星號(hào)或圓點(diǎn),這些比較下方,一些位點(diǎn)被標(biāo)記為星號(hào)或圓點(diǎn),這些比較下方,一些位點(diǎn)被標(biāo)記為星號(hào)或圓點(diǎn),這些比較下方,一些位點(diǎn)被標(biāo)記為星號(hào)或圓點(diǎn),這些標(biāo)記分別顯示這些殘基在序列中是絕對(duì)或是高度標(biāo)記分別顯示這些殘基在序列中是絕對(duì)或是高度標(biāo)記分別顯示這些殘基在序列中是絕對(duì)或是高度標(biāo)記分別顯示這些殘基在序列中是絕對(duì)或是高度保守的。結(jié)果輸出的最后部分是進(jìn)化樹(shù),可以看保守的。結(jié)果輸出的最后部分是進(jìn)化樹(shù),可以看保守的。結(jié)果輸出的最后部分是進(jìn)化樹(shù),可以看保守的。結(jié)果輸出的最后部分是進(jìn)化樹(shù),可以看出,比較的四種源自不同種屬的蛋白進(jìn)化關(guān)系。出,比較的四種源自不同種屬的蛋白進(jìn)化關(guān)系。出,比較的四種源自不同種屬的蛋白進(jìn)化關(guān)系。出,比較的四種源自不同種屬的蛋白進(jìn)化關(guān)系。MultAlinMultAlin主講教師:趙雨杰主講教師:趙雨杰2.MultAlin2.MultAlin2.MultAlin2.MultAlinMultAlinMultAlin方法也是基于用一系列雙重比較開(kāi)始的方法也是基于用一系列雙重比較開(kāi)始的方法也是基于用一系列雙重比較開(kāi)始的方法也是基于用一系列雙重比較開(kāi)始的思思思思想,然后想,然后想,然后想,然后基于雙重比較的打分值進(jìn)行一個(gè)分層次的基于雙重比較的打分值進(jìn)行一個(gè)分層次的基于雙重比較的打分值進(jìn)行一個(gè)分層次的基于雙重比較的打分值進(jìn)行一個(gè)分層次的聚類(lèi)。當(dāng)序列都分成類(lèi)后,開(kāi)始進(jìn)行多序列比較,聚類(lèi)。當(dāng)序列都分成類(lèi)后,開(kāi)始進(jìn)行多序列比較,聚類(lèi)。當(dāng)序列都分成類(lèi)后,開(kāi)始進(jìn)行多序列比較,聚類(lèi)。當(dāng)序列都分成類(lèi)后,開(kāi)始進(jìn)行多序列比較,計(jì)算出多序列比較中的兩個(gè)序列比較的新值,基于計(jì)算出多序列比較中的兩個(gè)序列比較的新值,基于計(jì)算出多序列比較中的兩個(gè)序列比較的新值,基于計(jì)算出多序列比較中的兩個(gè)序列比較的新值,基于這些新值,重新構(gòu)建一棵樹(shù)。這個(gè)過(guò)程不斷進(jìn)行,這些新值,重新構(gòu)建一棵樹(shù)。這個(gè)過(guò)程不斷進(jìn)行,這些新值,重新構(gòu)建一棵樹(shù)。這個(gè)過(guò)程不斷進(jìn)行,這些新值,重新構(gòu)建一棵樹(shù)。這個(gè)過(guò)程不斷進(jìn)行,直到分值不再上升,此時(shí)所有序列比較也就結(jié)束了。直到分值不再上升,此時(shí)所有序列比較也就結(jié)束了。直到分值不再上升,此時(shí)所有序列比較也就結(jié)束了。直到分值不再上升,此時(shí)所有序列比較也就結(jié)束了。MultAlinMultAlin(http:/multalin.toulouse.inra.fr/multalin/multhttp:/multalin.toulouse.inra.fr/multalin/multalin.htmlalin.html)可以在)可以在)可以在)可以在INRA ToulouseINRA Toulouse的一個(gè)環(huán)球網(wǎng)點(diǎn)上很的一個(gè)環(huán)球網(wǎng)點(diǎn)上很的一個(gè)環(huán)球網(wǎng)點(diǎn)上很的一個(gè)環(huán)球網(wǎng)點(diǎn)上很容易地執(zhí)行,要比較的序列按照容易地執(zhí)行,要比較的序列按照容易地執(zhí)行,要比較的序列按照容易地執(zhí)行,要比較的序列按照FASTAFASTA的格式被粘貼到的格式被粘貼到的格式被粘貼到的格式被粘貼到序列輸入框內(nèi),也可以在文件輸入窗口輸入文件名序列輸入框內(nèi),也可以在文件輸入窗口輸入文件名序列輸入框內(nèi),也可以在文件輸入窗口輸入文件名序列輸入框內(nèi),也可以在文件輸入窗口輸入文件名,將將將將序列提交給服務(wù)器。序列提交給服務(wù)器。序列提交給服務(wù)器。序列提交給服務(wù)器。在提交序列之前,用主界面的一系列下拉菜單,用在提交序列之前,用主界面的一系列下拉菜單,用在提交序列之前,用主界面的一系列下拉菜單,用在提交序列之前,用主界面的一系列下拉菜單,用戶(hù)定義適當(dāng)?shù)膮?shù),比如輸出格式,可選的輸入格戶(hù)定義適當(dāng)?shù)膮?shù),比如輸出格式,可選的輸入格戶(hù)定義適當(dāng)?shù)膮?shù),比如輸出格式,可選的輸入格戶(hù)定義適當(dāng)?shù)膮?shù),比如輸出格式,可選的輸入格式,引用的分值矩陣以及空位開(kāi)放和擴(kuò)展罰分的分式,引用的分值矩陣以及空位開(kāi)放和擴(kuò)展罰分的分式,引用的分值矩陣以及空位開(kāi)放和擴(kuò)展罰分的分式,引用的分值矩陣以及空位開(kāi)放和擴(kuò)展罰分的分值。大多數(shù)用戶(hù)只會(huì)根據(jù)輸入序列的遠(yuǎn)近關(guān)系,選值。大多數(shù)用戶(hù)只會(huì)根據(jù)輸入序列的遠(yuǎn)近關(guān)系,選值。大多數(shù)用戶(hù)只會(huì)根據(jù)輸入序列的遠(yuǎn)近關(guān)系,選值。大多數(shù)用戶(hù)只會(huì)根據(jù)輸入序列的遠(yuǎn)近關(guān)系,選擇不同的分值矩陣。擇不同的分值矩陣。擇不同的分值矩陣。擇不同的分值矩陣。Blosum 45 MatrixBlosum 45 MatrixG 7 P -2 9 D -1 -1 7 E -2 0 2 6 N 0 -2 2 0 6 H -2 -2 0 0 1 10 Q -2 -1 0 2 0 1 6 K -2 -1 0 1 0 -1 1 5 R-2 -2 -1 0 0 0 1 3 7 S 0 -1 0 0 1 -1 0 -1 -1 4 T-2 -1 -1-1 0 -2 -1 -1 -1 2 5 A 0 -1 -2 -1 -1 -2 -1 -1 -2 1 0 5 M-2 -2 -3 -2 -2 0 0 -1-1 -2 -1 -1 6 V -3 -3 -3 -3 -3 -3 -3 -2 -2 -1 0 0 1 5 I -4 -2 -4 -3 -2 -3 -2 -3 -3-2 -1 -1 2 3 5 L-3 -3 -3 -2 -3 -2 -2 -3 -2-3 -1 -1 2 1 2 5 F-3 -3 -4 -3 -2 -2 -4 -3 -2 -2 -1 -2 0 0 0 1 8 Y-3 -3 -2 -2 -2 2 -1 -1 -1 -2 -1 -2 0 -1 0 0 3 8 W-2 -3 -4 -3 -4 -3 -2 -2 -2-4 -3 -2-2 -3 -2 -2 1 3 15 C -3 -4 -3 -3 -2 -3 -3 -3 -3 -1 -1 -1 -2-1 -3 -2 -2 -3 -5 12 G P D E N H Q K R S T A M V I L F Y W C Homo sapiensMSLWQPLVLVLLVLGCCFAAPRQRQSTLVLFPGDLRTNLTDRQLAEEYLYRYGYTRVAEMRGESKSLGPALLLLQKQLSLPETGELDSATLKAMRTPRCGVPDLGRFQTFEGDLKWHHHNITYWIQNYSEDLPRAVIDDAFARAFALWSAVTPLTFTRVYSRDADIVIQFGVAEHGDGYPFDGKDGLLAHAFPPGPGIQGDAHFDDDELWSLGKGVVVPTRFGNADGAACHFPFIFEGRSYSACTTDGRSDGLPWCSTTANYDTDDRFGFCPSERLYTQDGNADGKPCQFPFIFQGQSYSACTTDGRSDGYRWCATTANYDRDKLFGFCPTRADSTVMGGNSAGELCVFPFTFLGKEYSTCTSEGRGDGRLWCATTSNFDSDKKWGFCPDQGYSLFLVAAHEFGHALGLDHSSVPEALMYPMYRFTEGPPLHKDDVNGIRHLYGPRPEPEPRPPTTTTPQPTAPPTVCPTGPPTVHPSERPTAGPTGPPSAGPTGPPTAGPSTATTVPLSPVDDACNVNIFDAIAEIGNQLYLFKDGKYWRFSEGRGSRPQGPFLIADKWPALPRKLDSVFEERLSKKLFFFSGRQVWVYTGASVLGPRRLDKLGLGADVAQVTGALRSGRGKMLLFSGRRLWRFDVKAQMVDPRSASEVDRMFPGVPLDTHDVFQYREKAYFCQDRFYWRVSSRSELNQVDQVGYVTYDILQCPEDParalichthys olivaceusMRCCALAVCLVLVIVQDGWSLPLRSISVTFPGDILKNVTDTDLAETYLKRFGYLDKMHRSGFQSMVSTAKALKMMQRQMGLKETGKLDKSTLEAMKQPRCGVPDVANYQTFEGDLKWDHNDVTYRTLNYSPDMESSLIDDAFARAFKVWSDVTPLTFTRLYEGTADIMISFGKADHGDPYPFDGRNGLLAHAYPPGEGVQGDAHFDDDEHWTLGNGPAVKTLYGNADGAMCHFPFTFEGKSYTSCTTDGRTDNLPWCATTADYSRDGKYGFCPSELLYTVGGNADGAKCVFPFVFLEKEYDSCTKEGRSDGYRWCATTANFDQDQKYGFCPSRDTAVFGGNSEGEPCHFPFVFLGKEYDSCTSEGREDGKLWCSTTDNYDEDAKWGFCDDEGYSLFLVAAHEFGHALGLDHSNIREALMYPMYTYVEDFSLHKDDIEGIQYLYGRGTGPDPTPPQPTSTTTTPNPTEEPEPTTPQPVDPTRDACKLTKFDTITMIENELHFFENGNYWKMPSRGDGGLKGPFSLSERWPALPAVIDSAFEDLLTKNMYFFSGNRFWVYTKEGVLGPRSIEKLGLPTSIQKVEGALQRGKGKVLLFTEESFWKFDLKSQKMDKGYPKSTDYVFGGVPNDAHDVFQYKGHMYFCRDSFYWRMNSRRQVDRVGYVKYDLLKCSDSYRattus norvegicusMNPWQPLLLVLLALGYSFAAPHQRQPTYVVFPRDLKTSNLTDTQLAEDYLYRYGYTRAAQMMGEKQSLRPALLMLQKQLSLPQTGELDSETLKAIRSPRCGVPDVGKFQTFEGDLKWHHHNITYWIQSYTEDLPRDVIDDSFARAFAVWSAVTPLTFTRVYGLEADIVIQFGVAEHGDGYPFDGKDGLLAHAFPPGPGIQGDAHFDDDELWSLGKGAVVPTYFGNANGAPCHFPFTFEGRSYLSCTTDGRNDGKPWCGTTADYDTDRKYGFCPSENLYTEHGNGDGKPCVFPFIFEGHSYSACTTKGRSDGYRWCATTANYDQDKLYGFCPTRADVTVTGGNSAGEMCVFPFVFLGKQYSTCTGEGRSDGRLWCATTSNFDADKKWGFCPDQGYSLFLVAAHEFGHALGLDHSSVPEALMYPMYHYHEDSPLHEDDIKGIQHLYGRGSKPDPRPPATTAAEPQPTAPPTMCPTAPPMAYPTGGPTVAPTGAPSPGPTGPPTAGPSEAPTESSTPVDNPCNVDVFDAIADIQGALHFFKDGRYWKFSNHGGSQLQGPFLIARTWPALPAKLNSAFEDPQSKKIFFFSGRKMWVYTGQTVLGPRSLDKLGLGSEVTLVTGLLPRRGGKALLISRERIWKFDL KSQKVDPQSVTRLDNEFSGVPWNSHNVFHYQDKAYFCHDKYFWRVSFHNRVNQVDHVAYVTYDLLQCPBos taurusMSPLQPLVLALLVLACCSAVPRRRQPTVVVFPGEPRTNLTNRQLAEEYLYRYGYTPGAELSEDGQSLQRALLRFQRRLSLPETGELDSTTLNAMRAPRCGVPDVGRFQTFEGELKWHHHNITYWIQNYSEDLPRAVIDDAFARAFALWSAVTPLTFTRVYGPEADIVIQFGVREHGDGYPFDGKNGLLAHAFPPGKGIQGDAHFDDEELWSLGKGVVIPTYFGNAKGAACHFPFTFEGRSYSACTTDGRSDDMLWCSTTADYDADRQFGFCPSERLYTQDGNADGKPCVFPFTFQGRTYSACTSDGRSDGYRWCATTANYDQDKLYGFCPTRVDATVTGGNAAGELCVFPFTFLGKEYSACTREGRNDGHLWCATTSNFDKDKKWGFCPDQGYSLFLVAAHEFGHALGLDHTSVPEALMYPMYRFTEEHPLHRDDVQGIQHLYGPRPEPEPRPPTTTTTTTTEPQPTAPPTVCVTGPPTARPSEGPTTGPTGPPAAGPTGPPTAGPSAAPTESPDPAEDVCNVDIFDAIAEIRNRLHFFKAGKYWRLSEGGGRRVQGPFLVKSKWPALPRKLDSAFEDPLTKKIFFFSGRQVWVYTGASLLGPRRLDKLGLGPEVAQVTGALPRPEGKVLLFSGQSFWRFDVKTQKVDPQSVTPVDQMFPGVPISTHDIFQYQEKAYFCQDHFYWRVSSQNEVNQVDYVGYVTFDLLKCPED很明顯,用兩種方法分別得到的比較結(jié)果并不完全很明顯,用兩種方法分別得到的比較結(jié)果并不完全很明顯,用兩種方法分別得到的比較結(jié)果并不完全很明顯,用兩種方法分別得到的比較結(jié)果并不完全一樣。這并不意味這一種方法比另外一種方法優(yōu)越,一樣。這并不意味這一種方法比另外一種方法優(yōu)越,一樣。這并不意味這一種方法比另外一種方法優(yōu)越,一樣。這并不意味這一種方法比另外一種方法優(yōu)越,根據(jù)實(shí)際情況,從輸入序列的性質(zhì)出發(fā),應(yīng)用不同根據(jù)實(shí)際情況,從輸入序列的性質(zhì)出發(fā),應(yīng)用不同根據(jù)實(shí)際情況,從輸入序列的性質(zhì)出發(fā),應(yīng)用不同根據(jù)實(shí)際情況,從輸入序列的性質(zhì)出發(fā),應(yīng)用不同的方法會(huì)得到不同程度的成功。的方法會(huì)得到不同程度的成功。的方法會(huì)得到不同程度的成功。的方法會(huì)得到不同程度的成功。用戶(hù)應(yīng)該選擇若干用戶(hù)應(yīng)該選擇若干用戶(hù)應(yīng)該選擇若干用戶(hù)應(yīng)該選擇若干個(gè)工具同時(shí)使用個(gè)工具同時(shí)使用個(gè)工具同時(shí)使用個(gè)工具同時(shí)使用,并且對(duì)最終的比較結(jié)果作手工修,并且對(duì)最終的比較結(jié)果作手工修,并且對(duì)最終的比較結(jié)果作手工修,并且對(duì)最終的比較結(jié)果作手工修正以期達(dá)到最佳效果。正以期達(dá)到最佳效果。正以期達(dá)到最佳效果。正以期達(dá)到最佳效果。模序比較分析模序比較分析PROSITE主講教師:趙雨杰主講教師:趙雨杰 PROSITEPROSITEPROSITEPROSITE數(shù)據(jù)庫(kù)收集了生物學(xué)有顯著意義的蛋白質(zhì)位點(diǎn)和序數(shù)據(jù)庫(kù)收集了生物學(xué)有顯著意義的蛋白質(zhì)位點(diǎn)和序數(shù)據(jù)庫(kù)收集了生物學(xué)有顯著意義的蛋白質(zhì)位點(diǎn)和序數(shù)據(jù)庫(kù)收集了生物學(xué)有顯著意義的蛋白質(zhì)位點(diǎn)和序列模式,并能根據(jù)這些位點(diǎn)和模式快速和可靠地鑒別一個(gè)未列模式,并能根據(jù)這些位點(diǎn)和模式快速和可靠地鑒別一個(gè)未列模式,并能根據(jù)這些位點(diǎn)和模式快速和可靠地鑒別一個(gè)未列模式,并能根據(jù)這些位點(diǎn)和模式快速和可靠地鑒別一個(gè)未知功能的蛋白質(zhì)序列應(yīng)該屬于知功能的蛋白質(zhì)序列應(yīng)該屬于知功能的蛋白質(zhì)序列應(yīng)該屬于知功能的蛋白質(zhì)序列應(yīng)該屬于哪哪哪哪一個(gè)蛋白質(zhì)家族。一個(gè)蛋白質(zhì)家族。一個(gè)蛋白質(zhì)家族。一個(gè)蛋白質(zhì)家族?;诮?jīng)典的模式分析的基于經(jīng)典的模式分析的基于經(jīng)典的模式分析的基于經(jīng)典的模式分析的GribskovGribskov方法,方法,方法,方法,PROSITE PROSITE使用一種稱(chēng)使用一種稱(chēng)使用一種稱(chēng)使用一種稱(chēng)為為為為pfscanpfscan的方法尋找一個(gè)蛋白質(zhì)或核酸的查詢(xún)序列同一個(gè)模的方法尋找一個(gè)蛋白質(zhì)或核酸的查詢(xún)序列同一個(gè)模的方法尋找一個(gè)蛋白質(zhì)或核酸的查詢(xún)序列同一個(gè)模的方法尋找一個(gè)蛋白質(zhì)或核酸的查詢(xún)序列同一個(gè)模式庫(kù)的相似性,因此,在搜索中需要有模式庫(kù)。式庫(kù)的相似性,因此,在搜索中需要有模式庫(kù)。式庫(kù)的相似性,因此,在搜索中需要有模式庫(kù)。式庫(kù)的相似性,因此,在搜索中需要有模式庫(kù)。第一個(gè)是第一個(gè)是第一個(gè)是第一個(gè)是PROSITEPROSITE(http:/www.expasy.ch/prosite/http:/www.expasy.ch/prosite/),一個(gè)),一個(gè)),一個(gè)),一個(gè)ExPASyExPASy(httphttp:/www.Expasy.org/www.Expasy.org)數(shù)據(jù)庫(kù),通過(guò))數(shù)據(jù)庫(kù),通過(guò))數(shù)據(jù)庫(kù),通過(guò))數(shù)據(jù)庫(kù),通過(guò)使用基序和序列模式(諸如指紋)將生物學(xué)意義重使用基序和序列模式(諸如指紋)將生物學(xué)意義重使用基序和序列模式(諸如指紋)將生物學(xué)意義重使用基序和序列模式(諸如指紋)將生物學(xué)意義重大的位點(diǎn)收集大的位點(diǎn)收集大的位點(diǎn)收集大的位點(diǎn)收集分類(lèi)。分類(lèi)。分類(lèi)。分類(lèi)。第二個(gè)是第二個(gè)是第二個(gè)是第二個(gè)是PfamPfam(http:/www.sanger.ac.uk/Software/Pfam/search.shtmlhttp:/www.sanger.ac.uk/Software/Pfam/search.shtml),收集,收集,收集,收集了蛋白質(zhì)結(jié)構(gòu)域家族,與其它收集方法有很大不了蛋白質(zhì)結(jié)構(gòu)域家族,與其它收集方法有很大不了蛋白質(zhì)結(jié)構(gòu)域家族,與其它收集方法有很大不了蛋白質(zhì)結(jié)構(gòu)域家族,與其它收集方法有很大不同的是,最初的蛋白質(zhì)結(jié)構(gòu)域的比較完全是用手工完成同的是,最初的蛋白質(zhì)結(jié)構(gòu)域的比較完全是用手工完成同的是,最初的蛋白質(zhì)結(jié)構(gòu)域的比較完全是用手工完成同的是,最初的蛋白質(zhì)結(jié)構(gòu)域的比較完全是用手工完成的,而不是依靠自動(dòng)化的處理方法,正因?yàn)檫@樣,的,而不是依靠自動(dòng)化的處理方法,正因?yàn)檫@樣,的,而不是依靠自動(dòng)化的處理方法,正因?yàn)檫@樣,的,而不是依靠自動(dòng)化的處理方法,正因?yàn)檫@樣,PfamPfam幾年前,只擁有五百多幾年前,只擁有五百多幾年前,只擁有五百多幾年前,只擁有五百多條款目,但這些款目的質(zhì)條款目,但這些款目的質(zhì)條款目,但這些款目的質(zhì)條款目,但這些款目的質(zhì)量極好?,F(xiàn)在擁有量極好?,F(xiàn)在擁有量極好?,F(xiàn)在擁有量極好?,F(xiàn)在擁有幾千條目。幾千條目。幾千條目。幾千條目?;诨诨诨赑ROSITEPROSITE和和和和PfamPfam的搜索可以通過(guò)訪問(wèn)的搜索可以通過(guò)訪問(wèn)的搜索可以通過(guò)訪問(wèn)的搜索可以通過(guò)訪問(wèn)ProfileScanProfileScan的主頁(yè)完成,它只需要一條簡(jiǎn)單的輸入序的主頁(yè)完成,它只需要一條簡(jiǎn)單的輸入序的主頁(yè)完成,它只需要一條簡(jiǎn)單的輸入序的主頁(yè)完成,它只需要一條簡(jiǎn)單的輸入序列(用文本格式),或者一個(gè)標(biāo)號(hào),比如一個(gè)列(用文本格式),或者一個(gè)標(biāo)號(hào),比如一個(gè)列(用文本格式),或者一個(gè)標(biāo)號(hào),比如一個(gè)列(用文本格式),或者一個(gè)標(biāo)號(hào),比如一個(gè)SWISS-SWISS-PROT IDPROT ID。用戶(hù)可以選擇搜索的敏感度,選擇返回顯。用戶(hù)可以選擇搜索的敏感度,選擇返回顯。用戶(hù)可以選擇搜索的敏感度,選擇返回顯。用戶(hù)可以選擇搜索的敏感度,選擇返回顯著的匹配或者所有匹配,甚至包括邊界的情況。著的匹配或者所有匹配,甚至包括邊界的情況。著的匹配或者所有匹配,甚至包括邊界的情況。著的匹配或者所有匹配,甚至包括邊界的情況。為了說(shuō)明輸出的格式,我們現(xiàn)在向?yàn)榱苏f(shuō)明輸出的格式,我們現(xiàn)在向?yàn)榱苏f(shuō)明輸出的格式,我們現(xiàn)在向?yàn)榱苏f(shuō)明輸出的格式,我們現(xiàn)在向PROSITEPROSITE系統(tǒng)提系統(tǒng)提系統(tǒng)提系統(tǒng)提交人類(lèi)交人類(lèi)交人類(lèi)交人類(lèi)matrix metalloproteinase 9 preproprotein matrix metalloproteinase 9 preproprotein Homo sapiensHomo sapiens蛋白序列。返回的蛋白序列。返回的蛋白序列。返回的蛋白序列。返回的PROSITEPROSITE條目顯條目顯條目顯條目顯示蛋白的功能區(qū),數(shù)字示蛋白的功能區(qū),數(shù)字示蛋白的功能區(qū),數(shù)字示蛋白的功能區(qū),數(shù)字“Start”Start”和和和和“End”End”是顯示是顯示是顯示是顯示出查詢(xún)序列和匹配的模式重疊的位點(diǎn)出查詢(xún)序列和匹配的模式重疊的位點(diǎn)出查詢(xún)序列和匹配的模式重疊的位點(diǎn)出查詢(xún)序列和匹配的模式重疊的位點(diǎn),Bits,Bits是序列比是序列比是序列比是序列比較可靠性評(píng)分,較可靠性評(píng)分,較可靠性評(píng)分,較可靠性評(píng)分,EvalueEvalue是序列比較錯(cuò)誤概率。是序列比較錯(cuò)誤概率。是序列比較錯(cuò)誤概率。是序列比較錯(cuò)誤概率。gi|74272287|ref|NP_004985.2|matrix metalloproteinase-9 preproprotein Homo sapiens gi|74272287|ref|NP_004985.2|matrix metalloproteinase-9 preproprotein Homo sapiens MSLWQPLVLVLLVLGCCFAAPRQRQSTLVLFPGDLRTNLTDRQLAEEYLYRYGYTRVAEMRGESKSLGPA MSLWQPLVLVLLVLGCCFAAPRQRQSTLVLFPGDLRTNLTDRQLAEEYLYRYGYTRVAEMRGESKSLGPA LLLLQKQLSLPETGELDSATLKAMRTPRCGVPDLGRFQTFEGDLKWHHHNITYWIQNYSEDLPRAVIDDA LLLLQKQLSLPETGELDSATLKAMRTPRCGVPDLGRFQTFEGDLKWHHHNITYWIQNYSEDLPRAVIDDA FARAFALWSAVTPLTFTRVYSRDADIVIQFGVAEHGDGYPFDGKDGLLAHAFPPGPGIQGDAHFDDDELW FARAFALWSAVTPLTFTRVYSRDADIVIQFGVAEHGDGYPFDGKDGLLAHAFPPGPGIQGDAHFDDDELW SLGKGVVVPTRFGNADGAACHFPFIFEGRSYSACTTDGRSDGLPWCSTTANYDTDDRFGFCPSERLYTQD SLGKGVVVPTRFGNADGAACHFPFIFEGRSYSACTTDGRSDGLPWCSTTANYDTDDRFGFCPSERLYTQD GNADGKPCQFPFIFQGQSYSACTTDGRSDGYRWCATTANYDRDKLFGFCPTRADSTVMGGNSAGELCVFP GNADGKPCQFPFIFQGQSYSACTTDGRSDGYRWCATTANYDRDKLFGFCPTRADSTVMGGNSAGELCVFP FTFLGKEYSTCTSEGRGDGRLWCATTSNFDSDKKWGFCPDQGYSLFLVAAHEFGHALGLDHSSVPEALMY FTFLGKEYSTCTSEGRGDGRLWCATTSNFDSDKKWGFCPDQGYSLFLVAAHEFGHALGLDHSSVPEALMY PMYRFTEGPPLHKDDVNGIRHLYGPRPEPEPRPPTTTTPQPTAPPTVCPTGPPTVHPSERPTAGPTGPPS PMYRFTEGPPLHKDDVNGIRHLYGPRPEPEPRPPTTTTPQPTAPPTVCPTGPPTVHPSERPTAGPTGPPS AGPTGPPTAGPSTATTVPLSPVDDACNVNIFDAIAEIGNQLYLFKDGKYWRFSEGRGSRPQGPFLIADKW AGPTGPPTAGPSTATTVPLSPVDDACNVNIFDAIAEIGNQLYLFKDGKYWRFSEGRGSRPQGPFLIADKW PALPRKLDSVFEERLSKKLFFFSGRQVWVYTGASVLGPRRLDKLGLGADVAQVTGALRSGRGKMLLFSGR PALPRKLDSVFEERLSKKLFFFSGRQVWVYTGASVLGPRRLDKLGLGADVAQVTGALRSGRGKMLLFSGR RLWRFDVKAQMVDPRSASEVDRMFPGVPLDTHDVFQYREKAYFCQDRFYWRVSSRSELNQVDQVGYVTYD RLWRFDVKAQMVDPRSASEVDRMFPGVPLDTHDVFQYREKAYFCQDRFYWRVSSRSELNQVDQVGYVTYD ILQCPED ILQCPED 模序比較分析模序比較分析SMARThttp:/smart.embl-heidelberg.de/主講教師:趙雨杰主講教師:趙雨杰SMARTSMARTSMARTSMARTSMARTSMART是一款簡(jiǎn)單的分子結(jié)構(gòu)檢索工具。可以用于識(shí)別和注釋是一款簡(jiǎn)單的分子結(jié)構(gòu)檢索工具??梢杂糜谧R(shí)別和注釋是一款簡(jiǎn)單的分子結(jié)構(gòu)檢索工具。可以用于識(shí)別和注釋是一款簡(jiǎn)單的分子結(jié)構(gòu)檢索工具??梢杂糜谧R(shí)別和注釋遺傳易變的結(jié)構(gòu)域,還可用于結(jié)構(gòu)域結(jié)構(gòu)的分析,可檢測(cè)遺傳易變的結(jié)構(gòu)域,還可用于結(jié)構(gòu)域結(jié)構(gòu)的分析,可檢測(cè)遺傳易變的結(jié)構(gòu)域,還可用于結(jié)構(gòu)域結(jié)構(gòu)的分析,可檢測(cè)遺傳易變的結(jié)構(gòu)域,還可用于結(jié)構(gòu)域結(jié)構(gòu)的分析,可檢測(cè)500500500500種種種種以上與信號(hào)轉(zhuǎn)導(dǎo)、細(xì)胞外和染色質(zhì)相關(guān)蛋白的結(jié)構(gòu)域家族,廣泛以上與信號(hào)轉(zhuǎn)導(dǎo)、細(xì)胞外和染色質(zhì)相關(guān)蛋白的結(jié)構(gòu)域家族,廣泛以上與信號(hào)轉(zhuǎn)導(dǎo)、細(xì)胞外和染色質(zhì)相關(guān)蛋白的結(jié)構(gòu)域家族,廣泛以上與信號(hào)轉(zhuǎn)導(dǎo)、細(xì)胞外和染色質(zhì)相關(guān)蛋白的結(jié)構(gòu)域家族,廣泛注釋這些結(jié)構(gòu)域種類(lèi)分布、功能分類(lèi)、三級(jí)結(jié)構(gòu)、功能上重要的注釋這些結(jié)構(gòu)域種類(lèi)分布、功能分類(lèi)、三級(jí)結(jié)構(gòu)、功能上重要的注釋這些結(jié)構(gòu)域種類(lèi)分布、功能分類(lèi)、三級(jí)結(jié)構(gòu)、功能上重要的注釋這些結(jié)構(gòu)域種類(lèi)分布、功能分類(lèi)、三級(jí)結(jié)構(gòu)、功能上重要的殘基。在非冗余蛋白數(shù)據(jù)庫(kù)中檢索結(jié)構(gòu)域,并且檢索參數(shù)和分類(lèi)殘基。在非冗余蛋白數(shù)據(jù)庫(kù)中檢索結(jié)構(gòu)域,并且檢索參數(shù)和分類(lèi)殘基。在非冗余蛋白數(shù)據(jù)庫(kù)中檢索結(jié)構(gòu)域,并且檢索參數(shù)和分類(lèi)殘基。在非冗余蛋白數(shù)據(jù)庫(kù)中檢索結(jié)構(gòu)域,并且檢索參數(shù)和分類(lèi)信息存儲(chǔ)在相關(guān)的數(shù)據(jù)系統(tǒng)中。該數(shù)據(jù)庫(kù)的用戶(hù)界面可以根據(jù)特信息存儲(chǔ)在相關(guān)的數(shù)據(jù)系統(tǒng)中。該數(shù)據(jù)庫(kù)的用戶(hù)界面可以根據(jù)特信息存儲(chǔ)在相關(guān)的數(shù)據(jù)系統(tǒng)中。該數(shù)據(jù)庫(kù)的用戶(hù)界面可以根據(jù)特信息存儲(chǔ)在相關(guān)的數(shù)據(jù)系統(tǒng)中。該數(shù)據(jù)庫(kù)的用戶(hù)界面可以根據(jù)特定分類(lèi)單元檢索具有特殊組合結(jié)構(gòu)域的蛋白。定分類(lèi)單元檢索具有特殊組合結(jié)構(gòu)域的蛋白。定分類(lèi)單元檢索具有特殊組合結(jié)構(gòu)域的蛋白。定分類(lèi)單元檢索具有特殊組合結(jié)構(gòu)域的蛋白。“Conserved Domains”BLAST“Conserved Domains”BLASTInterproInterpro http:/www.ebi.ac.uk/interpro/search/sequehttp:/www.ebi.ac.uk/interpro/search/sequence-searchnce-search
收藏
編號(hào):73982957
類(lèi)型:共享資源
大小:115.48MB
格式:ZIP
上傳時(shí)間:2022-04-12
35
積分
- 關(guān) 鍵 詞:
-
生物信息學(xué)
本科教學(xué)課件
生物
信息學(xué)
本科
教學(xué)
課件
- 資源描述:
-
生物信息學(xué)本科教學(xué)課件,生物信息學(xué),本科教學(xué)課件,生物,信息學(xué),本科,教學(xué),課件
展開(kāi)閱讀全文
- 溫馨提示:
1: 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
裝配圖網(wǎng)所有資源均是用戶(hù)自行上傳分享,僅供網(wǎng)友學(xué)習(xí)交流,未經(jīng)上傳用戶(hù)書(shū)面授權(quán),請(qǐng)勿作他用。