Applied Bioinformatics Course (ABC)
实用生物信息技术
2026-05-07更新
BLAST 课堂练习
练习1 - 灵长目alpha血红蛋白搜索
-
以人血红蛋白alpha亚基
HBA_HUMAN
为搜索序列,采用默认参数利用中国国家生物信息中心CNCB蛋白质数据库搜索程序BlastP,搜索SwissProt数据库,
找出灵长目动物Primates(分类学数据库登录号taxid 9443)中alpha血红蛋白。
-
配置算法参数,依次改变常规参数:最大目标序列、期望阈值、字长,分析它们对输出结果的影响。
-
配置算法参数,依次改变计分参数:计分矩阵、空位罚分,分析它们对输出结果的影响。
-
利用筛选结果功能,找出黑猩猩(Chimpanzee,Pan troglodytes)中同源蛋白,说明从输出结果中得到的启示。
利用筛选结果功能,找出与HBA_HUMAN相同位点高于95%的物种,下载FASTA格式序列。
练习2 - 人的脑红蛋白序列搜索
-
以人的血红蛋白alpha亚基
HBA_HUMAN
为搜索序列,利用中国国家生物信息中心CNCB蛋白质数据库搜索程序BlastP,搜索SwissProt数据库,
设置字长、计分矩阵和期望阈值,找出包括脑红蛋白Neuroglobin在内的12个珠蛋白,说明上述参数对搜索结果的影响。
-
以人的血红蛋白alpha亚基
HBA_HUMAN
为搜索序列,用NCBI位点特异迭代法
PSI-Blast
搜索SwissProt数据库,选择物种Homo Sapiens, taxid 9606,选择默认字长Word size,
默认计分矩阵Matrix和默认空位罚分Gap costs,分析运行结果。
-
点击Alignments按钮,将双序列输出Pairwise格式改为多序列输出格式Flat query-anchored with letters for identities,
找出完全一致的保守位点,如色氨酸W,组氨酸H;性质相似的位点,如酸性氨基酸谷氨酸E或天冬氨酸D。
-
在上述第一轮搜索基础上,PSI-BLAST根据不同位点保守性不同,构建位点特异计分矩阵,进行第二轮搜索。
-
分析搜索结果,说明PSI-BLAST的基本原理。
练习3 - 人的珠蛋白mRNA序列搜索
-
以人的血红蛋白alpha亚基
HBA_HUMAN
为搜索序列,用NCBI tBlastN搜索参考序列数据库RefSeq中人的珠蛋白家族mRNA序列,
参数如下:期望阈值E为1,字长Word size为2, 计分矩阵Matrix为PAM250,
空位罚分Gap cost为起始空位罚分13,延伸空位罚分2,其余参数默认。
-
以人的血红蛋白alpha亚基
HBA_HUMAN
用CNCB tBlastN搜索转录本参考序列数据库RefSeq中人的珠蛋白家族mRNA序列,参数同上。
-
比较NCBI和CNCB搜索结果,说明两者异同。
-
找出编码alpha血红蛋白的两个mRNA序列,进行核酸和蛋白质序列比对,说明比对结果。
-
找出编码肌红蛋白Myoglobin的所有mRNA序列,进行核酸和蛋白质序列的多序列比对。
-
找出beta血红蛋白假基因Pseudogene,与beta血红蛋白进行核酸序列比对。
-
以人alpha血红蛋白为搜索序列,用tBlastN搜索参考序列数据库RefSeq中人、小鼠、大鼠珠蛋白家族mRNA序列,分析搜索结果。
练习4 - 人的癌胚抗原CEA搜索
-
用EMBOSS软件包中局部比对程序water对人的癌胚抗原
CEAM6_HUMAN
恒定结构域A(145-232)
和
CEAM5_HUMAN
进行双序列比对。
-
用CNCB蛋白质BLAST中“与输入序列比对”功能,以人的癌胚抗原CEAM6_HUMAN恒定结构域A(145-232)
搜索CEAM5_HUMAN中相似性区域,设置算法参数字长为6,其它参数默认。
-
以EMBOSS软件包中点阵图程序Dotmatcher找出CEAM5_HUMAN中的相似性区域。
-
分析上述结果,说明上述三种方法的用途。
练习5 - SBP转录因子家族搜索
-
以17个拟南芥SPL7转录因子
17 AT_SPL
和
19个粳稻转录因子
19 OJ_SPL
进行BLAST比对,找出水稻中与拟南芥中SPL7_ARATH最可能的直系同源蛋白。
-
以拟南芥
SPL3_PEP
为搜索序列,搜索植物转录因子数据库
PlantTFDB
中玉米转录因子,查看搜索结果。
-
下载764个玉米转录因子蛋白质序列
ZMTF_PEP
以拟南芥转录因子
SPL3_PEP
蛋白质序列为搜索序列,用BlastP搜索玉米转录因子蛋白质序列,查看搜索结果。
-
下载764个玉米转录因子编码区核苷酸序列
ZMTF_CDS
以拟南芥转录因子编码区序列
SPL3_CDS
为搜索序列,用BlastN搜索玉米转录因子编码区序列,查看搜索结果。
-
下载764个玉米转录因子序列
ZMTF_PEP
以拟南芥转录因子编码区
SPL3_CDS
序列为搜索序列,用BlastX搜索玉米转录因子编码区序列中相似序列,查看搜索结果。
-
下载764个玉米转录因子编码区核苷酸序列
ZMTF_CDS
以拟南芥转录因子
SPL3_PEP
蛋白质序列为检索序列,用tBlastN搜索玉米转录因子蛋白质序列中相似序列,查看搜索结果。
-
分析上述搜索结果,说明BlastN无法搜到相似性序列的原因。