Applied Bioinformatics Course (ABC)
实用生物信息技术

2026-05-07更新

BLAST 课堂练习

练习1 - 灵长目alpha血红蛋白搜索

  1. 以人血红蛋白alpha亚基 HBA_HUMAN 为搜索序列,采用默认参数利用中国国家生物信息中心CNCB蛋白质数据库搜索程序BlastP,搜索SwissProt数据库, 找出灵长目动物Primates(分类学数据库登录号taxid 9443)中alpha血红蛋白。
  2. 配置算法参数,依次改变常规参数:最大目标序列、期望阈值、字长,分析它们对输出结果的影响。
  3. 配置算法参数,依次改变计分参数:计分矩阵、空位罚分,分析它们对输出结果的影响。
  4. 利用筛选结果功能,找出黑猩猩(Chimpanzee,Pan troglodytes)中同源蛋白,说明从输出结果中得到的启示。
  5. 利用筛选结果功能,找出与HBA_HUMAN相同位点高于95%的物种,下载FASTA格式序列。

练习2 - 人的脑红蛋白序列搜索

  1. 以人的血红蛋白alpha亚基 HBA_HUMAN 为搜索序列,利用中国国家生物信息中心CNCB蛋白质数据库搜索程序BlastP,搜索SwissProt数据库, 设置字长、计分矩阵和期望阈值,找出包括脑红蛋白Neuroglobin在内的12个珠蛋白,说明上述参数对搜索结果的影响。
  2. 以人的血红蛋白alpha亚基 HBA_HUMAN 为搜索序列,用NCBI位点特异迭代法 PSI-Blast 搜索SwissProt数据库,选择物种Homo Sapiens, taxid 9606,选择默认字长Word size, 默认计分矩阵Matrix和默认空位罚分Gap costs,分析运行结果。
  3. 点击Alignments按钮,将双序列输出Pairwise格式改为多序列输出格式Flat query-anchored with letters for identities, 找出完全一致的保守位点,如色氨酸W,组氨酸H;性质相似的位点,如酸性氨基酸谷氨酸E或天冬氨酸D。
  4. 在上述第一轮搜索基础上,PSI-BLAST根据不同位点保守性不同,构建位点特异计分矩阵,进行第二轮搜索。
  5. 分析搜索结果,说明PSI-BLAST的基本原理。

练习3 - 人的珠蛋白mRNA序列搜索

  1. 以人的血红蛋白alpha亚基 HBA_HUMAN 为搜索序列,用NCBI tBlastN搜索参考序列数据库RefSeq中人的珠蛋白家族mRNA序列, 参数如下:期望阈值E为1,字长Word size为2, 计分矩阵Matrix为PAM250, 空位罚分Gap cost为起始空位罚分13,延伸空位罚分2,其余参数默认。
  2. 以人的血红蛋白alpha亚基 HBA_HUMAN 用CNCB tBlastN搜索转录本参考序列数据库RefSeq中人的珠蛋白家族mRNA序列,参数同上。
  3. 比较NCBI和CNCB搜索结果,说明两者异同。
  4. 找出编码alpha血红蛋白的两个mRNA序列,进行核酸和蛋白质序列比对,说明比对结果。
  5. 找出编码肌红蛋白Myoglobin的所有mRNA序列,进行核酸和蛋白质序列的多序列比对。
  6. 找出beta血红蛋白假基因Pseudogene,与beta血红蛋白进行核酸序列比对。
  7. 以人alpha血红蛋白为搜索序列,用tBlastN搜索参考序列数据库RefSeq中人、小鼠、大鼠珠蛋白家族mRNA序列,分析搜索结果。

练习4 - 人的癌胚抗原CEA搜索

  1. 用EMBOSS软件包中局部比对程序water对人的癌胚抗原 CEAM6_HUMAN 恒定结构域A(145-232) 和 CEAM5_HUMAN 进行双序列比对。
  2. 用CNCB蛋白质BLAST中“与输入序列比对”功能,以人的癌胚抗原CEAM6_HUMAN恒定结构域A(145-232) 搜索CEAM5_HUMAN中相似性区域,设置算法参数字长为6,其它参数默认。
  3. 以EMBOSS软件包中点阵图程序Dotmatcher找出CEAM5_HUMAN中的相似性区域。
  4. 分析上述结果,说明上述三种方法的用途。

练习5 - SBP转录因子家族搜索

  1. 以17个拟南芥SPL7转录因子 17 AT_SPL 和 19个粳稻转录因子 19 OJ_SPL 进行BLAST比对,找出水稻中与拟南芥中SPL7_ARATH最可能的直系同源蛋白。
  2. 以拟南芥 SPL3_PEP 为搜索序列,搜索植物转录因子数据库 PlantTFDB 中玉米转录因子,查看搜索结果。
  3. 下载764个玉米转录因子蛋白质序列 ZMTF_PEP 以拟南芥转录因子 SPL3_PEP 蛋白质序列为搜索序列,用BlastP搜索玉米转录因子蛋白质序列,查看搜索结果。
  4. 下载764个玉米转录因子编码区核苷酸序列 ZMTF_CDS 以拟南芥转录因子编码区序列 SPL3_CDS 为搜索序列,用BlastN搜索玉米转录因子编码区序列,查看搜索结果。
  5. 下载764个玉米转录因子序列 ZMTF_PEP 以拟南芥转录因子编码区 SPL3_CDS 序列为搜索序列,用BlastX搜索玉米转录因子编码区序列中相似序列,查看搜索结果。
  6. 下载764个玉米转录因子编码区核苷酸序列 ZMTF_CDS 以拟南芥转录因子 SPL3_PEP 蛋白质序列为检索序列,用tBlastN搜索玉米转录因子蛋白质序列中相似序列,查看搜索结果。
  7. 分析上述搜索结果,说明BlastN无法搜到相似性序列的原因。
英文主页 中文主页 教学计划 课程内容 课外练习 课题实例 小组总结