实用生物信息技术 [英文]

ABC | People | Docs | Databases | Tools | UniProt | PDB | ExPASy | EBI | NCBI | BIGD

课外练习4:BLAST数据库搜索

1. 血红蛋白alpha亚基(HBA_HUMAN)为检测序列,搜索Swiss-Prot数据库,找出灵长目动物(Primates)中所有alpha珠蛋白(alpha globin),说明搜索策略,分析搜索结果。利用结果过滤(Filter Results)功能,找出黑猩猩(Chimpanzee)中同源蛋白,分析结果。利用结果过滤(Filter Results)功能,找出相同位点高于95%的物种,用Excel电子表保存结果。
2. 以人血红蛋白alpha亚基(HBA_HUMAN)为检测序列,用BlastP搜索Swiss-Prot数据库,设置种子序列字长(Word size)和计分矩阵(Scoring matrix),找出人珠蛋白家族12个成员,说明字长和计分矩阵对搜索结果的影响。
3. 以人血红蛋白alpha亚基(HBA_HUMAN)为检测序列,用位点特异迭代法PSI-Blast搜索Swiss-Prot数据库,找出人珠蛋白家族12个成员,说明PSI-Blast的基本工作原理。
4. 以人血红蛋白alpha亚基(HBA_HUMAN)为检测序列,用DELTA-Blast搜索Swiss-Prot数据库,找出人珠蛋白家族12个成员。说明DELTA-Blast的基本工作原理。
5. 以人血红蛋白alpha亚基(HBA_HUMAN)为检测序列,用tBlastN搜索RefSeq数据库中人珠蛋白家族mRNA序列,提取其编码区序列,进行多序列比对,分析结果。
6. 以人血红蛋白alpha亚基(HBA_HUMAN)为检测序列,搜索RefSeq数据库中人、小鼠和大鼠三个物种珠蛋白家族mRNA序列,提取其编码区序列,进行多序列比对,分析结果。
7. 以人癌胚抗原CEAM1_HUMAN的恒定结构域Ig-like C2-type 1(145-232)搜索Swiss-Prot中人的CEA家族成员,分析搜索结果,说明最大分值(Max Score)和总体分值(Total Score)的含义。
8. 以人癌胚抗原CEA21_HUMAN的恒定结构域Ig-like C2-type (147-231)与CEAM5_HUMA进行双序列比对,分析比对结果,说明Blast与EMBOSS软件包中程序water运行结果的差别。
9. 以蛋白名“Squamosa Promoter-binding-like protein”检索UniProt数据库,下载拟南芥SPL7转录因子和19个粳稻(分类学登录号39947)转录因子,利用Blast找出水稻中与拟南芥中SPL7_ARATH最可能的直系同源蛋白。
10. 下载玉米转录因子蛋白质序列和编码区核苷酸序列数据,构建本地BLAST数据库。以拟南芥转录因子SPL3蛋白质序列为检索序列,用BlastP搜索玉米转录因子蛋白质序列,用tBlastN搜索玉米转录因子编码区序列并分析结果;以拟南芥转录因子SPL3编码区序列为检索序列,用BlastN搜索玉米转录因子编码区序列,用BlastX搜索玉米转录因子蛋白质序列中相似序列并分析结果。