实用生物信息技术 [英文]

ABC | People | Docs | Databases | Tools | UniProt | PDB | ExPASy | EBI | NCBI | BIGD

课题相关应用实例

1. 豌豆开花后特异表达基因及其编码内膜蛋白PPF1
1) 参阅文献(Zhu et al., 1998),及PubMed数据库中豌豆开花后特异表达基因PPF1相关研究论文,简述PPF1序列特征、表达特异性,以及可能的生物学功能。
2) 检索UniProt数据库中豌豆内膜蛋白PPF1,总结该序列条目的一般注释信息、序列注释信息、数据库交叉链接。
3) 找出拟南芥中PPF1同源蛋白ALB3,通过数据库交叉链接,浏览其编码基因在拟南芥资源库AraPort和TAIR中的注释信息,说明基因组定位、基因结构、可变剪接方式、表达特异性、突变体,及其所编码的蛋白质的功能、亚细胞定位、组织特异性、互作蛋白、结构域特征,以及相关的文献资源。
4) 利用读码框分析程序,分析并提取PPF1全长mRNA序列中编码区核苷酸序列和所编码的氨基酸序列。
5) 利用密码子统计程序,分析豌豆PPF1和拟南芥中同源基因ALB3密码子使用特征;利用内切酶分析程序,分析豌豆PPF1基因的酶切位点;利用引物设计程序,设计 PPF1基因mRNA序列的引物。
6) 利用ProtScale蛋白质序列特征波形图显示工具,分析PPF1不同区域疏水和亲水、柔性和刚性、溶剂可及性、空间位阻、二级结构等序列特征。
7) 利用多种跨膜螺旋预测程序,预测PPF1跨膜螺旋,并比较预测结果的异同;利用alpha-螺旋轮显示程序,绘制跨膜螺旋的螺旋轮,说明跨膜区的序列特征 。
8) 利用PredicProtein蛋白质结构和功能预测网站,预测PPF1二级结构、无规卷曲、溶剂可及性、亚细胞定位、突变位点敏感性。
9) 利用Phyre2网站,预测拟南芥PPF1三维空间结构,并用Run Investigator工具分析预测结果,与所用模板进行序列和结构比对。
10) 通过以上PPF1及其同源蛋白ALB3实例,说明核酸和蛋白质序列分析思路和方法,以及分析结果对下一步实验研究的作用。
2. 河豚鱼基因组序列片段和多药耐药基因分析
1) 阅读刘勇博士论文摘要,简述研究目的、方法和结果。阅读河豚鱼基因组测序计划相关论文,说明河豚鱼基因组特点。阅读Molecule of the Month有关多药耐药蛋白的文章,说明哺乳动物和细菌多药耐药蛋白的异同。
2) 检索UniProt数据库中ABCB1基因家族,列表说明已经过人工审阅的序列条目;对上述序列进行多序列比对,说明比对结果。浏览人多药耐药基因蛋白质注释信息、文献报道和数据库交叉链接,说明其功能、亚细胞定位、组织特异性、互作蛋白、结构域特征,及其编码基因的基因结构、基因组定位、表达特异性、剪接变体等信息。
3) 提取GenBank数据库中刘勇等提交的柯氏质粒河豚鱼基因序列片段全长序列,用点阵图方法确定其中是否包含重复片段。
4) 用Softberry网站中FGENESH等多种方法预测上述河豚鱼基因组第一个重复片段基因结构,比较它与人ABCB1基因结构的异同。
5) 用点阵图方法分析上述序列中第一个多药耐药基因MDR2所编码的氨基酸序列,说明是否有重复结构域。
6) 用多种跨膜螺旋预测程序预测上述MDR2蛋白质序列中可能的跨膜螺旋。
7) 用上述河豚鱼基因组多药耐药基因全长序列,分别用BlastN, BlastX和BlastP搜索核酸和蛋白质序列数据库,调节不同参数,比较搜索结果。
8) 通过以上河豚鱼柯氏质粒基因组序列片段分析过程,说明基因组序列分析的一般方法,所用软件种类和基本原理,以及不同软件的适用范围和优缺点。
3. 植物特异转录因子基因家族SPL分析
1) 参阅文献(Guo et al., 2008),检索PubMed中植物特异转录因子Squamosa promoter binding protein-like (SPL)基因家族相关研究论文,简述该基因家族的研究背景和最新进展。
2) 检索UniProt数据库中SPL家族蛋白质序列,找出拟南芥中已审阅的蛋白质序列条目。浏览植物转录因子数据库PlantTFDB中拟南芥SBP家族基因,找出UniProt中已审阅SPL不同成员编码基因的登录号(如AT1G02065)。
3) 利用保守结构域识别网站MEME,找出拟南芥SBP家族不同成员的保守结构域,与文献中报道的结果进行比较,说明参数设置的意义。
4) 检索UniProt数据库中SPL家族蛋白质序列条目,提取拟南芥(或水稻)中该蛋白质家族已审阅序列条目,进行多序列比对,构建系统发生树,与文献中报道的系统发生树进行比较。
5) 查看和比较UniProt, PlantTFDB,TAIR和AraPort四个数据库中拟南芥AtSPL7的注释信息。通过注释信息中与其它数据库的交叉链接,查看其序列特征、结构域特征、亚细胞定位、组织特异性、互作蛋白、直系同源蛋白,以及其编码基因的基因结构、基因组注释等信息。
6) 利用结构域识别网站SMART,分析AtSPL7结构域;通过跨膜螺旋预测网站TMHMM,预测AtSPL7是否具有跨膜螺旋。通过ProtScale分析AtSPL7不同区域序列特征;通过PredictProtein.,预测AtSPL7的二级结构、突变敏感性。
7) 提取UniProt数据库中拟南芥SPL7相似蛋白,并和同源蛋白数据库收集的其它物种直系同源蛋白进行比较,选取代表性物种,下载SPL7序列,进行多序列比对,构建系统发生树,分析该基因的起源和演化特点。
8) 总结上述分析结果,参阅相关文献,说明SPL基因家族研究思路;选择你感兴趣的物种,说明该物种中SPL7基因研究思路。
4. 富含半胱氨酸多肽序列和结构分析
1) 搜索网络资源和文献数据库,了解富含半胱氨酸的抗菌肽和蜘蛛毒素的序列、结构和功能特点。搜索网络资源和文献数据库,了解金属硫蛋白的种类和特点,说明半胱氨酸在金属硫蛋白中的作用。
2) 从PDB数据库下载虎纹捕鸟蛛毒素-I (1QK6)和美洲商陆抗菌蛋白(1DKC)氨基酸序列,用needle程序进行序列比对。
3) 从PDB数据库下载多肽毒素1QK6, 1AXH, 1AGG, 1EIT, 1VTX, 1OMN的氨基酸序列,进行多序列比对;根据其结构特征,手动调整比对结果;说明二硫键配对方式。
4) 检索UniProt数据库中以I型人金属硫蛋白(human metallothionein),进行多序列比对,并创建序列图标,说明其保守位点特征。
5) 用蛋白质结构图形显示软件Swiss-PdbViewer分析1QK6和1DKC结构,说明其二硫键配对方式。选取两个分子中三对二硫键进行结构叠合,计算均方根误差。
6) 从PDB数据库分别下载人金属硫蛋白alpha和beta和结构域核磁共振结构1MHU和2MHU,分析其结构特点,说明半胱氨酸与金属结合方式。
7) 总结以上富含半胱氨酸的小分子蛋白质或多肽的序列、结构分析结果,说明序列、结构、功能、演化关系。