实用生物信息技术 [英文]

ABC | People | Docs | Databases | Tools | UniProt | PDB | ExPASy | EBI | NCBI | BIGD

课外练习3:UniProt数据库高级检索和注释

1. UniProt数据库概况
1) UniProt数据库由哪三部分组成?
2) UniProtKB知识库由哪两部分组成?
3) UniProt统计报表(Statistics)包括哪些主要信息?
4) UniProt常规注释信息(General Annotation)包括哪些主要部分?
5) UniProt序列特征注释信息(Sequence Annotation)包括哪些主要部分?
6) UniProt与哪几大类数据库建立了交叉链接(Cross Reference)?
7) UniProt中的帮助文档包括哪些信息?
2. 基本统计数据
1) 列表说明Swiss-Prot和TrEMBL子库中人和主要模式生物英文名、拉丁名、分类学数据库(Taxonomy)登录号、序列条目总数、具有蛋白证据的序列条目数。
表1 UniProt中模式生物基本统计数据
物种 英文 拉丁文 登录号 SW/蛋白水平 TrEMBL/蛋白水平

小鼠

非洲爪蟾
斑马鱼
果蝇
线虫
酿酒酵母
大肠杆菌
拟南芥
粳稻
课题相关物种1
课题相关物种2
课题相关物种3
3. 人珠蛋白家族检索
1) 写出从UniProt数据库中检索已审阅的人珠蛋白(globin)家族12个亚基的步骤。
2) 列表说明这12个珠蛋白的登录号、蛋白质名称、和序列长度。
3) 与血红蛋白alpha亚基差异最大的序列是哪个?相同位点百分比?
4) 与血红蛋白beta亚基差异最小的序列是哪个?差异位点共多少个?
4. 说明从UniProt数据库中检索以下序列条目的步骤和结果
1) 所有拟南芥序列
2) 已审阅拟南芥序列
3) 已审阅拟南芥序列中具有蛋白质证据的序列
4) 已审阅拟南芥序列中具有蛋白质证据、且具有跨膜螺旋的序列
5) 已审阅拟南芥序列中具有蛋白质证据、具有跨膜螺旋和信号肽的序列
6) 已审阅拟南芥序列中具有蛋白质证据、具有跨膜螺旋和信号肽、并具有二硫键的序列
7) 已审阅拟南芥序列中具有蛋白质证据、具有跨膜螺旋、信号肽、二硫键,且已经测定三维结构的序列
4. 血红蛋白注释信息
1) 以人血红蛋白alpha亚基为例,说明该序列条目包括几类相关文献。
2) 以人血红蛋白alpha亚基为例,说明该序列条目包括几类注释信息。
3) 以人血红蛋白alpha亚基为例,说明该序列条目包括哪些特征位点信息。
4) 以人血红蛋白alpha亚基为例,说明该序列条目包括哪几类数据库交叉链接,其中你最感兴趣的有哪些数据库。
5. 豌豆内膜蛋白注释信息
1) 以豌豆内膜蛋白PPF1_PEA为例,说明该序列条目包括哪些注释信息。
2) 通过注释信息或高级检索,查找拟南芥中与PPF1_PEA属于同一家族的内膜蛋白。
3) 通过查看注释信息和多序列比对,找出拟南芥中PPF1_PEA的直系同源蛋白ALB3_ARATH。
4) 查看ALB3_ARATH的注释信息,特别是拟南芥专门数据库AraPort和TAIR,并与PPF1_PEA的注释信息进行比较,说明如何将模式生物研究结果用于非模式生物。
6. 课题相关物种信息
1) 该物种的中文名、英文名、拉丁文学名、分类学登录号。
2) 该物种的分类学地位(界、门、纲、目、科、属、种)。
3) 该物种在Swiss-Prot和TrEMBL子库中序列条目数。
4) 该物种在Swiss-Prot和TrEMBL子库中具有蛋白质水平证据的序列条目数。
5) 该物种在Swiss-Prot子库中具有三维空间结构的序列条目数。
6) 查阅该物种在NCBI分类学网站中与其它数据库的交叉链接,列表说明其基本信息。
7) 查阅Ensembl或Phytozome等基因组数据库,若该物种已经完成基因组测序,熟悉其基因组基本信息;若该物种尚未测序,找出与其亲缘关系最近的物种,熟悉其基本信息。
8) 搜索Database Common,找出该物种相关数据库,熟悉相关数据库的基本信息和已发表论文。
7. 课题相关蛋白信息
1) 该序列条目的蛋白名、基因名和物种名:
2) 该序列条目是否经过人工审阅,包括哪几大类注释信息:
3) 该序列条目收录了多少篇相关文献,共分哪几大类:
4) 该序列条目包括哪些特征位点信息?
5) 该序列条目包括哪几类数据库交叉链接,其中你最感兴趣的有哪些数据库?从中可以获得哪些你感兴趣的信息?
6) Swiss-Prot子库中与该序列条目相同位点占100%, 90%和50%的序列条目数:
参考文献
1. UniProt Consortium. UniProt: a worldwide hub of protein knowledge. Nucleic Acids Res. 2019 Jan 8;47(D1):D506-D515.
2. Apweiler R, Bairoch A, Wu CH, et al. UniProt: the Universal Protein knowledgebase. Nucleic Acids Res. 2004 Jan 1;32(Database issue):D115-9.
3. 罗静初.实用生物信息技术课程教学实例. 生物技术通报,2015,31(11):102-111.