Applied Bioinformatics Course (ABC)
实用生物信息技术
2026-05-07更新
课外练习4 - 数据库检索和注释
- UniProt蛋白质数据库
- 1. UniProt数据库概况
- 1) UniProt数据库由哪三部分组成?
- 2) UniProtKB知识库由哪两部分组成?
- 3) UniProt统计报表(Statistics)包括哪些主要信息?
- 4) UniProt常规注释信息(General Annotation)包括哪些主要部分?
- 5) UniProt序列特征注释信息(Sequence Annotation)包括哪些主要部分?
- 6) UniProt与哪几大类数据库建立了交叉链接(Cross Reference)?
- 7) UniProt中的帮助文档包括哪些信息?
- 2. 基本统计数据
- 1) 列表说明Swiss-Prot和TrEMBL子库中人和主要模式生物英文名、拉丁名、分类学数据库(Taxonomy)登录号、序列条目总数、
具有蛋白证据的序列条目数。
- 表1 UniProt中模式生物基本统计数据
| 物种 |
英文 |
拉丁文 |
登录号 |
SW蛋白水平 |
TrEMBL蛋白水平 |
| 人 |
| 小鼠 |
| 鸡 |
| 非洲爪蟾 |
| 斑马鱼 |
| 果蝇 |
| 线虫 |
| 酿酒酵母 |
| 大肠杆菌 |
| 拟南芥 |
| 粳稻 |
| 课题相关物种 |
- 3. 人珠蛋白家族检索
- 1) 写出从UniProt数据库中检索已审阅的人珠蛋白(globin)家族12个亚基的步骤。
- 2) 列表说明这12个珠蛋白的登录号、蛋白质名称、和序列长度。
- 3) 与血红蛋白alpha亚基差异最大的序列是哪个?相同位点百分比?
- 4) 与血红蛋白beta亚基差异最小的序列是哪个?差异位点共多少个?
- 4. 说明从UniProt数据库中检索以下序列条目的步骤和结果
- 1) 所有拟南芥序列
- 2) 已审阅拟南芥序列
- 3) 已审阅拟南芥序列中具有蛋白质证据的序列
- 4) 已审阅拟南芥序列中具有蛋白质证据、且具有跨膜螺旋的序列
- 5) 已审阅拟南芥序列中具有蛋白质证据、具有跨膜螺旋和信号肽的序列
- 6) 已审阅拟南芥序列中具有蛋白质证据、具有跨膜螺旋和信号肽、并具有二硫键的序列
- 7) 已审阅拟南芥序列中具有蛋白质证据、具有跨膜螺旋、信号肽、二硫键,且已经测定三维结构的序列
- 5. 血红蛋白注释信息
- 1) 以人血红蛋白alpha亚基为例,说明该序列条目包括几类相关文献。
- 2) 以人血红蛋白alpha亚基为例,说明该序列条目包括几类注释信息。
- 3) 以人血红蛋白alpha亚基为例,说明该序列条目包括哪些特征位点信息。
- 4) 以人血红蛋白alpha亚基为例,说明该序列条目包括哪几类数据库交叉链接,其中你最感兴趣的有哪些数据库。
- 6. 豌豆内膜蛋白注释信息
- 1) 以豌豆内膜蛋白PPF1_PEA为例,说明该序列条目包括哪些注释信息。
- 2) 通过注释信息或高级检索,查找拟南芥中与PPF1_PEA属于同一家族的内膜蛋白。
- 3) 通过查看注释信息和多序列比对,找出拟南芥中PPF1_PEA的直系同源蛋白ALB3_ARATH。
- 4) 查看ALB3_ARATH的注释信息,特别是拟南芥专门数据库AraPort和TAIR,并与PPF1_PEA的注释信息进行比较,
说明如何将模式生物研究结果用于非模式生物。
- 7. 课题相关物种信息
- 1) 该物种的中文名、英文名、拉丁文学名、分类学登录号。
- 2) 该物种的分类学地位(界、门、纲、目、科、属、种)。
- 3) 该物种在Swiss-Prot和TrEMBL子库中序列条目数。
- 4) 该物种在Swiss-Prot和TrEMBL子库中具有蛋白质水平证据的序列条目数。
- 5) 该物种在Swiss-Prot子库中具有三维空间结构的序列条目数。
- 6) 查阅该物种在NCBI分类学网站中与其它数据库的交叉链接,列表说明其基本信息。
- 7) 查阅Ensembl或Phytozome等基因组数据库,若该物种已经完成基因组测序,熟悉其基因组基本信息;若该物种尚未测序,
找出与其亲缘关系最近的物种,熟悉其基本信息。
- 8) 搜索Database Common,找出该物种相关数据库,熟悉相关数据库的基本信息和已发表论文。
- 8. 课题相关蛋白信息
- 1) 该序列条目的蛋白名、基因名和物种名:
- 2) 该序列条目是否经过人工审阅,包括哪几大类注释信息:
- 3) 该序列条目收录了多少篇相关文献,共分哪几大类:
- 4) 该序列条目包括哪些特征位点信息?
- 5) 该序列条目包括哪几类数据库交叉链接,其中你最感兴趣的有哪些数据库?从中可以获得哪些你感兴趣的信息?
- 6) Swiss-Prot子库中与该序列条目相同位点占100%, 90%和50%的序列条目数:
参考文献
- UniProt Consortium. UniProt: a worldwide hub of protein knowledge. Nucleic Acids Res. 2019 Jan 8;47(D1):D506-D515.
- Apweiler R, Bairoch A, Wu CH, et al. UniProt: the Universal Protein knowledgebase.
Nucleic Acids Res. 2004 Jan 1;32(Database issue):D115-9.
- 罗静初.实用生物信息技术课程教学实例. 生物技术通报,2015,31(11):102-111.