生信数据库ID总结及转换方法

生信数据库ID总结及转换方法生信数据库ID总结及转换方法(待补充)

一、数据库分类

1、核酸数据库:GenBank,Ensembl等

2、蛋白质数据库:Uniprot,PDB等

3、专用数据库:KEGG,GO,GEO等

二、NCBI Gene检索系统:

1、Gene ID / EntrezGene ID:即平常所说Gene ID,是NCBI Gene检索数据库的编号系统,目前最权威的基因ID命名方法,各大数据库中的基因都会被分配唯一的Gene ID号

2、格式:一串数字,如7157、2131;编号具有物种特异性,人和小鼠的TP53 Gene ID号并不一样;转录本以NM开头,蛋白以NM、NP开头,非编码RNA以NR开头

3、生信数据库ID总结及转换方法

三、人类基因命名委员会 HGNC 人类基因命名

1、HUGO Gene Symbol / HGNC Symbol / 基因符号:对基因命名描述的一个缩写标识符(如:TP53),这些基因符号是唯一的,同一基因在不同物种中表示不同;值得注意的是,虽然一个基因的gene symbol是唯一的,但存在其他命名,可通过Gene Card   别名Aliases查询
2、Gene Name / 全基因名称:对应Gene Symbol的全基因名,如TP53对应的Gene Name是tumor protein p53 
3、HGNC ID:HGNC数据库基因编号,如:HGNC:11998

4、HGNC只对人类基因命名且并不是所有基因都有Official Symbol,若基因缺少HGNC Gene Symbol ,NCBI Gene数据库中的symbol就会变成Gene Symbol,且Gene Symbol的编号会变成LOC+Gene ID,如:LOC4333818

四、Ensembl基因组数据库:Ensembl ID

1、Ensembl ID构成:物种前缀+类型(蛋白质、基因等)+ 数字

2、

物种前缀 物种名
ENSMUS Mus musculus (Mouse)  小鼠
ENSRNO Rattus norvegicus (Rat) 大鼠
ENS Homo sapiens (Human) 人类
类型前缀 类型
E exon 外显子
gene  基因
P protein  蛋白
T transcript 转录本

 3、

五、NCBI GEO数据库

1、原始数据

      a、GEO Platform (GPL):含基因注释信息

      b、GEO Sample (GSM):样本信息

      c、GEO Series (GSE)

      d、GSE=GPL+GSA
2、GEO数据库整理后的数据:Data set ,Profile

ID转换方法

1、Uniprot ID mapping:Retrieve/ID mapping (uniprot.org)

2、bioDBnet:bioDBnet – Biological Database Network (ncifcrf.gov)

3、大杀器 Ensembl  BioMart:asia.ensembl.org/biomart/martview/5bbb58d64213b897ec969d0d7bb44d2c

 生信数据库ID总结及转换方法

生信数据库ID总结及转换方法

生信数据库ID总结及转换方法

4、 

R语言

##物种注释包
1  org.Hs.eg.db  Human/hsa
2  org.Mm.eg.db  Mouse /mmu
3  org.Rn.eg.db  Rat/rno
4  org.Ce.eg.db  Worm  
5  org.Cf.eg.db  Canine  
6  org.Dm.eg.db  Fly  
7  org.Dr.eg.db  Zebrafish  
8  org.EcK12.eg.db  E coli strain K12  
9  org.EcSakai.eg.db  E coli strain Sakai  
10  org.Gg.eg.db  Chicken  
11  org.Ag.eg.db  Anopheles  
12  org.At.tair.db  Arabidopsis 
13  org.Mmu.eg.db  Rhesus 
14  org.Pf.plasmo.db  Malaria  
15  org.Pt.eg.db  Chimp  
16  org.Bt.eg.db  Bovine  
17  org.Sc.sgd.db  Yeast  
18  org.Ss.eg.db  Pig  
19  org.Xl.eg.db  Xenopus  

##物种缩写查询:https://www.genome.jp/kegg/catalog/org_list.html
 

 引用来源:
(14条消息) 生信数据库ID大总结-想踏入生信大门的你值得拥有_Candle_light的博客-CSDN博客_生信数据库生信数据库ID总结及转换方法https://blog.csdn.net/Candle_light/article/details/83098835?spm=1001.2101.3001.6650.1&utm_medium=distribute.pc_relevant.none-task-blog-2~default~CTRLIST~Rate-1.pc_relevant_aa&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2~default~CTRLIST~Rate-1.pc_relevant_aa&utm_relevant_index=1

今天的文章生信数据库ID总结及转换方法分享到此就结束了,感谢您的阅读。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:http://bianchenghao.cn/7432.html

(0)
编程小号编程小号

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注