HGNC 数据库-人类基因组数据库「建议收藏」

HGNC 数据库-人类基因组数据库「建议收藏」HGNC全称为HUGOGeneNomenclatureCommittee,叫做HUGO基因命名委员会,负责对人类基因组上包括蛋白编码基因,ncRNA基因,甲基因和其他基因在内的所有基因提供一个唯一的,标准的,可以广泛传播的symbol; 数据库的主页为 http://www.genenames.org/对于每个human的基因来说,在HGNC数据库中会有一个数字标识的唯一ID, …

大家好,欢迎来到IT知识分享网。

HGNC 全称为HUGO Gene Nomenclature Committee, 叫做 HUGO基因命名委员会,负责对人类基因组上包括蛋白编码基因, ncRNA基因,甲基因和其他基因在内的所有基因提供一个唯一的,标准的,可以广泛传播的symbol; 

数据库的主页为 http://www.genenames.org/

对于每个human的基因来说,在HGNC数据库中会有一个数字标识的唯一ID, 也会有一个唯一的symbol,

HCNC数据库提供了免费下载的功能;

HGNC 数据库-人类基因组数据库「建议收藏」

下载对应的链接,命令为

lftp -c "pget -n 20 ftp://ftp.ebi.ac.uk/pub/databases/genenames/new/tsv/hgnc_complete_set.txt"

查看下载内容,可以如下的字段信息,以第一行为例,解释下每个字段的含义:

HGNC 数据库-人类基因组数据库「建议收藏」

后面的其他字段都是对应的其他数据库信息,在分析时,我们经常使用的就是基因的symbol, 对于human 来说, 这个symbol 就是来源于HGNC 数据库

以 “A1BG” 这个symbol 为例, 在NCBI的GENE 数据库中进行检索,结果如下:

https://www.ncbi.nlm.nih.gov/gene/1

HGNC 数据库-人类基因组数据库「建议收藏」

 

可以看到official Symbol 来源于HGNC 数据库,对应的HGNC数据库中的ID为5,其他的信息也能够和HGNC数据库中的进行对应;

对于整个HGNC 数据库来说,和其他数据库的链接也为我们的研究提供了遍历,对于不同类型的基因,提供的参考数据库也不一样;

1)蛋白编码基因

对于蛋白编码基因来说,HGNC提供了其编码的蛋白质在uniprot 数据库中的ID, eg

“A1BG” 编码的蛋白质在uniprot 数据库中的ID 为 P04217;

2) lncRNA 基因

对于lncRNA 基因而言,HCNC 提供了lncRNAdb 中的相关信息, eg

“TP53COR1” 对应的lncRNAdb 数据库中的ID为 “lincRNA-p21”

3)microRNA 基因

对于microRNA 基因而言,HGNC提供了mirbase 数据库中的信息 eg

“MIR1-1″ 对应的mirbase 数据库中的ID为”MI0000651”

上述只是对研究的较多的几种基因给出了相关说明,其实还有很多其他类型的基因,给出的参考信息也是类似的

 

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/24550.html

(0)

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

关注微信