AI计算模拟
AI-enriched COMPUTATIONAL SIMULATION
AI计算模拟
以AI、大数据分析及数字化工作流为基础的综合计算模拟解决方案

Human Gene Mutation Database(HGMD)



Human Gene Mutation Database(HGMD)是一个整合了己知和已发表导致人类遗传性疾病基因突变的综合性数据库,能够为医学和临床遗传学人员提供重要的参考信息,在单基因遗传病研究、产前诊断和生殖遗传中广泛使用。截至2022年第二季度发布的版本,HGMD数据库已经收录了超过36万个变异,并且每个季度进行更新。这样庞大且持续更新的数据库由具有12年行业经验的遗传学团队维护。该团队在阅读文献时发现,约20%位点在文章报道中信息不全,需要团队进一步确认。在这20%的位点中,约25%可以通过文章的补充材料确认,但仍然有75%的位点需要专业的团队邮件与作者进行沟通确认,从而保证该位点的准确性。



HGMD作为行业的金标准数据库,除了专业版还为学术研究者提供了公共版。由于高通量测序技术的快速发展,人类突变位点信息的快速积累,公共版已经很难满足临床研究和应用的需求。相比于专业版,公共版每年只进行两次更新(专业版每季度更新),目前只包含约23万个突变,相差约13万个突变的信息。当然除了位点数和更新次数外,功能和信息呈现也具有非常大的差异。HGMD受到诸多医学和临床遗传学家、诊断师、生物信息学家、人类和分子遗传学的研究员和遗传咨询师的青睐,文献引用量逐年上升。



HGMD信息来自业内高质量期刊,由遗传学专家人工阅读,搜集整理与人类遗传疾病有关的基因突变信息,再经过多轮人工质控,最后将这些信息收录并归类到HGMD对应的5种突变类型中。


特点:

  • 全面性的基因突变信息,数据覆盖率广

  • 数据质量高

  • 及时更新数据

  • 极大地节省了研究人员查阅文献的时间和精力,轻松获得全面的详细信息。


主要功能:

  • 简单、快速确认实验得到的某种突变是否已被发现,是否是导致人类遗传疾病的原因。

  • 获得某个特定基因或疾病的致病突变谱

  • 快速查询与人类遗传疾病相关的突变信息的文献

HGMD应用举例


研究变异的临床意义
 
 传统/其他的变体命名方案可能会使变体解读和研究变得困难。例如用户需要查询变异NP_000286.3: p.Ser6Leu,假设使用ClinVar则不能搜索到此名称的条目,其中间接相关的文档如下,也不是直接与p.Ser6Leu变异相关。OMIM中也无所查询的条目,只有Ser-19Leu的结果。
 


 而HGMD提供了HGVS命名法和历史/其他命名法,在搜索中可以立即查到,首行即是目标搜索的变异Ser6Leu。点击后可显示其支持文献。
 


可视化感兴趣等位基因附近的变异
 
 为什么可视化会有帮助呢?可视化界面可以查看基因组的附近序列,查看在同一密码子上的氨基酸变化是确认的DM还是存疑的DM,查看基因3'端附近的移码。帮助确认变体识别和变体描述的准确性。在HGMD的下载版中,用户可下载vcf文件,将其导入igv或UCSC的genome browser中即可可视化。
 

识别与特定表型相关的基因

研究者在研究中往往需要确定哪些基因与某个所研究的表型相关,在HGMD在线版中,用户可以方便地使用Phenotype搜索到与所查询表型相关的所有基因,且这些信息均包含文献证据。


设计NGS panel

以cardiomyopathy(心肌病)为例,在Advanced中(如下),用户可以搜索到与其相关的HGMD条目,导出并纳入自己研究的panel。



HGMD包含丰富的工具,方便临床诊断、个性化基因组学和NGS/生物信息学研究领域的用户使用,可用于搜索和优先排序从突变数据集得出的结果,确定遗传疾病的已知遗传原因,了解基因的突变谱,验证新突变,评估个体疾病风险,缩短与特定遗传疾病相关的文献审阅时间。