加快打造原始创新策源地,加快突破关键核心技术,努力抢占科技制高点,为把我国建设成为世界科技强国作出新的更大的贡献。

——习近平总书记在致中国科学院建院70周年贺信中作出的“两加快一努力”重要指示要求

面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康,率先实现科学技术跨越发展,率先建成国家创新人才高地,率先建成国家高水平科技智库,率先建设国际一流科研机构。

——中国科学院办院方针

首页 > 科研进展

北京基因组所开发表观组关联分析数据库

2019-11-01 北京基因组研究所
【字体:

语音播报

  近日,由中国科学院北京基因组研究所国家基因组科学数据中心开发的人类表观组关联分析数据库EWAS Data Hub正式上线。该项研究成果以EWAS Data Hub: a resource of DNA methylation array data and metadata 为题在国际学术期刊《核酸研究》(Nucleic Acids Research)在线发表。

  近年来,表观组关联分析(Epigenome-wide Association StudyEWAS)已成为探索复杂性状表观遗传基础的有效策略。随着大量EWAS科研成果的发表,现已积累了海量表观遗传数据,尤其是DNA甲基化芯片数据,其海量数据的整合分析对系统研究不同实验条件下的DNA甲基化状态以及探索与各种性状相关的表观遗传机制具有重要意义。目前,国际上存在一些数据库来存储DNA甲基化芯片数据,但这些数据库缺乏有效和统一的归一化方法来消除不同数据集之间的批次效应,可能对下游分析产生负面影响,元数据标准不统一,并且都不提供跨不同组织、性别、种族和疾病的标准化的DNA甲基化图谱。为了解决这些问题,国家基因组科学数据中心开发了EWAS Data Hub数据库。

  目前,EWAS Data Hub整合了来自GEOTCGAArrayExpressENCODE数据库的共计75344个样本的DNA甲基化芯片数据和对应的元数据,并采用了有效的归一化方法来消除不同数据集的批次效应。EWAS Data Hub利用海量高质量DNA甲基化数据和标准化元数据的优势,为485512个探针和36397个基因提供了一系列重要的评估值(包括组织特异性、年龄相关性、性别差异和种族特异性)和不同背景下的参考DNA甲基化图谱,涉及81种组织/细胞类型(包含25个脑部和25种血细胞类型),67种疾病(包括39种癌症),不同年龄、性别、种族和BMI。同时,EWAS Data Hub 还提供了高效的查询方式。

  该研究得到国家重点研发计划、中科院战略先导专项、中科院国际大科学计划和中科院十三五信息化专项等的资助。

  论文链接

  数据库链接

打印 责任编辑:叶瑞优

扫一扫在手机打开当前页

© 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002

地址:北京市西城区三里河路52号 邮编:100864

电话: 86 10 68597114(总机) 86 10 68597289(总值班室)

编辑部邮箱:casweb@cashq.ac.cn

  • © 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002

    地址:北京市西城区三里河路52号 邮编:100864

    电话: 86 10 68597114(总机) 86 10 68597289(总值班室)

    编辑部邮箱:casweb@cashq.ac.cn

  • © 1996 - 中国科学院 版权所有
    京ICP备05002857号-1
    京公网安备110402500047号
    网站标识码bm48000002

    地址:北京市西城区三里河路52号 邮编:100864
    电话:86 10 68597114(总机)
       86 10 68597289(总值班室)
    编辑部邮箱:casweb@cashq.ac.cn