加快打造原始创新策源地,加快突破关键核心技术,努力抢占科技制高点,为把我国建设成为世界科技强国作出新的更大的贡献。

——习近平总书记在致中国科学院建院70周年贺信中作出的“两加快一努力”重要指示要求

面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康,率先实现科学技术跨越发展,率先建成国家创新人才高地,率先建成国家高水平科技智库,率先建设国际一流科研机构。

——中国科学院办院方针

首页 > 科研进展

生物物理所发布中国人群可移动元件插入变异图谱

2022-03-02 生物物理研究所
【字体:

语音播报

  可移动元件(转座子、转座元件)约占人类基因组的一半。Alu、LINE-1(L1)、SINE-VNTR-Alu(SVA)以及HERV-K等被普遍认为是仍然活跃的可移动元件家族。它们能够通过转座作用在基因组上形成新的插入,这种现象被称为可移动元件插入(Mobile Element Insertion,MEI)。转座事件可能会打断基因组上的功能区域,破坏正常的基因功能,影响转录本的表达或剪接,进而导致疾病。目前已有超过120种人类遗传疾病被报道与转座子介导的插入相关,例如血友病、丹特病、神经纤维瘤病和癌症。除通过插入产生影响外,可移动元件的内在序列特性赋予一些MEI对宿主的功能影响,使MEI与其他典型的结构变异有了质的区别。MEI整合位点的偏好性是相关研究关注的重点,这些位点分布并不均匀,受到DNA序列和染色质环境等各种因素的影响。

  目前,针对人类基因组中多态性转座元件的整合资源缺乏,而这种资源是表型与变异关联分析的基础。2017年,“千人基因组计划”对2504个基因组中的MEI进行全面分析,鉴定超过20000个多态性的MEI位点。科学家利用“西蒙斯基因组多样性计划”的296个基因组数据分析了MEI在全球人群中的变异特征,拓展了“千人基因组计划”的发现。但这些MEI遗传资源主要来自欧洲人群,即使在目前最大的结构变异研究队列gnomAD-SV中,也只有1304个样本来自东亚地区,针对中国人群的MEI研究和资源较少。

  近日,中国科学院生物物理研究所研究员徐涛团队、何顺民团队合作,在Nucleic Acids Research上发表Characterizing Mobile Element Insertions in 5,675 genomes文章,介绍其关于MEI的最新工作。相关研究在人群水平对MEI的基因组分布、突变特征、功能影响等进行系统分析,构建了一个MEI资源库和针对中国人群的MEI图谱。这是由徐涛、何顺民牵头的“女娲”(NyuWa)中国人群基因组计划的部分工作。

  研究结合来自“女娲”基因组资源的2998个高深度全基因组测序数据和来自“千人基因组计划”的2677个低深度全基因组测序数据对MEI进行系统性鉴定。经过位点质量过滤,共保留36699个非参考MEI(non-reference MEI),包括26553个Alu、7353个L1、2667个SVA和126个HERV-K,平均每个个体都可检测到超过1000个MEI变异,其中绝大多数是Alu元件的插入。

  使用鉴定的MEI数据分析MEI的染色体分布发现,L1插入在着丝粒附近区域有着明显的富集。研究认为,着丝粒DNA附近L1插入变异的富集可能是由于着丝粒附近较多的α卫星序列造成的,相对较低的GC含量更有利于L1的插入。另一方面,考虑到以往研究发现的新着丝粒区域活跃的转座子可能有助于着丝粒的新生,L1在着丝粒区域的富集也可能存在重要的生物学意义。这一发现有待于后续的研究去探明。

  研究对两套数据中MEI的突变率进行了估计:“女娲”数据为1.609×10-11、“千人基因组计划”数据为1.464×10-11,二者结果非常接近,大约每16—17个新生儿中会产生1个新的MEI事件。比较不同人群中MEI的多样性和SNP的杂合度发现,二者表现出很高的相关性,其中非洲人群有着最高的MEI多样性和SNP杂合度。

  理论上蛋白质编码区的MEI可通过打断开放阅读框而导致基因功能丧失。对MEI进行功能注释后发现,每个人平均含有24个会截断蛋白质的MEI。结合短变异(SNP、InDel)与其他结构变异来看,MEI贡献了每个个体中大约9.4%的蛋白质截断变异。这表明在全基因组数据的常规分析中纳入MEI的重要性。

  L1的插入通常伴随着3'转导,即把其原来3'末端下游的序列一起插入到新位点中。根据这一特征,研究对L1的source-offspring关系进行分析,鉴定了一些新的source-offspring关系对,找到一些潜在活跃的L1位点,并发现其在不同人群中分布的差异。

  为方便可移动元件研究人员查询和使用,该研究构建了一个开放数据库HMEID收录此次鉴定的MEI。

  相关工作得到中科院战略性先导科技专项、国家自然科学基金、国家重点研发计划、中科院信息化专项、国家基因组科学数据中心的支持。

  论文链接 

  “女娲”数据库 

打印 责任编辑:程博

扫一扫在手机打开当前页

© 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002

地址:北京市西城区三里河路52号 邮编:100864

电话: 86 10 68597114(总机) 86 10 68597289(总值班室)

编辑部邮箱:casweb@cashq.ac.cn

  • © 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002

    地址:北京市西城区三里河路52号 邮编:100864

    电话: 86 10 68597114(总机) 86 10 68597289(总值班室)

    编辑部邮箱:casweb@cashq.ac.cn

  • © 1996 - 中国科学院 版权所有
    京ICP备05002857号-1
    京公网安备110402500047号
    网站标识码bm48000002

    地址:北京市西城区三里河路52号 邮编:100864
    电话:86 10 68597114(总机)
       86 10 68597289(总值班室)
    编辑部邮箱:casweb@cashq.ac.cn