加快打造原始创新策源地,加快突破关键核心技术,努力抢占科技制高点,为把我国建设成为世界科技强国作出新的更大的贡献。

——习近平总书记在致中国科学院建院70周年贺信中作出的“两加快一努力”重要指示要求

面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康,率先实现科学技术跨越发展,率先建成国家创新人才高地,率先建成国家高水平科技智库,率先建设国际一流科研机构。

——中国科学院办院方针

首页 > 传媒扫描

【中国科学报】新算法可快速选出最优子集

2020-12-25 中国科学报 桂运安
【字体:

语音播报

  中国科学技术大学管理学院教授王学钦团队与美国耶鲁大学公共卫生学院教授张和平合作,针对线性回归模型的基准问题——最优子集选取,提出一种新的快速算法,在有限步内就能得到稳定解。该成果日前发表于美国《国家科学院院刊》。

  发现事物间的关系是大部分科学研究的目的,这在统计学中称为回归分析。其中,线性回归模型具有简洁性和可解释性,成为最有用的科学研究工具之一。最优子集算法泛指多元回归分析中自变量选择时旨在寻找为数不多的、根据指定准则是“最优”回归模型的计算方法。尽管线性回归模型使用广泛,但其中一个基本问题——如何在一组变量中选择最优的子模型,尚未解决。

  得益于现代科技的发展,数据的收集越来越便利。典型的生物医学研究中会收集到上百个变量,常规的全基因组研究中则涉及到成千上万甚至是百万级别的遗传变异。然而,现有的算法难以在上万级别的实际问题中寻找到最优子集。

  为了解决这一问题,王学钦团队利用排序和剪接的思想,结合一个新的信息准则发展出一种新算法,在有限步内就能得到稳定解。同时,他们证明了在一定条件下,依大概率,该算法具有多项式的时间复杂度,而且能够选出最优子集。

  相关论文信息:https://doi.org/10.1073/pnas.2014241117

  (原载于《中国科学报》 2020-12-25 第1版 要闻)
打印 责任编辑:张芳丹

扫一扫在手机打开当前页

© 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002

地址:北京市西城区三里河路52号 邮编:100864

电话: 86 10 68597114(总机) 86 10 68597289(总值班室)

  • © 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002

    地址:北京市西城区三里河路52号 邮编:100864

    电话: 86 10 68597114(总机) 86 10 68597289(总值班室)

  • © 1996 - 中国科学院 版权所有
    京ICP备05002857号-1
    京公网安备110402500047号
    网站标识码bm48000002

    地址:北京市西城区三里河路52号 邮编:100864
    电话:86 10 68597114(总机)
       86 10 68597289(总值班室)