加快打造原始创新策源地,加快突破关键核心技术,努力抢占科技制高点,为把我国建设成为世界科技强国作出新的更大的贡献。

——习近平总书记在致中国科学院建院70周年贺信中作出的“两加快一努力”重要指示要求

面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康,率先实现科学技术跨越发展,率先建成国家创新人才高地,率先建成国家高水平科技智库,率先建设国际一流科研机构。

——中国科学院办院方针

首页 > 科研进展

软件所等提出代码审查意见自动生成新方法

2022-06-22 软件研究所
【字体:

语音播报

  近日,中国科学院软件研究所软件发展研究部智能化软件系统工程团队与中国科学院大学等单位研究人员合作,在代码审查意见自动生成方法研究方面取得进展。该研究提出了基于代码审查标记和预训练模型的代码审查意见自动生成方法,能够高效地对代码片段自动生成有意义的代码审查意见,帮助开发人员提高代码质量,缓解现有软件开发过程中严重依赖少数高水平程序员进行代码审查的难题,为提升软件开发过程中代码审查自动化能力起到重要支撑作用。 

  代码审查是保障软件质量的重要过程,然而在实际软件开发中,该过程往往严重依赖少数高水平程序员才能完成,一方面这可能造成多个软件(如被审查者和审查者正在参与开发的软件)开发过程中断并延迟,另一方面,即使是高水平程序员经验也是有限的,他们需要花费大量的时间进行代码审查,而且并不能保证审查出所有的代码错误或坏味。 

  针对此问题,研究团队提出一种基于代码审查标记和预训练模型的代码审查意见自动生成方法AUGER。他们从多个著名的Java项目中收集实际代码审查数据,通过代码审查标记嵌入技术构建了一个高质量数据集,利用T5预训练模型进行多策略多阶段训练。实验表明,该方法的ROUGE-L值相比于目前最好的方法提升了37.38%,而且整个模型推理过程平均可在20秒内完成。 

  相关成果以AUGER: Automatically Generating Review Comments withPre-training Models为题被软件工程领域学术会议ESEC/FSE 2022录用。该研究获国家重点研发计划、中科院战略性先导科技专项(A)等项目支持。 

 基于代码审查标记和预训练模型的代码审查意见自动生成方法框架

对比实验结果

打印 责任编辑:江澄

扫一扫在手机打开当前页

© 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002

地址:北京市西城区三里河路52号 邮编:100864

电话: 86 10 68597114(总机) 86 10 68597289(总值班室)

编辑部邮箱:casweb@cashq.ac.cn

  • © 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002

    地址:北京市西城区三里河路52号 邮编:100864

    电话: 86 10 68597114(总机) 86 10 68597289(总值班室)

    编辑部邮箱:casweb@cashq.ac.cn

  • © 1996 - 中国科学院 版权所有
    京ICP备05002857号-1
    京公网安备110402500047号
    网站标识码bm48000002

    地址:北京市西城区三里河路52号 邮编:100864
    电话:86 10 68597114(总机)
       86 10 68597289(总值班室)
    编辑部邮箱:casweb@cashq.ac.cn